李宏毅ML2021Spring HW3

本文转载自查看原文 2021-08-30 15:40 371 CNN/ PyTorch/ Semi-Supervised/ Machine Learning/Deep Learning

题目描述

代码阐释

注意事项

如果用colab和kaggle的notebook上跑的话，需要删去num_workers=8。否则跑一会就会爆内存。删除去后带来的负面影响是运行时间会显著增加。。。

因为train时间可能有超过6h以上，所以需要保存模型的参数，之后再训练。

medium baseline

直接修改transform compose里面的内容即可。对于这个题目而言，翻转和转换角度是比较合理的。这是一篇介绍data augmented的博客，蛮不错的。

# It is important to do data augmentation in training.
# However, not every augmentation is useful.
# Please think about what kind of augmentation is helpful for food recognition.
train_tfm1 = transforms.Compose([
    # Resize the image into a fixed shape (height = width = 128)
    transforms.Resize((128, 128)),
    # You may add some transforms here.
    # ToTensor() should be the last one of the transforms.
    transforms.ToTensor(),
])

train_tfm2 = transforms.Compose([
    # Resize the image into a fixed shape (height = width = 128)
    transforms.Resize((128, 128)),
    # You may add some transforms here.
    # ToTensor() should be the last one of the transforms.
    transforms.RandomHorizontalFlip(p=1.0),
    transforms.ToTensor(),
])

train_tfm3 = transforms.Compose([
    # Resize the image into a fixed shape (height = width = 128)
    transforms.Resize((128, 128)),
    # You may add some transforms here.
    # ToTensor() should be the last one of the transforms.
    transforms.RandomRotation(30),
    transforms.ToTensor(),
])

# We don't need augmentations in testing and validation.
# All we need here is to resize the PIL image and transform it into Tensor.
test_tfm = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
])

# Batch size for training, validation, and testing.
# A greater batch size usually gives a more stable gradient.
# But the GPU memory is limited, so please adjust it carefully.
batch_size = 128

# Construct datasets.
# The argument "loader" tells how torchvision reads the data.
train_set1 = DatasetFolder("food-11/training/labeled", loader=lambda x: Image.open(x), extensions="jpg", transform=train_tfm1)
train_set2 = DatasetFolder("food-11/training/labeled", loader=lambda x: Image.open(x), extensions="jpg", transform=train_tfm2) 
train_set3 = DatasetFolder("food-11/training/labeled", loader=lambda x: Image.open(x), extensions="jpg", transform=train_tfm3)
train_set = ConcatDataset([train_set1, train_set2, train_set3])
valid_set = DatasetFolder("food-11/validation", loader=lambda x: Image.open(x), extensions="jpg", transform=test_tfm)
unlabeled_set = DatasetFolder("food-11/training/unlabeled", loader=lambda x: Image.open(x), extensions="jpg", transform=train_tfm1)
test_set = DatasetFolder("food-11/testing", loader=lambda x: Image.open(x), extensions="jpg", transform=test_tfm)

# Construct data loaders.
train_loader = DataLoader(train_set, batch_size=batch_size, shuffle=True, pin_memory=True)
valid_loader = DataLoader(valid_set, batch_size=batch_size, shuffle=True, pin_memory=True)
test_loader = DataLoader(test_set, batch_size=batch_size, shuffle=False)

colab跑了2个半小时，同时kaggle分数如下：

hard baseline

~~自己没跑进去~~，推荐一位大佬的https://github.com/1am9trash/Hung_Yi_Lee_ML_2021/blob/main/hw/hw3/hw3_code.ipynb
用了Pre-trained的Rsenet试了一下，发现效果非常好，训练30轮就可以冲进hard baseline.
完整代码放在我的github里面，需要自取

调参心得

https://github.com/lyfer233/deeplearning/blob/main/LiHongYi_ML2021Spring/HW3/炼丹总结和思路.md

参考博客

https://blog.csdn.net/qq_35896136/article/details/106560413

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 李宏毅ML2021Spring HW1 李宏毅机器学习HW3（CNN）李宏毅2020机器学习——食物图像识别（python 0基础开始）（hw3）基于卷积神经网络的面部表情识别(Pytorch实现)----台大李宏毅机器学习作业3(HW3) 李宏毅机器学习HW1（梯度下降） GAN的项目结构（用李宏毅老师的头像生成hw举例） hw-2 李宏毅2022年作业2 phoneme识别单strong-hmm详细解释。 Logistic回归预测收入----台大李宏毅机器学习作业2(HW2) PM2.5预测（李宏毅机器学习hw_1）李宏毅机器学习HW4：句子情感分类