PyTorch學習-總結篇(3)——最實用部分


PyTorch學習-總結篇(3)——最實用部分

經過(1)和(2)的學習,相信對基礎知識有一定的了解,其實如果想快速進行代碼書寫與項目調試及運行,僅看(3)應該可以讓你快速掌握項目的編寫規則。

一、每個項目代碼應該有五個部分(大同小異)

  • 首先,一個項目的代碼應該是導包及定義我們的超參數

  • 然后,將本次項目所需數據集讀入,一般包括訓練集和測試集兩個部分

  • 其次,開始搭建我們的網絡模型主體框架

  • 再然后,是進行模型的損失函數、優化器及可視化操作

  • 最后,是進行我們模型的訓練及測試

二、以一個項目示例來進行講解(MNIST手寫數據集)

1.導包及定義超參數(這步往往是最后才能完成的,因為只有寫完了下面,才能知道你要定義什么及用什么包)

# -*- coding: utf-8 -*-
# -代碼界的小菜鳥-

import os
import torch
import torch.untils.data as Data
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from tensorboardX import SummaryWriter
from torchvision import datasets,transforms

batch_size = 64
epochs = 10
checkpoints_dir = './checkpoints'
event_dir = './event_file'
model_name = None  # 如果需要加載模型繼續訓練,則’/10.pth‘
lr = 1e-4

#檢測GPU是否可以使用
print('GPU是否可用:', torch.cuda.is_available())  # 可用為True
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

2.數據集讀入

# 實例化數據集Dataset
train_dataset = datasets.MNIST(root='./dataset/', train=True, download=True,transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))]))
test_dataset = datasets.MNIST(root='./dataset/', train=False, transform=transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))]))

# 數據加載器
train_loader = Data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)  # shuffle是否隨機打亂順序
test_loader = Data.DataLoader(test_dataset, batch_size=batch_size, shuffle=True)

# 保存檢查點的地址
if not os.path.exists(checkpoints_dir):
   os.makedirs(checkpoints_dir)

3.模型的搭建

# 模型搭建(pytorch框架定義的的神經網絡模型都需要繼承nn.Module類)
class Net(nn.Module):

  # 初始化函數,定義了該神經網絡的基本結構
  def __init__(self):
      super(Net, self).__init__()  # 復制並使用Net的父類的初始化方法,即先運行nn.Module的初始化函數
      self.conv1 = nn.Conv2d(in_channels=1, out_channels=20, kernel_size=5, stride=1)  # 輸入為圖像(1),即灰度圖,輸出為20張特征圖,卷積和為5*5的正方形
      self.conv2 = nn.Conv2d(in_channels=20, out_channels=20, kernel_size=5, stride=1)
      self.fc1 = nn.Linear(in_features=4*4*20, out_features=300)  # 定義全連接線性函數:y=Wx+b,並將4*4*20個節點連接到300個節點上
      self.fc2 = nn.Linear(in_features=300, out_features=10)

  # 定義神經網絡的前向傳播函數
  def forward(self, x):
      x = F.relu(self.conv1(x))  # 輸入x經過卷積conv1后,再經過一個激活函數更新x
      x = F.max_pool2d(x, kernel_size=2, stride=2)  # 經過激活函數后,使用2*2的窗口進行最大池化,更新x
      x = F.relu(self.conv2(x))
      x = F.max_pool2d(x, 2, 2)
      x = x.view(-1, 4 * 4 * 20)  # 利用view函數將張量x變成一維向量的形式,總特征個數不變
      x = F.relu(self.fc1(x))  # 更新后的x經過全連接函數,再經過激活函數,更新x
      x = self.fc2(x)
      return x
 
# 模型實例化
model = Net().to(device)

4.損失函數、優化器、可視化及繼續訓練

# 定義損失函數
criterion = nn.CrossEntropyLoss()  # 交叉熵損失函數

# 定義優化器
optimzer = optim.SGD(model.parameters(), lr=lr)

# 可視化處理
writer = SummaryWriter(event_dir)

# 繼續訓練
start_epoch = 0
if model_name:
   print('加載模型:',checkpoints_dir + model_name)
   checkpoint = torch.load(checkpoints_dir + model_name)
   model.load_state_dict(checkpoint['model_state_dict'])
   optimzer.load_state_dict(checkpoint['optimizer_state_dict'])
   start_epoch = checkpoint['epoch']

5.模型的訓練

# 開始訓練
for epoch in range(start_epoch, epochs):
   model.train()  # 模型訓練的標志
   for batch_idx, (data, target) in enumerate(train_loader):
       data = data.to(device)  # 訓練數據,放到GPU上
       target = target.to(device)  # 訓練標簽,放到GPU上

       # 前向傳播
       output = model(data)
       loss = criterion(output, target)  # 計算損失函數

       # 反向傳播
       optimzer.zero_grad()  # 首先進行梯度清零
       loss.backward()  # 反向傳播
       optimzer.step()  # 更新參數

   print('Train Epoch: {} \tLoss:{{:,6f}}'.format(epoch+1, loss.item()))

   # 可視化
   writer.add_scalar(tag='train_loss', scalar_value=loss.item(), global_step=epoch + 1)
   writer.flush()


   model.eval()  # 模型測試的標志
   test_loss = 0
   correct = 0

   with torch.no_grad():
       for data, target in test_loader:
           data, target = data.to(device), target.to(device)

           output = model(data)
           pred = output.argmax(dim=1, keepdim=True)  # 獲取最大的對數概率的索引
           correct += pred.eq(target.view_as(pred)).sum().item()
           test_loss += criterion(output, target).item()

   test_loss /= len(test_loader.dataset)
   print('測試集:損失:{:.4f},精度:{:.2f}%'.format(test_loss, 100. * correct / len(test_loader.dataset)))

   # 可視化
   writer.add_scalar(tag='val_loss', scalar_value=test_loss, global_step=epoch + 1)
   writer.flush()


   # 保存模型
   if (epoch + 1) % 10 ==0:
       checkpoint = {'model_state_dict':model.state_dict(), 'optimizer_state_dict': optimzer.state_dict(), 'epoch': epoch + 1}
       torch.save(checkpoint, '%s/%d.pth' % (checkpoints_dir, epochs))
       
#結果顯示
GPU是否可用: True
Train Epoch: 1 Loss:2.264611
測試集:損失:0.0358,精度:20.98%
Train Epoch: 2 Loss:2.253827
測試集:損失:0.0354,精度:28.34%
Train Epoch: 3 Loss:2.217229
測試集:損失:0.0349,精度:39.88%
Train Epoch: 4 Loss:2.233548
測試集:損失:0.0343,精度:50.97%
Train Epoch: 5 Loss:2.144451
測試集:損失:0.0335,精度:58.34%
Train Epoch: 6 Loss:2.111312
測試集:損失:0.0325,精度:64.29%
Train Epoch: 7 Loss:1.988998
測試集:損失:0.0310,精度:68.26%
Train Epoch: 8 Loss:1.837759
測試集:損失:0.0290,精度:71.13%
Train Epoch: 9 Loss:1.635040
測試集:損失:0.0264,精度:72.52%
Train Epoch: 10 Loss:1.344689
測試集:損失:0.0232,精度:75.39%

可視化步驟:

1.打開event_file文件夾,在當前文件夾打開cmd,然后輸入tensorboard --logdir "./",就可以看到:

2.打開瀏覽器在 瀏覽器中輸入https://localhost:6006/ 即可顯示 :

 

torch.utils.data


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM