搭建一个CNN模型用作图像分类的过程,整体而言还是比较清晰的,主要分为模型、训练、预测三项工作。
第一项工作,模型搭建,套路也很清晰。新建一个继承于nn.Module
的类,然后
- 将网络层一一作为类的成员添加进来。这些网络层可以是
Conv2d
, MaxPool2d
, Linear
等torch.nn
提供的基本模块,也可以是由这些基本模块组合成的自定义building blocks,如ResNet中的Residual单元,GoogLeNet中的Inception单元等。
- 定义网络层之间的连接关系,也就是
forward
函数的行为。
另外,一种常见的做法是在定义网络层成员的时候,直接使用nn.sequential
函数将多个网络层连接模块(比如一个classifier和一个features),然后在forward
中连接这些模块即可。
BN, Dropout, Relu都可以作为一个网络层存在和连接。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| import torch.nn as nn import torch.nn.functional as F
class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv1 = nn.Conv2d(3, 16, 5) self.pool1 = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(16, 32, 5) self.pool2 = nn.MaxPool2d(2, 2) self.fc1 = nn.Linear(32*5*5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10)
def forward(self, x): x = F.relu(self.conv1(x)) x = self.pool1(x) x = F.relu(self.conv2(x)) x = self.pool2(x) x = x.view(-1, 32*5*5) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x
|