MobileNet v1 背景简介由Google团队于2017年提出,专注于移动端和嵌入式设备。采用Depthwise卷积,大幅减少参数量,虽然效果有一些折扣,但是可以接受。 前置知识DW卷积先来回忆以下常规的卷积是怎样的,如下图所示。 而DW卷积呢,其实就是最符合直觉的那种卷积。就是每个卷积核的深度不是和上一层输出相同,而是等于1。这意味着: 卷积之后不再做跨深度的求和 每一个DW卷积层的#参数必然等于输入tens 2020-09-11 工作技能 神经网络 经典网络 深度学习 神经网络 卷积神经网络 CNN 经典网络 MobileNet DW卷积 PW卷积
流形(manifold)是个啥? 今天看MobileNet v2,其中为了得到“在处理低维度的特征tensor时,Relu激活函数相比于Linear激活函数在激活前后会造成更多的特征丢失”这一推论,使用了流形(manifold)的概念。所以来看看流形到底是个啥: 数学语言的定义是:流形是局部具有欧几里得空间性质的空间,在数学中用于描述几何形体。物理上,经典力学的相空间和构造广义相对论的时空模型的四维伪黎曼流形都是流形的实例。牵扯出 2020-09-10 工作技能 神经网络 流形 manifold
GoogLeNet 背景简介2014年Google团队提出,当年的ImageNet分类任务第一名(第二名是VGG)。其中的Inception结构和辅助分类器的概念很有启发性和创造性。 网络结构整体结构构建起整个网络的building blocks有5种: 常规的卷积层,默认以RELU为激活函数,SAME padding 常规的池化层,包括最大池化和平均池化 Inception单元,共计3层9个,具体结构后面解释 辅 2020-09-03 工作技能 神经网络 经典网络 深度学习 神经网络 卷积神经网络 CNN 经典网络 GoogLeNet Inception结构 辅助分类器
pytorch基础用法-预测 数据准备12345678transform = transforms.Compose( [transforms.Resize((32, 32)), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])im = Image.open('1. 2020-05-11 工作技能 神经网络 pytorch使用 pytorch
pytorch基础用法-训练 数据准备引入数据集12345678910111213141516171819202122232425262728293031323334# 图片在送入网络之前要进行一定的变化才能适应网络入口的要求,比如尺寸一致化,张量化,归一化等data_transform = { "train": transforms.Compose([transforms.Rand 2020-05-11 工作技能 神经网络 pytorch使用 pytorch
pytorch基础用法-模型 搭建一个CNN模型用作图像分类的过程,整体而言还是比较清晰的,主要分为模型、训练、预测三项工作。 第一项工作,模型搭建,套路也很清晰。新建一个继承于nn.Module的类,然后 将网络层一一作为类的成员添加进来。这些网络层可以是Conv2d, MaxPool2d, Linear等torch.nn提供的基本模块,也可以是由这些基本模块组合成的自定义building blocks,如ResNet中的 2020-05-11 工作技能 神经网络 pytorch使用 python pytorch
VGGnet 背景简介牛津VGG团队2014年提出,ImageNet分类任务第二名,定位任务第一名。结构简单,配置丰富,被广泛用作backbone。 网络结构原作有5种配置,分别为11层,13层,16层-1,16层-3,19层。统计层数时不统计池化层和softmax,只统计有weight的网络层。 网络特点 所有的卷积核尺寸一致,均采用3x3。 引入感受野(receptive field)的概念,利用小卷积 2020-04-20 工作技能 神经网络 经典网络 深度学习 神经网络 卷积神经网络 CNN 经典网络 VGGnet 感受野
AlexNet 背景简介Hinton学生Alex之作,2012年的ISLVRC冠军,深度学习方法甩开传统图像算法的开端,GPU训练的开端。 网络结构 原始输入:尺寸为[224, 224, 3]的三通道RGB彩色图像 特征提取层:上图中的第一行,(conv, relu, max_pool)经典三元结构x2 + (conv, relu)经典二元结构x3 + max_pool 分类层:将特征提取层的结果flat 2020-04-10 工作技能 神经网络 经典网络 深度学习 神经网络 卷积神经网络 CNN 经典网络 AlexNet
预测结果评价的量化指标 基本概念二分类情形下的P/N/T/F概念 Positive/Negative:样本空间的原始分类; True/False,预测结果与样本原始属性的偏差情况,即P->P/N->N为T,P->N/N->P为F;因此,T和F需要再细分为: TP:P->P(正类被预测为正类,真正类) TN:N->N(负类被预测为负类,真负类) FP:N->P(负类被预测为正类,假 2020-04-01 工作技能 神经网络 ROC曲线 PR曲线 mAP mmAP recall precision AUC
自定义目标检测数据集 前言目标检测的数据集跟分类数据集不同,不仅仅包含图片和图片的类别信息,还要包括bounding box等一些额外的信息。因此,使用之前建立目录结构 + datasets.ImageFolder()的方法是不行的。 总的来看,自定义目标检测数据集要围绕原始图像、标注文件、入选名单三个要素,完成图像标注和自定义dataset类两项工作。 三个要素 原始图像,统统存放在一个目录下 标注文件,一般为一个x 2020-03-12 工作技能 神经网络 pytorch使用 目标检测 pytorch 数据集