深度学习之PyTorch物体检测实战
目 录内容简介
前言
第1篇 物体检测基础知识
第1章 浅谈物体检测与PyTorch2
1.1 深度学习与计算机视觉2
1.1.1 发展历史2
1.1.2 计算机视觉7
1.2 物体检测技术9
1.2.1 发展历程10
1.2.2 技术应用领域11
1.2.3 评价指标12
1.3 PyTorch简介17
1.3.1 诞生与特点17
1.3.2 各大深度学习框架对比17
1.3.3 为什么选择PyTorch19
1.3.4 安装方法20
1.4 基础知识准备22
1.4.1 Linux基础22
1.4.2 Python基础24
1.4.3 高效开发工具29
1.5 总结36
第2章 PyTorch基础37
2.1 基本数据:Tensor37
2.1.1 Tensor数据类型37
2.1.2 Tensor的创建与维度查看39
2.1.3 Tensor的组合与分块41
2.1.4 Tensor的索引与变形42
2.1.5 Tensor的排序与取极值46
2.1.6 Tensor的自动广播机制与向量化46
2.1.7 Tensor的内存共享47
2.2 Autograd与计算图48
2.2.1 Tensor的自动求导:Autograd49
2.2.2 计算图50
2.2.3 Autograd注意事项51
2.3 神经网络工具箱torch.nn52
2.3.1 nn.Module类52
2.3.2 损失函数55
2.3.3 优化器nn.optim56
2.4 模型处理59
2.4.1 网络模型库:torchvision.models59
2.4.2 加载预训练模型60
2.4.3 模型保存61
2.5 数据处理61
2.5.1 主流公开数据集61
2.5.2 数据加载63
2.5.3 GPU加速65
2.5.4 数据可视化66
2.6 总结68
第3章 网络骨架:Backbone69
3.1 神经网络基本组成69
3.1.1 卷积层70
3.1.2 激活函数层72
3.1.3 池化层75
3.1.4 Dropout层76
3.1.5 BN层77
3.1.6 全连接层79
3.1.7 深入理解感受野81
3.1.8 详解空洞卷积(Dilated Convolution)82
3.2 走向深度:VGGNet83
3.3 纵横交错:Inception87
3.4 里程碑:ResNet93
3.5 继往开来:DenseNet95
3.6 特征金字塔:FPN99
3.7 为检测而生:DetNet106
3.8 总结110
第2篇 物体检测经典框架
第4章 两阶经典检测器:Faster RCNN112
4.1 RCNN系列发展历程112
4.1.1 开山之作:RCNN112
4.1.2 端到端:Fast RCNN113
4.1.3 走向实时:Faster RCNN114
4.2 准备工作114
4.3 Faster RCNN总览115
4.4 详解RPN117
4.4.1 理解Anchor117
4.4.2 RPN的真值与预测量119
4.4.3 RPN卷积网络120
4.4.4 RPN真值的求取122
4.4.5 损失函数设计124
4.4.6 NMS与生成Proposal125
4.4.7 筛选Proposal得到RoI126
4.5 RoI Pooling层127
4.6 全连接RCNN模块130
4.6.1 RCNN全连接网络130
4.6.2 损失函数设计131
4.7 Faster RCNN的改进算法131
4.7.1 审视Faster RCNN132
4.7.2 特征融合:HyperNet133
4.7.3 实例分割:Mask RCNN134
4.7.4 全卷积网络:R-FCN137
4.7.5 级联网络:Cascade RCNN139
4.8 总结141
第5章 单阶多层检测器:SSD142
5.1 SSD总览142
5.1.1 SSD的算法流程142
5.1.2 代码准备工作143
5.2 数据预处理144
5.2.1 加载PASCAL数据集144
5.2.2 数据增强144
5.3 网络架构148
5.3.1 基础VGG结构148
5.3.2 深度卷积层149
5.3.3 PriorBox与边框特征提取网络150
5.3.4 总体网络计算过程153
5.4 匹配与损失求解154
5.4.1 预选框与真实框的匹配154
5.4.2 定位损失的计算155
5.4.3 难样本挖掘156
5.4.4 类别损失计算156
5.5 SSD的改进算法157
5.5.1 审视SSD157
5.5.2 特征融合:DSSD158
5.5.3 彩虹网络:RSSD160
5.5.4 基于SSD的两阶:RefineDet162
5.5.5 多感受野融合:RFBNet165
5.6 总结166
第6章 单阶经典检测器:YOLO167
6.1 无锚框预测:YOLO v1167
6.1.1 网络结构167
6.1.2 特征图的意义168
6.1.3 损失计算169
6.2 依赖锚框:YOLO v2171
6.2.1 网络结构的改善171
6.2.2 先验框的设计173
6.2.3 正、负样本与损失函数175
6.2.4 正、负样本选取代码示例176
6.2.5 工程技巧179
6.3 多尺度与特征融合:YOLO v3180
6.3.1 新网络结构DarkNet-53180
6.3.2 多尺度预测181
6.3.3 Softmax改为Logistic182
6.4 总结183
第3篇 物体检测的难点与发展
第7章 模型加速之轻量化网络186
7.1 压缩再扩展:SqueezeNet188
7.1.1 SqueezeNet网络结构188
7.1.2 SqueezeNet总结190
7.2 深度可分离:MobileNet191
7.2.1 标准卷积191
7.2.2 深度可分离卷积192
7.2.3 MobileNet v1结构193
7.2.4 MobileNet v1总结198
7.2.5 MobileNet v2198
7.3 通道混洗:ShuffleNet200
7.3.1 通道混洗201
7.3.2 网络结构202
7.3.3 ShuffleNet v2205
7.4 总结207
第8章 物体检测细节处理209
8.1 非极大值抑制:NMS209
8.1.1 NMS基本过程210
8.1.2 抑制得分:Soft NMS212
8.1.3 加权平均:Softer NMS213
8.1.4 定位置信度:IoU-Net215
8.2 样本不均衡问题217
8.2.1 不均衡问题分析217
8.2.2 在线难样本挖掘:OHEM219
8.2.3 专注难样本:Focal Loss221
8.3 模型过拟合224
8.3.1 数据增强226
8.3.2 L1与L2正则化227
8.4 总结229
第9章 物体检测难点230
9.1 多尺度检测230
9.1.1 多尺度问题230
9.1.2 降低下采样率与空洞卷积232
9.1.3 Anchor设计233
9.1.4 多尺度训练235
9.1.5 特征融合235
9.1.6 尺度归一化:SNIP236
9.1.7 三叉戟:TridentNet238
9.2 拥挤与遮挡239
9.2.1 遮挡背景240
9.2.2 排斥损失:Repulsion Loss242
9.2.3 OR-CNN244
9.3 总结247
第10章 物体检测的未来发展248
10.1 重新思考物体检测248
10.1.1 精度与速度的权衡249
10.1.2 卷积网络的可解释性与稳定性249
10.1.3 训练:微调还是随机初始化250
10.1.4 考虑物体间关系的检测251
10.1.5 优化卷积方式252
10.1.6 神经架构搜索:NAS253
10.1.7 与产业结合的创新255
10.2 摆脱锚框:Anchor-Free257
10.2.1 重新思考Anchor257
10.2.2 基于角点的检测:CornerNet258
10.2.3 检测中心点:CenterNet262
10.2.4 锚框自学习:Guided Anchoring264
10.3 总结266
第1篇 物体检测基础知识
第1章 浅谈物体检测与PyTorch2
1.1 深度学习与计算机视觉2
1.1.1 发展历史2
1.1.2 计算机视觉7
1.2 物体检测技术9
1.2.1 发展历程10
1.2.2 技术应用领域11
1.2.3 评价指标12
1.3 PyTorch简介17
1.3.1 诞生与特点17
1.3.2 各大深度学习框架对比17
1.3.3 为什么选择PyTorch19
1.3.4 安装方法20
1.4 基础知识准备22
1.4.1 Linux基础22
1.4.2 Python基础24
1.4.3 高效开发工具29
1.5 总结36
第2章 PyTorch基础37
2.1 基本数据:Tensor37
2.1.1 Tensor数据类型37
2.1.2 Tensor的创建与维度查看39
2.1.3 Tensor的组合与分块41
2.1.4 Tensor的索引与变形42
2.1.5 Tensor的排序与取极值46
2.1.6 Tensor的自动广播机制与向量化46
2.1.7 Tensor的内存共享47
2.2 Autograd与计算图48
2.2.1 Tensor的自动求导:Autograd49
2.2.2 计算图50
2.2.3 Autograd注意事项51
2.3 神经网络工具箱torch.nn52
2.3.1 nn.Module类52
2.3.2 损失函数55
2.3.3 优化器nn.optim56
2.4 模型处理59
2.4.1 网络模型库:torchvision.models59
2.4.2 加载预训练模型60
2.4.3 模型保存61
2.5 数据处理61
2.5.1 主流公开数据集61
2.5.2 数据加载63
2.5.3 GPU加速65
2.5.4 数据可视化66
2.6 总结68
第3章 网络骨架:Backbone69
3.1 神经网络基本组成69
3.1.1 卷积层70
3.1.2 激活函数层72
3.1.3 池化层75
3.1.4 Dropout层76
3.1.5 BN层77
3.1.6 全连接层79
3.1.7 深入理解感受野81
3.1.8 详解空洞卷积(Dilated Convolution)82
3.2 走向深度:VGGNet83
3.3 纵横交错:Inception87
3.4 里程碑:ResNet93
3.5 继往开来:DenseNet95
3.6 特征金字塔:FPN99
3.7 为检测而生:DetNet106
3.8 总结110
第2篇 物体检测经典框架
第4章 两阶经典检测器:Faster RCNN112
4.1 RCNN系列发展历程112
4.1.1 开山之作:RCNN112
4.1.2 端到端:Fast RCNN113
4.1.3 走向实时:Faster RCNN114
4.2 准备工作114
4.3 Faster RCNN总览115
4.4 详解RPN117
4.4.1 理解Anchor117
4.4.2 RPN的真值与预测量119
4.4.3 RPN卷积网络120
4.4.4 RPN真值的求取122
4.4.5 损失函数设计124
4.4.6 NMS与生成Proposal125
4.4.7 筛选Proposal得到RoI126
4.5 RoI Pooling层127
4.6 全连接RCNN模块130
4.6.1 RCNN全连接网络130
4.6.2 损失函数设计131
4.7 Faster RCNN的改进算法131
4.7.1 审视Faster RCNN132
4.7.2 特征融合:HyperNet133
4.7.3 实例分割:Mask RCNN134
4.7.4 全卷积网络:R-FCN137
4.7.5 级联网络:Cascade RCNN139
4.8 总结141
第5章 单阶多层检测器:SSD142
5.1 SSD总览142
5.1.1 SSD的算法流程142
5.1.2 代码准备工作143
5.2 数据预处理144
5.2.1 加载PASCAL数据集144
5.2.2 数据增强144
5.3 网络架构148
5.3.1 基础VGG结构148
5.3.2 深度卷积层149
5.3.3 PriorBox与边框特征提取网络150
5.3.4 总体网络计算过程153
5.4 匹配与损失求解154
5.4.1 预选框与真实框的匹配154
5.4.2 定位损失的计算155
5.4.3 难样本挖掘156
5.4.4 类别损失计算156
5.5 SSD的改进算法157
5.5.1 审视SSD157
5.5.2 特征融合:DSSD158
5.5.3 彩虹网络:RSSD160
5.5.4 基于SSD的两阶:RefineDet162
5.5.5 多感受野融合:RFBNet165
5.6 总结166
第6章 单阶经典检测器:YOLO167
6.1 无锚框预测:YOLO v1167
6.1.1 网络结构167
6.1.2 特征图的意义168
6.1.3 损失计算169
6.2 依赖锚框:YOLO v2171
6.2.1 网络结构的改善171
6.2.2 先验框的设计173
6.2.3 正、负样本与损失函数175
6.2.4 正、负样本选取代码示例176
6.2.5 工程技巧179
6.3 多尺度与特征融合:YOLO v3180
6.3.1 新网络结构DarkNet-53180
6.3.2 多尺度预测181
6.3.3 Softmax改为Logistic182
6.4 总结183
第3篇 物体检测的难点与发展
第7章 模型加速之轻量化网络186
7.1 压缩再扩展:SqueezeNet188
7.1.1 SqueezeNet网络结构188
7.1.2 SqueezeNet总结190
7.2 深度可分离:MobileNet191
7.2.1 标准卷积191
7.2.2 深度可分离卷积192
7.2.3 MobileNet v1结构193
7.2.4 MobileNet v1总结198
7.2.5 MobileNet v2198
7.3 通道混洗:ShuffleNet200
7.3.1 通道混洗201
7.3.2 网络结构202
7.3.3 ShuffleNet v2205
7.4 总结207
第8章 物体检测细节处理209
8.1 非极大值抑制:NMS209
8.1.1 NMS基本过程210
8.1.2 抑制得分:Soft NMS212
8.1.3 加权平均:Softer NMS213
8.1.4 定位置信度:IoU-Net215
8.2 样本不均衡问题217
8.2.1 不均衡问题分析217
8.2.2 在线难样本挖掘:OHEM219
8.2.3 专注难样本:Focal Loss221
8.3 模型过拟合224
8.3.1 数据增强226
8.3.2 L1与L2正则化227
8.4 总结229
第9章 物体检测难点230
9.1 多尺度检测230
9.1.1 多尺度问题230
9.1.2 降低下采样率与空洞卷积232
9.1.3 Anchor设计233
9.1.4 多尺度训练235
9.1.5 特征融合235
9.1.6 尺度归一化:SNIP236
9.1.7 三叉戟:TridentNet238
9.2 拥挤与遮挡239
9.2.1 遮挡背景240
9.2.2 排斥损失:Repulsion Loss242
9.2.3 OR-CNN244
9.3 总结247
第10章 物体检测的未来发展248
10.1 重新思考物体检测248
10.1.1 精度与速度的权衡249
10.1.2 卷积网络的可解释性与稳定性249
10.1.3 训练:微调还是随机初始化250
10.1.4 考虑物体间关系的检测251
10.1.5 优化卷积方式252
10.1.6 神经架构搜索:NAS253
10.1.7 与产业结合的创新255
10.2 摆脱锚框:Anchor-Free257
10.2.1 重新思考Anchor257
10.2.2 基于角点的检测:CornerNet258
10.2.3 检测中心点:CenterNet262
10.2.4 锚框自学习:Guided Anchoring264
10.3 总结266
目 录内容简介
本书从物体检测的概念、发展、经典实现方法等几个方面系统地介绍了物体检测的相关知识,重点介绍了Faster RCNN、SDD和YOLO这三个经典的检测器,并利用PyTorch框架从代码角度进行了细致讲解。另外,本书进一步介绍了物体检测的轻量化网络、细节处理、难点问题及未来的发展趋势,从实战角度给出了多种的解决方法,便于读者更深入地掌握物体检测技术,从而做到在实际项目中灵活应用。
本书共10章,涵盖的主要内容有物体检测与PyTorch框架基础概念与背景;PyTorch基础知识;基础卷积网络Backbone;两阶经典检测器Faster RCNN;单阶多层检测器SSD;单阶经典检测器YOLO;模型加速之轻量化网络;物体检测细节处理;物体检测难点问题;物体检测的未来发展。本书适合PyTorch框架爱好者和物体检测相关从业人员阅读,也适合深度学习和计算机视觉领域的研究人员阅读。
本书共10章,涵盖的主要内容有物体检测与PyTorch框架基础概念与背景;PyTorch基础知识;基础卷积网络Backbone;两阶经典检测器Faster RCNN;单阶多层检测器SSD;单阶经典检测器YOLO;模型加速之轻量化网络;物体检测细节处理;物体检测难点问题;物体检测的未来发展。本书适合PyTorch框架爱好者和物体检测相关从业人员阅读,也适合深度学习和计算机视觉领域的研究人员阅读。
比价列表
1人想要
公众号、微信群
缺书网
微信公众号
微信公众号
扫码进群
实时获取购书优惠
实时获取购书优惠