数字图像目标检测与识别―理论与实践
目 录
第1章 引言
1.1 计算机视觉的一个例子
1.2 全书内容概览
参考文献
第2章 计算机视觉中的张量方法
2.1 摘要
2.2 张量――一个数学对象
2.2.1 线性空间的主要属性
2.2.2 张量的概念
查看完整
第1章 引言
1.1 计算机视觉的一个例子
1.2 全书内容概览
参考文献
第2章 计算机视觉中的张量方法
2.1 摘要
2.2 张量――一个数学对象
2.2.1 线性空间的主要属性
2.2.2 张量的概念
查看完整
Bogus?aw Cyganek博士:波兰AGH科技大学电子学系研究员及讲师,IEEE, IAPR和 SIAM会员。他的研究兴趣包括计算机视觉、模式识别以及可编程设备和嵌入式系统。他在各种期刊和学术会议单独或与他人合作发表论文90余篇,共出版著作4种。 Bogus?aw Cyganek博士:波兰AGH科技大学电子学系研究员及讲师,IEEE, IAPR和 SIAM会员。他的研究兴趣包括计算机视觉、模式识别以及可编程设备和嵌入式系统。他在各种期刊和学术会议单独或与他人合作发表论文90余篇,共出版著作4种。
计算机视觉和机器模式识别是当前热门的研究领域, 目标检测和识别是其中的关键技术。本书以作者自身丰富的项目实践经验为基础, 提供了一些优选的目标检测和识别方法, 特别是基于统计和基于张量的目标检测与识别方法。本书力求理论与实践密切结合, 不仅以简洁明了的方式提供了这些方法的理论综述和必要的数学背景, 还提供了以C++编程语言为平台的可用于指导或直接移植的实现代码, 读者可基于文中及网站给出的代码开发自己工作中所需的方法。本书的实践领域主要涉及汽车应用, 包括用于路标识别或驾驶监控的视觉系统。
目 录
第1章 引言
1.1 计算机视觉的一个例子
1.2 全书内容概览
参考文献
第2章 计算机视觉中的张量方法
2.1 摘要
2.2 张量――一个数学对象
2.2.1 线性空间的主要属性
2.2.2 张量的概念
2.3 张量――数据对象
2.4 张量的基本属性
2.4.1 张量指标和分量的符号
2.4.2 张量积
2.5 张量距离测量
2.5.1 张量距离概述
2.5.2 欧几里得图像距离和标准化变换
2.6 张量场的滤波
2.6.1 张量数据的顺序统计滤波
2.6.2 各向异性扩散滤波
2.6.3 扩散过程的实现
2.7 采用结构张量观察图像
2.7.1 二维图像空间中的结构张量
2.7.2 空时结构张量
2.7.3 多通道和尺度空间结构张量
2.7.4 扩展结构张量
2.8 采用惯性张量和矩的目标表示
2.9 张量的特征分解和表示
2.10张量不变量
2.11多视点几何: 多焦点张量
2.12多线性张量方法
2.12.1 多线性代数的基本概念
2.12.2 高阶奇异值分解(HOSVD)
2.12.3 HOSVD的计算
2.12.4 HOSVD诱导基
2.12.5 张量最佳秩1近似
2.12.6 张量的秩1分解
2.12.7 最佳秩(R1, R2, …, RP)近似
2.12.8 最佳秩(R1, R2,…, RP)近似的计算
2.12.9 子空间数据表示
2.12.10非负矩阵因子分解
2.12.11非负矩阵因子分解的计算
2.12.12采用NMF的图像表示
2.12.13非负矩阵因子分解的实现
2.12.14非负张量因子分解
2.12.15目标识别的多线性方法
2.13结束语
2.13.1 本章小结
2.13.2 延伸阅读
习题
参考文献
第3章 分类方法和算法
3.1 摘要
3.2 分类框架
3.3 用于目标识别的子空间方法
3.3.1 主成分分析
3.3.2 子空间模式分类
3.4 目标识别的统计公式
3.4.1 参数化和非参数化方法
3.4.2 概率框架
3.4.3 贝叶斯决策规则
3.4.4 最大后验分类方案
3.4.5 二元分类问题
3.5 参数化方法――混合高斯
3.6 卡尔曼滤波器
3.7 非参数化方法
3.7.1 基于直方图的技术
3.7.2 比较直方图
3.7.3 多维直方图的实现
3.7.4 Parzen方法
3.8 均值移位方法
3.8.1 均值移位简介
3.8.2 连续自适应均值移位方法
3.8.3 均值移位跟踪的算法方面
3.8.4 CamShift方法的实现
3.9 神经网络
3.9.1 概率神经网络
3.9.2 概率神经网络的实现
3.9.3 汉明神经网络
3.9.4 汉明神经网络的实现
3.9.5 形态神经网络
3.10视觉模式识别中的核
3.10.1 核函数
3.10.2 核的实现
3.11数据聚类
3.11.1 k均值方法
3.11.2 模糊c均值
3.11.3 核模糊c均值
3.11.4 聚类质量的测量
3.11.5 实现问题
3.12支持向量域描述
3.12.1 支持向量机的实现
3.12.2 一类分类器集成的体系结构
3.13本章附录――用于模式分类的MATLAB和其他软件包
3.14结束语
3.14.1 本章小结
3.14.2 延伸阅读
习题
参考文献
第4章 目标检测和跟踪
4.1 简介
4.2 直接像素分类
4.2.1 基准数据采集
4.2.2 实例研究――人类皮肤检测
4.2.3 实例研究――基于像素的路标检测
4.2.4 采用分类器集成的基于像素的图像分割
4.3 基本形状检测
4.3.1 线段的检测
4.3.2 凸形状的UpWrite检测
4.4 图形检测
4.4.1 从特征点进行的规则形状检测
4.4.2 显著点的聚类
4.4.3 自适应窗生长方法
4.4.4 图形验证
4.4.5 实例研究――路标检测系统
4.5 实例研究――路标跟踪和识别
4.6 实例研究――用于目标跟踪的框架
4.7 行人检测
4.8 结束语
4.8.1 本章小结
4.8.2 延伸阅读
习题
参考文献
第5章 目标识别
5.1 摘要
5.2 从张量相位直方图和形态尺度空间进行的识别
5.2.1 在形态尺度中张量相位直方图的计算
5.2.2 张量相位直方图的匹配
5.2.3 实例研究――在形态尺度空间中采用张量相位直方图进行的目标识别
5.3 基于不变量的识别
5.3.1 实例研究――采用仿射不变矩的象形图识别
5.4 基于模板的识别
5.4.1 用于路标识别的模板匹配
5.4.2 用于模板匹配的专用距离
5.4.3 采用对数极坐标和尺度空间进行的识别
5.5 从可变形模型进行的识别
5.6 分类器集成
5.7 实例研究――用于从变形原型中进行路标识别的分类器集成
5.7.1 路标识别系统的体系结构
5.7.2 用于警告标志识别的模块
5.7.3 仲裁单元
5.8 基于张量分解的识别
5.8.1 在由模式张量HOSVD分解所张成的子空间中进行的模式识别
5.8.2 实例研究――基于采用可变形模式原型的张量分解的路标识别系统
5.8.3 实例研究――采用张量分解方法进行的手写数字识别
5.8.4 张量子空间分类器的实现
5.9 用于驾驶员状态监控的人眼识别
5.10目标分类识别
5.10.1 基于部分的目标识别
5.10.2 采用视觉词袋的识别
5.11结束语
5.11.1 本章小结
5.11.2 延伸阅读
习题
参考文献
附录A
^ 收 起
第1章 引言
1.1 计算机视觉的一个例子
1.2 全书内容概览
参考文献
第2章 计算机视觉中的张量方法
2.1 摘要
2.2 张量――一个数学对象
2.2.1 线性空间的主要属性
2.2.2 张量的概念
2.3 张量――数据对象
2.4 张量的基本属性
2.4.1 张量指标和分量的符号
2.4.2 张量积
2.5 张量距离测量
2.5.1 张量距离概述
2.5.2 欧几里得图像距离和标准化变换
2.6 张量场的滤波
2.6.1 张量数据的顺序统计滤波
2.6.2 各向异性扩散滤波
2.6.3 扩散过程的实现
2.7 采用结构张量观察图像
2.7.1 二维图像空间中的结构张量
2.7.2 空时结构张量
2.7.3 多通道和尺度空间结构张量
2.7.4 扩展结构张量
2.8 采用惯性张量和矩的目标表示
2.9 张量的特征分解和表示
2.10张量不变量
2.11多视点几何: 多焦点张量
2.12多线性张量方法
2.12.1 多线性代数的基本概念
2.12.2 高阶奇异值分解(HOSVD)
2.12.3 HOSVD的计算
2.12.4 HOSVD诱导基
2.12.5 张量最佳秩1近似
2.12.6 张量的秩1分解
2.12.7 最佳秩(R1, R2, …, RP)近似
2.12.8 最佳秩(R1, R2,…, RP)近似的计算
2.12.9 子空间数据表示
2.12.10非负矩阵因子分解
2.12.11非负矩阵因子分解的计算
2.12.12采用NMF的图像表示
2.12.13非负矩阵因子分解的实现
2.12.14非负张量因子分解
2.12.15目标识别的多线性方法
2.13结束语
2.13.1 本章小结
2.13.2 延伸阅读
习题
参考文献
第3章 分类方法和算法
3.1 摘要
3.2 分类框架
3.3 用于目标识别的子空间方法
3.3.1 主成分分析
3.3.2 子空间模式分类
3.4 目标识别的统计公式
3.4.1 参数化和非参数化方法
3.4.2 概率框架
3.4.3 贝叶斯决策规则
3.4.4 最大后验分类方案
3.4.5 二元分类问题
3.5 参数化方法――混合高斯
3.6 卡尔曼滤波器
3.7 非参数化方法
3.7.1 基于直方图的技术
3.7.2 比较直方图
3.7.3 多维直方图的实现
3.7.4 Parzen方法
3.8 均值移位方法
3.8.1 均值移位简介
3.8.2 连续自适应均值移位方法
3.8.3 均值移位跟踪的算法方面
3.8.4 CamShift方法的实现
3.9 神经网络
3.9.1 概率神经网络
3.9.2 概率神经网络的实现
3.9.3 汉明神经网络
3.9.4 汉明神经网络的实现
3.9.5 形态神经网络
3.10视觉模式识别中的核
3.10.1 核函数
3.10.2 核的实现
3.11数据聚类
3.11.1 k均值方法
3.11.2 模糊c均值
3.11.3 核模糊c均值
3.11.4 聚类质量的测量
3.11.5 实现问题
3.12支持向量域描述
3.12.1 支持向量机的实现
3.12.2 一类分类器集成的体系结构
3.13本章附录――用于模式分类的MATLAB和其他软件包
3.14结束语
3.14.1 本章小结
3.14.2 延伸阅读
习题
参考文献
第4章 目标检测和跟踪
4.1 简介
4.2 直接像素分类
4.2.1 基准数据采集
4.2.2 实例研究――人类皮肤检测
4.2.3 实例研究――基于像素的路标检测
4.2.4 采用分类器集成的基于像素的图像分割
4.3 基本形状检测
4.3.1 线段的检测
4.3.2 凸形状的UpWrite检测
4.4 图形检测
4.4.1 从特征点进行的规则形状检测
4.4.2 显著点的聚类
4.4.3 自适应窗生长方法
4.4.4 图形验证
4.4.5 实例研究――路标检测系统
4.5 实例研究――路标跟踪和识别
4.6 实例研究――用于目标跟踪的框架
4.7 行人检测
4.8 结束语
4.8.1 本章小结
4.8.2 延伸阅读
习题
参考文献
第5章 目标识别
5.1 摘要
5.2 从张量相位直方图和形态尺度空间进行的识别
5.2.1 在形态尺度中张量相位直方图的计算
5.2.2 张量相位直方图的匹配
5.2.3 实例研究――在形态尺度空间中采用张量相位直方图进行的目标识别
5.3 基于不变量的识别
5.3.1 实例研究――采用仿射不变矩的象形图识别
5.4 基于模板的识别
5.4.1 用于路标识别的模板匹配
5.4.2 用于模板匹配的专用距离
5.4.3 采用对数极坐标和尺度空间进行的识别
5.5 从可变形模型进行的识别
5.6 分类器集成
5.7 实例研究――用于从变形原型中进行路标识别的分类器集成
5.7.1 路标识别系统的体系结构
5.7.2 用于警告标志识别的模块
5.7.3 仲裁单元
5.8 基于张量分解的识别
5.8.1 在由模式张量HOSVD分解所张成的子空间中进行的模式识别
5.8.2 实例研究――基于采用可变形模式原型的张量分解的路标识别系统
5.8.3 实例研究――采用张量分解方法进行的手写数字识别
5.8.4 张量子空间分类器的实现
5.9 用于驾驶员状态监控的人眼识别
5.10目标分类识别
5.10.1 基于部分的目标识别
5.10.2 采用视觉词袋的识别
5.11结束语
5.11.1 本章小结
5.11.2 延伸阅读
习题
参考文献
附录A
^ 收 起
Bogus?aw Cyganek博士:波兰AGH科技大学电子学系研究员及讲师,IEEE, IAPR和 SIAM会员。他的研究兴趣包括计算机视觉、模式识别以及可编程设备和嵌入式系统。他在各种期刊和学术会议单独或与他人合作发表论文90余篇,共出版著作4种。 Bogus?aw Cyganek博士:波兰AGH科技大学电子学系研究员及讲师,IEEE, IAPR和 SIAM会员。他的研究兴趣包括计算机视觉、模式识别以及可编程设备和嵌入式系统。他在各种期刊和学术会议单独或与他人合作发表论文90余篇,共出版著作4种。
计算机视觉和机器模式识别是当前热门的研究领域, 目标检测和识别是其中的关键技术。本书以作者自身丰富的项目实践经验为基础, 提供了一些优选的目标检测和识别方法, 特别是基于统计和基于张量的目标检测与识别方法。本书力求理论与实践密切结合, 不仅以简洁明了的方式提供了这些方法的理论综述和必要的数学背景, 还提供了以C++编程语言为平台的可用于指导或直接移植的实现代码, 读者可基于文中及网站给出的代码开发自己工作中所需的方法。本书的实践领域主要涉及汽车应用, 包括用于路标识别或驾驶监控的视觉系统。
比价列表