机器学习导论(原书第2版)
Ethem Alpaydin 土耳其伊斯坦布尔博阿齐奇大学(Bogazi?i University)计算机工程系教授。他于1990年在瑞士洛桑联邦理工学院获博士学位,1991年在加州大学伯克利分校国际计算机研究所(ICS, UC Berkeley)做博士后工作;之后作为访问学者,先后在美国麻省理工学院、加州大学伯克利分校国际计算机研究所、瑞士戴尔莫尔感知人工智能研究所(IDIAP)从事研究工作。他是土耳其科学院院士,IEEE高级会员,牛津大学出版社《The Computer Journal》杂志编委和Elsevier出版社《Pattern Recognition》杂志副主编。
本书讨论了机器学习在统计学、模式识别、神经网络、人工智能、信号处理等不同领域的应用,其中涵盖了监督学习、贝叶斯决策理论、参数方法、多元方法、多层感知器、局部模型、隐马尔可夫模型、分类算法评估和比较以及增强学习。
本书可供完成计算机程序设计、概率论、微积分和线性代数课程的高年级本科生和研究生使用,也可供对机器学习感兴趣的工程技术人员参考。
本书可供完成计算机程序设计、概率论、微积分和线性代数课程的高年级本科生和研究生使用,也可供对机器学习感兴趣的工程技术人员参考。
IntroductiontoMachineLearning,SecondEdition
出版者的话
中文版序
译者序
前言
致谢
关于第2版
符号表
第1章 绪论
1.1什么是机器学习
1.2机器学习的应用实例
1.2.1学习关联性
1.2.2分类
1.2.3回归
1.2.4非监督学习
1.2.5增强学习
1.3注释
1.4相关资源
1.5习题
1.6参考文献
第2章 监督学习
2.1由实例学习类
2.2VC维
2.3概率逼近正确学习
2.4噪声
2.5学习多类
2.6回归
2.7模型选择与泛化
2.8监督机器学习算法的维
2.9注释
2.10习题
2.11参考文献
第3章 贝叶斯决策定理
3.1引言
3.2分类
3.3损失与风险
3.4判别式函数
3.5效用理论
3.6关联规则
3.7注释
3.8习题
3.9参考文献
第4章 参数方法
4.1引言
4.2最大似然估计
4.2.1伯努利密度
4.2.2多项密度
4.2.3高斯(正态)密度
4.3评价估计:偏倚和方差
4.4贝叶斯估计
4.5参数分类
4.6回归
4.7调整模型的复杂度:偏倚/方差两难选择
4.8模型选择过程
4.9注释
4.10习题
4.11参考文献
第5章 多元方法
5.1多元数据
5.2参数估计
5.3缺失值估计
5.4多元正态分布
5.5多元分类
5.6调整复杂度
5.7离散特征
5.8多元回归
5.9注释
5.10习题
5.11参考文献
第6章 维度归约
6.1引言
6.2子集选择
6.3主成分分析
6.4因子分析
6.5多维定标
6.6线性判别分析
6.7等距特征映射
6.8局部线性嵌入
6.9注释
6.10习题
6.11参考文献
第7章 聚类
7.1引言
7.2混合密度
7.3k-均值聚类
7.4期望最大化算法
7.5潜在变量混合模型
7.6聚类后的监督学习
7.7层次聚类
7.8选择簇个数
7.9注释
7.10习题
7.11参考文献
第8章 非参数方法
8.1引言
8.2非参数密度估计
8.2.1直方图估计
8.2.2核估计
8.2.3k最近邻估计
8.3到多元数据的推广
8.4非参数分类
8.5精简的最近邻
8.6非参数回归:光滑模型
8.6.1移动均值光滑
8.6.2核光滑
8.6.3移动线光滑
8.7如何选择光滑参数
8.8注释
8.9习题
8.10参考文献
第9章 决策树
9.1引言
9.2单变量树
9.2.1分类树
9.2.2回归树
9.3剪枝
9.4由决策树提取规则
9.5由数据学习规则
9.6多变量树
9.7注释
9.8习题
9.9参考文献
第10章 线性判别式
10.1引言
10.2推广线性模型
10.3线性判别式的几何意义
10.3.1两类问题
10.3.2多类问题
10.4逐对分离
10.5参数判别式的进一步讨论
10.6梯度下降
10.7逻辑斯谛判别式
10.7.1两类问题
10.7.2多类问题
10.8回归判别式
10.9注释
10.10习题
10.11参考文献
第11章 多层感知器
11.1引言
11.1.1理解人脑
11.1.2神经网络作为并行处理的典范
11.2感知器
11.3训练感知器
11.4学习布尔函数
11.5多层感知器
11.6作为普适近似的MLP
11.7后向传播算法
11.7.1非线性回归
11.7.2两类判别式
11.7.3多类判别式
11.7.4多个隐藏层
11.8训练过程
11.8.1改善收敛性
11.8.2过分训练
11.8.3构造网络
11.8.4线索
11.9调整网络规模
11.10学习的贝叶斯观点
11.11维度归约
11.12学习时间
11.12.1时间延迟神经网络
11.12.2递归网络
11.13注释
11.14习题
11.15参考文献
第12章 局部模型
12.1引言
12.2竞争学习
12.2.1在线k-均值
12.2.2自适应共鸣理论
12.2.3自组织映射
12.3径向基函数
12.4结合基于规则的知识
12.5规范化基函数
12.6竞争的基函数
12.7学习向量量化
12.8混合专家模型
12.8.1协同专家模型
12.8.2竞争专家模型
12.9层次混合专家模型
12.10注释
12.11习题
12.12参考文献
第13章 核机器
13.1引言
13.2最佳分离超平面
13.3不可分情况:软边缘超平面
13.4v-SVM
13.5核技巧
13.6向量核
13.7定义核
13.8多核学习
13.9多类核机器
13.10用于回归的核机器
13.11一类核机器
13.12核维度归约
13.13注释
13.14习题
13.15参考文献
第14章 贝叶斯估计
14.1引言
14.2分布参数的估计
14.2.1离散变量
14.2.2连续变量
14.3函数参数的贝叶斯估计
14.3.1回归
14.3.2基函数或核函数的使用
14.3.3贝叶斯分类
14.4高斯过程
14.5注释
14.6习题
14.7参考文献
第15章 隐马尔可夫模型
15.1引言
15.2离散马尔可夫过程
15.3隐马尔可夫模型
15.4HMM的三个基本问题
15.5估值问题
15.6寻找状态序列
15.7学习模型参数
15.8连续观测
15.9带输入的HMM
15.10HMM中的模型选择
15.11注释
15.12习题
15.13参考文献
第16章 图方法
16.1引言
16.2条件独立的典型情况
16.3图模型实例
16.3.1朴素贝叶斯分类
16.3.2隐马尔可夫模型
16.3.3线性回归
16.4d-分离
16.5信念传播
16.5.1链
16.5.2树
16.5.3多树
16.5.4结树
16.6无向图:马尔可夫随机场
16.7学习图模型的结构
16.8影响图
16.9注释
16.10习题
16.11参考文献
第17章 组合多学习器
17.1基本原理
17.2产生有差异的学习器
17.3模型组合方案
17.4投票法
17.5纠错输出码
17.6装袋
17.7提升
17.8重温混合专家模型
17.9层叠泛化
17.10调整系综
17.11级联
17.12注释
17.13习题
17.14参考文献
第18章 增强学习
18.1引言
18.2单状态情况:K臂赌博机问题
18.3增强学习基础
18.4基于模型的学习
18.4.1价值迭代
18.4.2策略迭代
18.5时间差分学习
18.5.1探索策略
18.5.2确定性奖励和动作
18.5.3非确定性奖励和动作
18.5.4资格迹
18.6推广
18.7部分可观测状态
18.7.1场景
18.7.2例子:老虎问题
18.8注释
18.9习题
18.10参考文献
第19章 机器学习实验的设计与分析
19.1引言
19.2因素、响应和实验策略
19.3响应面设计
19.4随机化、重复和阻止
19.5机器学习实验指南
19.6交叉验证和再抽样方法
19.6.1K-折交叉验证
19.6.25×2交叉验证
19.6.3自助法
19.7度量分类器的性能
19.8区间估计
19.9假设检验
19.10评估分类算法的性能
19.10.1二项检验
19.10.2近似正态检验
19.10.3t检验
19.11比较两个分类算法
19.11.1McNemar检验
19.11.2K-折交叉验证配对t检验
19.11.35×2交叉验证配对t检验
19.11.45×2交叉验证配对F检验
19.12比较多个算法:方差分析
19.13在多个数据集上比较
19.13.1比较两个算法
19.13.2比较多个算法
19.14注释
19.15习题
19.16参考文献
附录A概率论
索引
^ 收 起
出版者的话
中文版序
译者序
前言
致谢
关于第2版
符号表
第1章 绪论
1.1什么是机器学习
1.2机器学习的应用实例
1.2.1学习关联性
1.2.2分类
1.2.3回归
1.2.4非监督学习
1.2.5增强学习
1.3注释
1.4相关资源
1.5习题
1.6参考文献
第2章 监督学习
2.1由实例学习类
2.2VC维
2.3概率逼近正确学习
2.4噪声
2.5学习多类
2.6回归
2.7模型选择与泛化
2.8监督机器学习算法的维
2.9注释
2.10习题
2.11参考文献
第3章 贝叶斯决策定理
3.1引言
3.2分类
3.3损失与风险
3.4判别式函数
3.5效用理论
3.6关联规则
3.7注释
3.8习题
3.9参考文献
第4章 参数方法
4.1引言
4.2最大似然估计
4.2.1伯努利密度
4.2.2多项密度
4.2.3高斯(正态)密度
4.3评价估计:偏倚和方差
4.4贝叶斯估计
4.5参数分类
4.6回归
4.7调整模型的复杂度:偏倚/方差两难选择
4.8模型选择过程
4.9注释
4.10习题
4.11参考文献
第5章 多元方法
5.1多元数据
5.2参数估计
5.3缺失值估计
5.4多元正态分布
5.5多元分类
5.6调整复杂度
5.7离散特征
5.8多元回归
5.9注释
5.10习题
5.11参考文献
第6章 维度归约
6.1引言
6.2子集选择
6.3主成分分析
6.4因子分析
6.5多维定标
6.6线性判别分析
6.7等距特征映射
6.8局部线性嵌入
6.9注释
6.10习题
6.11参考文献
第7章 聚类
7.1引言
7.2混合密度
7.3k-均值聚类
7.4期望最大化算法
7.5潜在变量混合模型
7.6聚类后的监督学习
7.7层次聚类
7.8选择簇个数
7.9注释
7.10习题
7.11参考文献
第8章 非参数方法
8.1引言
8.2非参数密度估计
8.2.1直方图估计
8.2.2核估计
8.2.3k最近邻估计
8.3到多元数据的推广
8.4非参数分类
8.5精简的最近邻
8.6非参数回归:光滑模型
8.6.1移动均值光滑
8.6.2核光滑
8.6.3移动线光滑
8.7如何选择光滑参数
8.8注释
8.9习题
8.10参考文献
第9章 决策树
9.1引言
9.2单变量树
9.2.1分类树
9.2.2回归树
9.3剪枝
9.4由决策树提取规则
9.5由数据学习规则
9.6多变量树
9.7注释
9.8习题
9.9参考文献
第10章 线性判别式
10.1引言
10.2推广线性模型
10.3线性判别式的几何意义
10.3.1两类问题
10.3.2多类问题
10.4逐对分离
10.5参数判别式的进一步讨论
10.6梯度下降
10.7逻辑斯谛判别式
10.7.1两类问题
10.7.2多类问题
10.8回归判别式
10.9注释
10.10习题
10.11参考文献
第11章 多层感知器
11.1引言
11.1.1理解人脑
11.1.2神经网络作为并行处理的典范
11.2感知器
11.3训练感知器
11.4学习布尔函数
11.5多层感知器
11.6作为普适近似的MLP
11.7后向传播算法
11.7.1非线性回归
11.7.2两类判别式
11.7.3多类判别式
11.7.4多个隐藏层
11.8训练过程
11.8.1改善收敛性
11.8.2过分训练
11.8.3构造网络
11.8.4线索
11.9调整网络规模
11.10学习的贝叶斯观点
11.11维度归约
11.12学习时间
11.12.1时间延迟神经网络
11.12.2递归网络
11.13注释
11.14习题
11.15参考文献
第12章 局部模型
12.1引言
12.2竞争学习
12.2.1在线k-均值
12.2.2自适应共鸣理论
12.2.3自组织映射
12.3径向基函数
12.4结合基于规则的知识
12.5规范化基函数
12.6竞争的基函数
12.7学习向量量化
12.8混合专家模型
12.8.1协同专家模型
12.8.2竞争专家模型
12.9层次混合专家模型
12.10注释
12.11习题
12.12参考文献
第13章 核机器
13.1引言
13.2最佳分离超平面
13.3不可分情况:软边缘超平面
13.4v-SVM
13.5核技巧
13.6向量核
13.7定义核
13.8多核学习
13.9多类核机器
13.10用于回归的核机器
13.11一类核机器
13.12核维度归约
13.13注释
13.14习题
13.15参考文献
第14章 贝叶斯估计
14.1引言
14.2分布参数的估计
14.2.1离散变量
14.2.2连续变量
14.3函数参数的贝叶斯估计
14.3.1回归
14.3.2基函数或核函数的使用
14.3.3贝叶斯分类
14.4高斯过程
14.5注释
14.6习题
14.7参考文献
第15章 隐马尔可夫模型
15.1引言
15.2离散马尔可夫过程
15.3隐马尔可夫模型
15.4HMM的三个基本问题
15.5估值问题
15.6寻找状态序列
15.7学习模型参数
15.8连续观测
15.9带输入的HMM
15.10HMM中的模型选择
15.11注释
15.12习题
15.13参考文献
第16章 图方法
16.1引言
16.2条件独立的典型情况
16.3图模型实例
16.3.1朴素贝叶斯分类
16.3.2隐马尔可夫模型
16.3.3线性回归
16.4d-分离
16.5信念传播
16.5.1链
16.5.2树
16.5.3多树
16.5.4结树
16.6无向图:马尔可夫随机场
16.7学习图模型的结构
16.8影响图
16.9注释
16.10习题
16.11参考文献
第17章 组合多学习器
17.1基本原理
17.2产生有差异的学习器
17.3模型组合方案
17.4投票法
17.5纠错输出码
17.6装袋
17.7提升
17.8重温混合专家模型
17.9层叠泛化
17.10调整系综
17.11级联
17.12注释
17.13习题
17.14参考文献
第18章 增强学习
18.1引言
18.2单状态情况:K臂赌博机问题
18.3增强学习基础
18.4基于模型的学习
18.4.1价值迭代
18.4.2策略迭代
18.5时间差分学习
18.5.1探索策略
18.5.2确定性奖励和动作
18.5.3非确定性奖励和动作
18.5.4资格迹
18.6推广
18.7部分可观测状态
18.7.1场景
18.7.2例子:老虎问题
18.8注释
18.9习题
18.10参考文献
第19章 机器学习实验的设计与分析
19.1引言
19.2因素、响应和实验策略
19.3响应面设计
19.4随机化、重复和阻止
19.5机器学习实验指南
19.6交叉验证和再抽样方法
19.6.1K-折交叉验证
19.6.25×2交叉验证
19.6.3自助法
19.7度量分类器的性能
19.8区间估计
19.9假设检验
19.10评估分类算法的性能
19.10.1二项检验
19.10.2近似正态检验
19.10.3t检验
19.11比较两个分类算法
19.11.1McNemar检验
19.11.2K-折交叉验证配对t检验
19.11.35×2交叉验证配对t检验
19.11.45×2交叉验证配对F检验
19.12比较多个算法:方差分析
19.13在多个数据集上比较
19.13.1比较两个算法
19.13.2比较多个算法
19.14注释
19.15习题
19.16参考文献
附录A概率论
索引
^ 收 起
Ethem Alpaydin 土耳其伊斯坦布尔博阿齐奇大学(Bogazi?i University)计算机工程系教授。他于1990年在瑞士洛桑联邦理工学院获博士学位,1991年在加州大学伯克利分校国际计算机研究所(ICS, UC Berkeley)做博士后工作;之后作为访问学者,先后在美国麻省理工学院、加州大学伯克利分校国际计算机研究所、瑞士戴尔莫尔感知人工智能研究所(IDIAP)从事研究工作。他是土耳其科学院院士,IEEE高级会员,牛津大学出版社《The Computer Journal》杂志编委和Elsevier出版社《Pattern Recognition》杂志副主编。
本书讨论了机器学习在统计学、模式识别、神经网络、人工智能、信号处理等不同领域的应用,其中涵盖了监督学习、贝叶斯决策理论、参数方法、多元方法、多层感知器、局部模型、隐马尔可夫模型、分类算法评估和比较以及增强学习。
本书可供完成计算机程序设计、概率论、微积分和线性代数课程的高年级本科生和研究生使用,也可供对机器学习感兴趣的工程技术人员参考。
本书可供完成计算机程序设计、概率论、微积分和线性代数课程的高年级本科生和研究生使用,也可供对机器学习感兴趣的工程技术人员参考。
比价列表