决策用强化与系统性机器学习
译者序
原书前言
原书致谢
关于作者
第1章强化与系统性机器学习1
1.1简介1
1.2监督学习、无监督学习、半监督学习和强化学习1
1.3传统机器学习方法和机器学习发展历史3
1.4什么是机器学习?6
1.5机器学习问题6
查看完整
原书前言
原书致谢
关于作者
第1章强化与系统性机器学习1
1.1简介1
1.2监督学习、无监督学习、半监督学习和强化学习1
1.3传统机器学习方法和机器学习发展历史3
1.4什么是机器学习?6
1.5机器学习问题6
查看完整
Parag Kulkarni博士是普纳埃拉特研究所(EKLaT Research,Pune)的CEO和首席科学家。他在知识管理、电子商务、智能系统和机器学习咨询、研究和产品建设等领域有超过20年的经验。印度理工学院和加尔各答印度管理研究院的校友,Kulkarni博士是IIM的兼职教授、捷克马萨里克大学访问研究员和普纳工程学院兼职教授。他领导的公司、研究实验室和团体,其中包括很多IT公司,有艾蒂尔公司、西门子信息系统有限公司、普纳的卡皮森公司和新加坡的ReasonEdge公司。他通过战略创新和研究引领了很多公司成功创业。瑞士的UGSM皇家商业学校授予Kulkarni荣誉博士学位。他是三个专利的共同发明人,并合著了超过100篇研究论文并有著作若干本。
李宁,现任高级实验师,北京林业大学工学院林业工程装备与技术实验教学中心副主任,北京市高校金工研究会理事。
李宁,现任高级实验师,北京林业大学工学院林业工程装备与技术实验教学中心副主任,北京市高校金工研究会理事。
机器学习是人工智能领域中一个极其重要的研究方向。强化学习是机器学习中的一个重要分支。作为解决序贯优化决策的有效方法,强化学习有效地应用于计算科学、自动控制、机器人技术等各个领域。当前,强化学习的核心任务是提高学习效率,《决策用强化与系统性机器学习》就是针对此问题展开的。第1章介绍系统概念和增强机器学习,它建立了一个突出的相同的机器学习系统范例;第2章将更多关注机器学习的基本原理和多视角学习;第3章关于强化学习;第4章处理机器学习系统和模型建立的问题;决策推理等重要的部分将在第5章展开;第6章讨论了自适应机器学习;第7章讨论了多视角和全局系统性机器学习;第8章讨论了增量学习的需要和知识表示;第9章处理了知识增长方面的问题;第10章讨论了学习系统的建立。
《决策用强化与系统性机器学习》适合于机器学习、自动化技术、人工智能等方面的相关专业教师与研究生阅读,也可供自然科学和工程领域相关研究人员参考。
《决策用强化与系统性机器学习》适合于机器学习、自动化技术、人工智能等方面的相关专业教师与研究生阅读,也可供自然科学和工程领域相关研究人员参考。
译者序
原书前言
原书致谢
关于作者
第1章强化与系统性机器学习1
1.1简介1
1.2监督学习、无监督学习、半监督学习和强化学习1
1.3传统机器学习方法和机器学习发展历史3
1.4什么是机器学习?6
1.5机器学习问题6
1.5.1学习的目标6
1.6学习模式7
1.7机器学习技术和范例9
1.8什么是强化学习?11
1.9强化函数和环境函数12
1.10强化学习的需求13
1.11强化学习和机器智能14
1.12什么是系统学习?14
1.13什么是系统性机器学习?15
1.14系统性机器学习的重点15
1.15强化性机器学习和系统性机器学习16
1.16车辆检测问题的案例研究16
1.17小结16
参考文献17
第2章全系统原理、系统性和多视角的机器学习18
2.1简介18
2.1.1什么是系统性学习?19
2.1.2历史20
2.2什么是系统性机器学习?21
2.2.1基于事件的学习21
2.3广义系统性机器学习框架23
2.3.1系统定义24
2.4多视角决策和多视角学习26
2.4.1基于完整信息的表示32
2.4.2基于部分信息的表示32
2.4.3单视角决策方案图32
2.4.4双重视角决策方案图32
2.4.5多视角决策方案图32
2.4.6定性信念网络和影响图33
2.5动态和交互式决策33
2.5.1交互决策图33
2.5.2决策图和影响图中时间的角色34
2.5.3系统性视角的建立34
2.5.4信息整合35
2.5.5建立典型决策方案图35
2.5.6受限信息35
2.5.7多决策者系统在系统性学习中的角色35
2.6系统性学习框架39
2.6.1数学模型39
2.6.2系统性学习的方法39
2.6.3自适应系统性学习40
2.6.4系统性学习框架41
2.7系统分析41
2.8案例学习:在酒店行业中需要系统性学习43
2.9小结44
参考文献44
第3章强化学习45
3.1简介45
3.2学习决策者48
3.3回报和奖励的计算50
3.3.1方案和连续任务50
3.4强化学习和自适应控制51
3.5动态系统54
3.5.1离散事件动态系统54
3.6强化学习和控制55
3.7马尔科夫性质和决策过程55
3.8价值函数56
3.8.1行动和价值56
3.9学习最优策略(有模型和无模型法)57
3.10动态规划57
3.10.1动态系统性质57
3.11自适应动态规则58
3.11.1时间差分学习59
3.11.2Q学习60
3.11.3统一的视图60
3.12范例——拳击训练器的强化学习61
3.13小结61
参考文献61
第4章系统性机器学习和模型62
4.1简介62
4.2系统学习的框架63
4.2.1影响空间64
4.2.2交互作用为中心的模型69
4.2.3以结果为中心的模型69
4.3捕捉系统视图70
4.4系统交互的数学表达73
4.5影响函数74
4.6决策影响分析74
4.6.1时空界限75
4.7小结80
第5章推理和信息集成82
5.1简介82
5.2推理机制和需要83
5.2.1情景推理85
5.2.2推理确定影响85
5.3情景和推理的集成88
5.4统计推理和归纳91
5.4.1直接推理91
5.4.2间接推理91
5.4.3信息推理91
5.4.4归纳92
5.5纯似然方法92
5.6贝叶斯范例推理93
5.6.1贝叶斯定理93
5.7基于时域推理93
5.8推理建立系统观点94
5.8.1信息集成94
5.9小结96
参考文献97
第6章自适应学习98
6.1简介98
6.2自适应学习和自适应系统98
6.3什么是自适应机器学习101
6.4基于方案的适应性和学习方法101
6.4.1动态适应性和情景感知的学习102
6.5系统学习和自适应学习104
6.5.1多学习器的使用105
6.5.2系统自适应机器学习108
6.5.3自适应应用的设计110
6.5.4自适应学习的需要和适应的原因111
6.5.5适应类型112
6.5.6自适应框架114
6.6竞争学习和自适应学习115
6.6.1适应性函数116
6.6.2决策网络118
6.6.3自适应学习方案119
6.7范例120
6.7.1案例研究:基于自适应学习的文本120
6.7.2自适应学习的文档挖掘121
6.8小结122
参考文献122
第7章多视角和全局系统性的学习123
7.1简介123
7.2多视角方案构建124
7.3多视角决策和多视角学习126
7.3.1视角结合126
7.3.2影响图和部分方案决策表示图127
7.3.3表示决策方案图(RDSD)130
7.3.4范例:部分方案决策表示图(PDSRD)表示的不同视角获取的城市信息131
7.4全局系统性学习和多视角途径134
7.4.1分散信息整合135
7.4.2多视角和全局系统知识表示135
7.4.3什么是多视角方案?135
7.4.4特定方案136
7.5基于多视角途径的案例研究136
7.5.1交通控制器用多视角途径137
7.5.2情感检测用多视角途径模型138
7.6多视角方法的局限性143
7.7小结143
参考文献144
第8章增量学习和知识表示145
8.1简介145
8.2为什么增量学习?146
8.3学习已经学会的147
8.3.1绝对增量学习148
8.3.2选择增量学习149
8.4监督增量学习157
8.5增量无监督学习和增量聚类158
8.5.1增量聚类:任务160
8.5.2增量聚类:方法161
8.5.3阈值161
8.6半监督增量学习162
8.7增量与系统性学习163
8.8增量接近值和学习方法164
8.8.1增量学习方法1165
8.8.2增量学习方法2166
8.8.3计算C值增量166
8.9学习与决策模型169
8.10增量分类技术169
8.11案例分析:增量文档分类170
8.12小结171
第9章知识增长:机器学习的视角173
9.1简介173
9.2短暂的历史和相关工作174
9.3知识增长和知识启发178
9.3.1策略使用进行知识启发178
9.3.2基于目标的知识启发179
9.3.3基于过程的知识启发179
9.4生命周期180
9.4.1知识水平181
9.4.2直接知识181
9.4.3间接知识182
9.4.4程序知识182
9.4.5问题182
9.4.6决策182
9.4.7知识生命周期183
9.5增量知识表达184
9.6案例学习和遗忘学习186
9.7知识的扩充:技术和方法187
9.7.1知识增量技术187
9.7.2知识增量方法188
9.7.3提取知识的机制189
9.8启发式学习190
9.9系统性机器学习和知识获取190
9.9.1全方位知识获取191
9.9.2系统知识管理和先进的机器学习192
9.10在复杂环境下的知识增量193
9.11案例研究193
9.11.1银行案例研究193
9.11.2软件开发公司194
9.11.3杂货集市/零售集市195
9.12小结195
参考文献196
第10章构建学习系统197
10.1简介197
10.2系统性学习系统197
10.2.1学习单元199
10.2.2知识库200
10.2.3性能单元200
10.2.4反馈单元200
10.2.5允许测量的系统200
10.3算法选择201
10.3.1k近邻(kNN)201
10.3.2支持向量机(SVM)202
10.3.3质心法202
10.4知识表示203
10.4.1实用方案和案例研究203
10.5学习系统的设计204
10.6让系统表现得更智能204
10.7案例学习205
10.8整体知识框架和强化学习的应用205
10.8.1智能算法的选择207
10.9智能决策——部署和知识采集以及重用208
10.10基于案例的学习:人体情感检测系统209
10.11复杂决策问题的整体视角211
10.12知识表示和资源查找213
10.13组件215
10.13.1范例215
10.14学习系统和智能系统的未来216
10.15小结217
附录218
附录A统计学习方法218
A.1概率218
A.1.1互斥事件218
A.1.2独立事件218
A.2贝叶斯分类219
A.2.1朴素贝叶斯分类220
A.2.2贝叶斯分类器的优点和缺点221
A.3回归221
A.3.1线性222
A.3.2非线性222
A.3.3回归的其他方法222
A.4粗糙集223
A.4.1不可分辨关系223
A.4.2集近似224
A.4.3边界区域224
A.4.4粗糙集和清晰集224
A.4.5约简224
A.4.6可有可无和不可缺少的属性224
A.5支持向量机224
参考文献225
附录B马尔科夫过程225
B.1马尔科夫过程225
B.1.1案例226
B.1.2解决步骤226
B.1.3长期227
B.1.4马尔科夫过程示例228
B.2半马尔科夫过程231
B.2.1建议231
B.2.2验证232
B.2.3推论232
^ 收 起
原书前言
原书致谢
关于作者
第1章强化与系统性机器学习1
1.1简介1
1.2监督学习、无监督学习、半监督学习和强化学习1
1.3传统机器学习方法和机器学习发展历史3
1.4什么是机器学习?6
1.5机器学习问题6
1.5.1学习的目标6
1.6学习模式7
1.7机器学习技术和范例9
1.8什么是强化学习?11
1.9强化函数和环境函数12
1.10强化学习的需求13
1.11强化学习和机器智能14
1.12什么是系统学习?14
1.13什么是系统性机器学习?15
1.14系统性机器学习的重点15
1.15强化性机器学习和系统性机器学习16
1.16车辆检测问题的案例研究16
1.17小结16
参考文献17
第2章全系统原理、系统性和多视角的机器学习18
2.1简介18
2.1.1什么是系统性学习?19
2.1.2历史20
2.2什么是系统性机器学习?21
2.2.1基于事件的学习21
2.3广义系统性机器学习框架23
2.3.1系统定义24
2.4多视角决策和多视角学习26
2.4.1基于完整信息的表示32
2.4.2基于部分信息的表示32
2.4.3单视角决策方案图32
2.4.4双重视角决策方案图32
2.4.5多视角决策方案图32
2.4.6定性信念网络和影响图33
2.5动态和交互式决策33
2.5.1交互决策图33
2.5.2决策图和影响图中时间的角色34
2.5.3系统性视角的建立34
2.5.4信息整合35
2.5.5建立典型决策方案图35
2.5.6受限信息35
2.5.7多决策者系统在系统性学习中的角色35
2.6系统性学习框架39
2.6.1数学模型39
2.6.2系统性学习的方法39
2.6.3自适应系统性学习40
2.6.4系统性学习框架41
2.7系统分析41
2.8案例学习:在酒店行业中需要系统性学习43
2.9小结44
参考文献44
第3章强化学习45
3.1简介45
3.2学习决策者48
3.3回报和奖励的计算50
3.3.1方案和连续任务50
3.4强化学习和自适应控制51
3.5动态系统54
3.5.1离散事件动态系统54
3.6强化学习和控制55
3.7马尔科夫性质和决策过程55
3.8价值函数56
3.8.1行动和价值56
3.9学习最优策略(有模型和无模型法)57
3.10动态规划57
3.10.1动态系统性质57
3.11自适应动态规则58
3.11.1时间差分学习59
3.11.2Q学习60
3.11.3统一的视图60
3.12范例——拳击训练器的强化学习61
3.13小结61
参考文献61
第4章系统性机器学习和模型62
4.1简介62
4.2系统学习的框架63
4.2.1影响空间64
4.2.2交互作用为中心的模型69
4.2.3以结果为中心的模型69
4.3捕捉系统视图70
4.4系统交互的数学表达73
4.5影响函数74
4.6决策影响分析74
4.6.1时空界限75
4.7小结80
第5章推理和信息集成82
5.1简介82
5.2推理机制和需要83
5.2.1情景推理85
5.2.2推理确定影响85
5.3情景和推理的集成88
5.4统计推理和归纳91
5.4.1直接推理91
5.4.2间接推理91
5.4.3信息推理91
5.4.4归纳92
5.5纯似然方法92
5.6贝叶斯范例推理93
5.6.1贝叶斯定理93
5.7基于时域推理93
5.8推理建立系统观点94
5.8.1信息集成94
5.9小结96
参考文献97
第6章自适应学习98
6.1简介98
6.2自适应学习和自适应系统98
6.3什么是自适应机器学习101
6.4基于方案的适应性和学习方法101
6.4.1动态适应性和情景感知的学习102
6.5系统学习和自适应学习104
6.5.1多学习器的使用105
6.5.2系统自适应机器学习108
6.5.3自适应应用的设计110
6.5.4自适应学习的需要和适应的原因111
6.5.5适应类型112
6.5.6自适应框架114
6.6竞争学习和自适应学习115
6.6.1适应性函数116
6.6.2决策网络118
6.6.3自适应学习方案119
6.7范例120
6.7.1案例研究:基于自适应学习的文本120
6.7.2自适应学习的文档挖掘121
6.8小结122
参考文献122
第7章多视角和全局系统性的学习123
7.1简介123
7.2多视角方案构建124
7.3多视角决策和多视角学习126
7.3.1视角结合126
7.3.2影响图和部分方案决策表示图127
7.3.3表示决策方案图(RDSD)130
7.3.4范例:部分方案决策表示图(PDSRD)表示的不同视角获取的城市信息131
7.4全局系统性学习和多视角途径134
7.4.1分散信息整合135
7.4.2多视角和全局系统知识表示135
7.4.3什么是多视角方案?135
7.4.4特定方案136
7.5基于多视角途径的案例研究136
7.5.1交通控制器用多视角途径137
7.5.2情感检测用多视角途径模型138
7.6多视角方法的局限性143
7.7小结143
参考文献144
第8章增量学习和知识表示145
8.1简介145
8.2为什么增量学习?146
8.3学习已经学会的147
8.3.1绝对增量学习148
8.3.2选择增量学习149
8.4监督增量学习157
8.5增量无监督学习和增量聚类158
8.5.1增量聚类:任务160
8.5.2增量聚类:方法161
8.5.3阈值161
8.6半监督增量学习162
8.7增量与系统性学习163
8.8增量接近值和学习方法164
8.8.1增量学习方法1165
8.8.2增量学习方法2166
8.8.3计算C值增量166
8.9学习与决策模型169
8.10增量分类技术169
8.11案例分析:增量文档分类170
8.12小结171
第9章知识增长:机器学习的视角173
9.1简介173
9.2短暂的历史和相关工作174
9.3知识增长和知识启发178
9.3.1策略使用进行知识启发178
9.3.2基于目标的知识启发179
9.3.3基于过程的知识启发179
9.4生命周期180
9.4.1知识水平181
9.4.2直接知识181
9.4.3间接知识182
9.4.4程序知识182
9.4.5问题182
9.4.6决策182
9.4.7知识生命周期183
9.5增量知识表达184
9.6案例学习和遗忘学习186
9.7知识的扩充:技术和方法187
9.7.1知识增量技术187
9.7.2知识增量方法188
9.7.3提取知识的机制189
9.8启发式学习190
9.9系统性机器学习和知识获取190
9.9.1全方位知识获取191
9.9.2系统知识管理和先进的机器学习192
9.10在复杂环境下的知识增量193
9.11案例研究193
9.11.1银行案例研究193
9.11.2软件开发公司194
9.11.3杂货集市/零售集市195
9.12小结195
参考文献196
第10章构建学习系统197
10.1简介197
10.2系统性学习系统197
10.2.1学习单元199
10.2.2知识库200
10.2.3性能单元200
10.2.4反馈单元200
10.2.5允许测量的系统200
10.3算法选择201
10.3.1k近邻(kNN)201
10.3.2支持向量机(SVM)202
10.3.3质心法202
10.4知识表示203
10.4.1实用方案和案例研究203
10.5学习系统的设计204
10.6让系统表现得更智能204
10.7案例学习205
10.8整体知识框架和强化学习的应用205
10.8.1智能算法的选择207
10.9智能决策——部署和知识采集以及重用208
10.10基于案例的学习:人体情感检测系统209
10.11复杂决策问题的整体视角211
10.12知识表示和资源查找213
10.13组件215
10.13.1范例215
10.14学习系统和智能系统的未来216
10.15小结217
附录218
附录A统计学习方法218
A.1概率218
A.1.1互斥事件218
A.1.2独立事件218
A.2贝叶斯分类219
A.2.1朴素贝叶斯分类220
A.2.2贝叶斯分类器的优点和缺点221
A.3回归221
A.3.1线性222
A.3.2非线性222
A.3.3回归的其他方法222
A.4粗糙集223
A.4.1不可分辨关系223
A.4.2集近似224
A.4.3边界区域224
A.4.4粗糙集和清晰集224
A.4.5约简224
A.4.6可有可无和不可缺少的属性224
A.5支持向量机224
参考文献225
附录B马尔科夫过程225
B.1马尔科夫过程225
B.1.1案例226
B.1.2解决步骤226
B.1.3长期227
B.1.4马尔科夫过程示例228
B.2半马尔科夫过程231
B.2.1建议231
B.2.2验证232
B.2.3推论232
^ 收 起
Parag Kulkarni博士是普纳埃拉特研究所(EKLaT Research,Pune)的CEO和首席科学家。他在知识管理、电子商务、智能系统和机器学习咨询、研究和产品建设等领域有超过20年的经验。印度理工学院和加尔各答印度管理研究院的校友,Kulkarni博士是IIM的兼职教授、捷克马萨里克大学访问研究员和普纳工程学院兼职教授。他领导的公司、研究实验室和团体,其中包括很多IT公司,有艾蒂尔公司、西门子信息系统有限公司、普纳的卡皮森公司和新加坡的ReasonEdge公司。他通过战略创新和研究引领了很多公司成功创业。瑞士的UGSM皇家商业学校授予Kulkarni荣誉博士学位。他是三个专利的共同发明人,并合著了超过100篇研究论文并有著作若干本。
李宁,现任高级实验师,北京林业大学工学院林业工程装备与技术实验教学中心副主任,北京市高校金工研究会理事。
李宁,现任高级实验师,北京林业大学工学院林业工程装备与技术实验教学中心副主任,北京市高校金工研究会理事。
机器学习是人工智能领域中一个极其重要的研究方向。强化学习是机器学习中的一个重要分支。作为解决序贯优化决策的有效方法,强化学习有效地应用于计算科学、自动控制、机器人技术等各个领域。当前,强化学习的核心任务是提高学习效率,《决策用强化与系统性机器学习》就是针对此问题展开的。第1章介绍系统概念和增强机器学习,它建立了一个突出的相同的机器学习系统范例;第2章将更多关注机器学习的基本原理和多视角学习;第3章关于强化学习;第4章处理机器学习系统和模型建立的问题;决策推理等重要的部分将在第5章展开;第6章讨论了自适应机器学习;第7章讨论了多视角和全局系统性机器学习;第8章讨论了增量学习的需要和知识表示;第9章处理了知识增长方面的问题;第10章讨论了学习系统的建立。
《决策用强化与系统性机器学习》适合于机器学习、自动化技术、人工智能等方面的相关专业教师与研究生阅读,也可供自然科学和工程领域相关研究人员参考。
《决策用强化与系统性机器学习》适合于机器学习、自动化技术、人工智能等方面的相关专业教师与研究生阅读,也可供自然科学和工程领域相关研究人员参考。
比价列表
1人想要
公众号、微信群
缺书网
微信公众号
微信公众号
扫码进群
实时获取购书优惠
实时获取购书优惠