知识图谱:方法、实践与应用
第1章 知识图谱概述 1
1.1 什么是知识图谱 1
1.2 知识图谱的发展历史 2
1.3 知识图谱的价值 5
1.4 国内外典型的知识图谱项目 9
1.4.1 早期的知识库项目 9
1.4.2 互联网时代的知识图谱 9
1.4.3 中文开放知识图谱 12
1.4.4 垂直领域知识图谱 13
1.5 知识图谱的技术流程 15
查看完整
1.1 什么是知识图谱 1
1.2 知识图谱的发展历史 2
1.3 知识图谱的价值 5
1.4 国内外典型的知识图谱项目 9
1.4.1 早期的知识库项目 9
1.4.2 互联网时代的知识图谱 9
1.4.3 中文开放知识图谱 12
1.4.4 垂直领域知识图谱 13
1.5 知识图谱的技术流程 15
查看完整
王昊奋,上海交通大学计算机博士。中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算专委会副秘书长、上海交通大学校友会AI分会秘书长。在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。漆桂林,东南大学计算机学院教授、东南大学认知智能研究所所长、南京柯基数据科技有限公司首席科学家、OpenKG发起人之一、中国中文信息学会语言与知识计算专业委员会副主任、中国科学技术情报学会知识组织专业委员会副主任、爱思唯尔(Elsevier)数据管理顾问委员会顾问、国际期刊 Journal of Data Intelligence 执行主编。科研成果在电力故障智能检测和知识推送、医药知识问答及网络安全态势感知系统等领域得到了实际应用。陈华钧,浙江大学计算机科学与技术学院教授。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、中国人工智能学会知…
查看完整
查看完整
知识图谱是较为典型的多学科交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。本书系统地介绍知识图谱涉及的关键技术,如知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、知识问答、图挖掘分析等。此外,本书还尝试将学术前沿和实战结合,让读者在掌握实际应用能力的同时对前沿技术发展有所了解。本书既适合计算机和人工智能相关的研究人员阅读,又适合在企业一线从事技术和应用开发的人员学习,还可作为高等院校计算机或人工智能专业师生的参考教材。
第1章 知识图谱概述 1
1.1 什么是知识图谱 1
1.2 知识图谱的发展历史 2
1.3 知识图谱的价值 5
1.4 国内外典型的知识图谱项目 9
1.4.1 早期的知识库项目 9
1.4.2 互联网时代的知识图谱 9
1.4.3 中文开放知识图谱 12
1.4.4 垂直领域知识图谱 13
1.5 知识图谱的技术流程 15
1.6 知识图谱的相关技术 19
1.6.1 知识图谱与数据库系统 19
1.6.2 知识图谱与智能问答 23
1.6.3 知识图谱与机器推理 25
1.6.4 知识图谱与推荐系统 28
1.6.5 区块链与去中心化的知识图谱 29
1.7 本章小结 30
参考文献 31
第2章 知识图谱表示与建模 40
2.1 什么是知识表示 40
2.2 人工智能早期的知识表示方法 43
2.2.1 一阶谓词逻辑 43
2.2.2 霍恩子句和霍恩逻辑 43
2.2.3 语义网络 44
2.2.4 框架 45
2.2.5 描述逻辑 47
2.3 互联网时代的语义网知识表示框架 48
2.3.1 RDF和RDFS 48
2.3.2 OWL和OWL2 Fragments 53
2.3.3 知识图谱查询语言的表示 59
2.3.4 语义Markup表示语言 62
2.4 常见开放域知识图谱的知识表示方法 64
2.4.1 Freebase 64
2.4.2 Wikidata 65
2.4.3 ConceptNet5 66
2.5 知识图谱的向量表示方法 68
2.5.1 知识图谱表示的挑战 68
2.5.2 词的向量表示方法 68
2.5.3 知识图谱嵌入的概念 71
2.5.4 知识图谱嵌入的优点 72
2.5.5 知识图谱嵌入的主要方法 72
2.5.6 知识图谱嵌入的应用 75
2.6 开源工具实践:基于Protégé的本体知识建模 77
2.6.1 简介 77
2.6.2 环境准备 78
2.6.3 Protégé实践主要功能演示 78
2.7 本章小结 80
参考文献 80
第3章 知识存储 82
3.1 知识图谱数据库基本知识 82
3.1.1 知识图谱数据模型 82
3.1.2 知识图谱查询语言 85
3.2 常见知识图谱存储方法 91
3.2.1 基于关系数据库的存储方案 91
3.2.2 面向RDF的三元组数据库 101
3.2.3 原生图数据库 115
3.2.4 知识图谱数据库比较 120
3.3 知识存储关键技术 121
3.3.1 知识图谱数据库的存储:以Neo4j为例 121
3.3.2 知识图谱数据库的索引 124
3.4 开源工具实践 126
3.4.1 三元组数据库Apache Jena 126
3.4.2 Tutorial:面向RDF的三元组数据库gStore 128
参考文献 131
第4章 知识抽取与知识挖掘 133
4.1 知识抽取任务及相关竞赛 133
4.1.1 知识抽取任务定义 133
4.1.2 知识抽取相关竞赛 134
4.2 面向非结构化数据的知识抽取 136
4.2.1 实体抽取 137
4.2.2 关系抽取 142
4.2.3 事件抽取 150
4.3 面向结构化数据的知识抽取 154
4.3.1 直接映射 154
4.3.2 R2RML 156
4.3.3 相关工具 159
4.4 面向半结构化数据的知识抽取 161
4.4.1 面向百科类数据的知识抽取 161
4.4.2 面向Web网页的知识抽取 165
4.5 知识挖掘 168
4.5.1 知识内容挖掘:实体链接 168
4.5.2 知识结构挖掘:规则挖掘 174
4.6 开源工具实践:基于DeepDive的关系抽取实践 178
4.6.1 开源工具的技术架构 178
4.6.2 其他类似工具 180
参考文献 180
第5章 知识图谱的融合 184
5.1 什么是知识图谱融合 184
5.2 知识图谱中的异构问题 185
5.2.1 语言层不匹配 186
5.2.2 模型层不匹配 187
5.3 本体概念层的融合方法与技术 190
5.3.1 本体映射与本体集成 190
5.3.2 本体映射分类 192
5.3.3 本体映射方法和工具 195
5.3.4 本体映射管理 232
5.3.5 本体映射应用 235
5.4 实例层的融合与匹配 236
5.4.1 知识图谱中的实例匹配问题分析 236
5.4.2 基于快速相似度计算的实例匹配方法 240
5.4.3 基于规则的实例匹配方法 241
5.4.4 基于分治的实例匹配方法 244
5.4.5 基于学习的实例匹配方法 260
5.4.6 实例匹配中的分布式并行处理 266
5.5 开源工具实践:实体关系发现框架LIMES 266
5.5.1 简介 266
5.5.2 开源工具的技术架构 267
5.5.3 其他类似工具 269
5.6 本章小结 269
参考文献 270
第6章 知识图谱推理 279
6.1 推理概述 279
6.1.1 什么是推理 279
6.1.2 面向知识图谱的推理 282
6.2 基于演绎的知识图谱推理 283
6.2.1 本体推理 283
6.2.2 基于逻辑编程的推理方法 288
6.2.3 基于查询重写的方法 295
6.2.4 基于产生式规则的方法 301
6.3 基于归纳的知识图谱推理 306
6.3.1 基于图结构的推理 306
6.3.2 基于规则学习的推理 313
6.3.3 基于表示学习的推理 318
6.4 知识图谱推理新进展 324
6.4.1 时序预测推理 324
6.4.2 基于强化学习的知识图谱推理 325
6.4.3 基于元学习的少样本知识图谱推理 326
6.4.4 图神经网络与知识图谱推理 326
6.5 开源工具实践:基于Jena和Drools的知识推理实践 327
6.5.1 开源工具简介 327
6.5.2 开源工具的技术架构 327
6.5.3 开发软件版本及其下载地址 328
6.5.4 基于Jena的知识推理实践 328
6.5.5 基于Drools的知识推理实践 329
6.6 本章小结 329
参考文献 330
第7章 语义搜索 334
7.1 语义搜索简介 334
7.2 结构化的查询语言 336
7.2.1 数据查询 338
7.2.2 数据插入 341
7.2.3 数据删除 341
7.3 语义数据搜索 342
7.4 语义搜索的交互范式 348
7.4.1 基于关键词的知识图谱语义搜索方法 348
7.4.2 基于分面的知识图谱语义搜索 350
7.4.3 基于表示学习的知识图谱语义搜索 352
7.5 开源工具实践 355
7.5.1 功能介绍 355
7.5.2 环境搭建及数据准备 357
7.5.3 数据准备 357
7.5.4 导入Elasticsearch 360
7.5.5 功能实现 (views.py) 361
7.5.6 执行查询 363
参考文献 364
第8章 知识问答 366
8.1 知识问答概述 366
8.1.1 知识问答的基本要素 366
8.1.2 知识问答的相关工作 367
8.1.3 知识问答应用场景 369
8.2 知识问答的分类体系 371
8.2.1 问题类型与答案类型 371
8.2.2 知识库类型 374
8.2.3 智能体类型 375
8.3 知识问答系统 376
8.3.1 NLIDB:早期的问答系统 376
8.3.2 IRQA:基于信息检索的问答系统 380
8.3.3 KBQA :基于知识库的问答系统 380
8.3.4 CommunityQA/FAQ-QA:基于问答对匹配的问答系统 381
8.3.5 Hybrid QA Framework 混合问答系统框架 382
8.4 知识问答的评价方法 386
8.4.1 问答系统的评价指标 386
8.4.2 问答系统的评价数据集 387
8.5 KBQA前沿技术 392
8.5.1 KBQA面临的挑战 392
8.5.2 基于模板的方法 394
8.5.3 基于语义解析的方法 398
8.5.4 基于深度学习的传统问答模块优化 401
8.5.5 基于深度学习的端到端问答模型 405
8.6 开源工具实践 406
8.6.1 使用Elasticsearch搭建简单知识问答系统 406
8.6.2 基于gAnswer构建中英文知识问答系统 410
8.7 本章小结 415
参考文献 416
第9章 知识图谱应用案例 420
9.1 领域知识图谱构建的技术流程 420
9.1.1 领域知识建模 421
9.1.2 知识存储 422
9.1.3 知识抽取 422
9.1.4 知识融合 423
9.1.5 知识计算 423
9.1.6 知识应用 424
9.2 领域知识图谱构建的基本方法 425
9.2.1 自顶向下的构建方法 425
9.2.2 自顶向下的构建方法 426
9.3 领域知识图谱的应用案例 428
9.3.1 电商知识图谱的构建与应用 428
9.3.2 图情知识图谱的构建与应用 431
9.3.3 生活娱乐知识图谱构建与应用:以美团为例 435
9.3.4 企业商业知识图谱的构建与应用 440
9.3.5 创投知识图谱的构建与应用 443
9.3.6 中医临床领域知识图谱的构建与应用 448
9.3.7 金融证券行业知识图谱应用实践 452
9.4 本章小结 460
参考文献 461
^ 收 起
1.1 什么是知识图谱 1
1.2 知识图谱的发展历史 2
1.3 知识图谱的价值 5
1.4 国内外典型的知识图谱项目 9
1.4.1 早期的知识库项目 9
1.4.2 互联网时代的知识图谱 9
1.4.3 中文开放知识图谱 12
1.4.4 垂直领域知识图谱 13
1.5 知识图谱的技术流程 15
1.6 知识图谱的相关技术 19
1.6.1 知识图谱与数据库系统 19
1.6.2 知识图谱与智能问答 23
1.6.3 知识图谱与机器推理 25
1.6.4 知识图谱与推荐系统 28
1.6.5 区块链与去中心化的知识图谱 29
1.7 本章小结 30
参考文献 31
第2章 知识图谱表示与建模 40
2.1 什么是知识表示 40
2.2 人工智能早期的知识表示方法 43
2.2.1 一阶谓词逻辑 43
2.2.2 霍恩子句和霍恩逻辑 43
2.2.3 语义网络 44
2.2.4 框架 45
2.2.5 描述逻辑 47
2.3 互联网时代的语义网知识表示框架 48
2.3.1 RDF和RDFS 48
2.3.2 OWL和OWL2 Fragments 53
2.3.3 知识图谱查询语言的表示 59
2.3.4 语义Markup表示语言 62
2.4 常见开放域知识图谱的知识表示方法 64
2.4.1 Freebase 64
2.4.2 Wikidata 65
2.4.3 ConceptNet5 66
2.5 知识图谱的向量表示方法 68
2.5.1 知识图谱表示的挑战 68
2.5.2 词的向量表示方法 68
2.5.3 知识图谱嵌入的概念 71
2.5.4 知识图谱嵌入的优点 72
2.5.5 知识图谱嵌入的主要方法 72
2.5.6 知识图谱嵌入的应用 75
2.6 开源工具实践:基于Protégé的本体知识建模 77
2.6.1 简介 77
2.6.2 环境准备 78
2.6.3 Protégé实践主要功能演示 78
2.7 本章小结 80
参考文献 80
第3章 知识存储 82
3.1 知识图谱数据库基本知识 82
3.1.1 知识图谱数据模型 82
3.1.2 知识图谱查询语言 85
3.2 常见知识图谱存储方法 91
3.2.1 基于关系数据库的存储方案 91
3.2.2 面向RDF的三元组数据库 101
3.2.3 原生图数据库 115
3.2.4 知识图谱数据库比较 120
3.3 知识存储关键技术 121
3.3.1 知识图谱数据库的存储:以Neo4j为例 121
3.3.2 知识图谱数据库的索引 124
3.4 开源工具实践 126
3.4.1 三元组数据库Apache Jena 126
3.4.2 Tutorial:面向RDF的三元组数据库gStore 128
参考文献 131
第4章 知识抽取与知识挖掘 133
4.1 知识抽取任务及相关竞赛 133
4.1.1 知识抽取任务定义 133
4.1.2 知识抽取相关竞赛 134
4.2 面向非结构化数据的知识抽取 136
4.2.1 实体抽取 137
4.2.2 关系抽取 142
4.2.3 事件抽取 150
4.3 面向结构化数据的知识抽取 154
4.3.1 直接映射 154
4.3.2 R2RML 156
4.3.3 相关工具 159
4.4 面向半结构化数据的知识抽取 161
4.4.1 面向百科类数据的知识抽取 161
4.4.2 面向Web网页的知识抽取 165
4.5 知识挖掘 168
4.5.1 知识内容挖掘:实体链接 168
4.5.2 知识结构挖掘:规则挖掘 174
4.6 开源工具实践:基于DeepDive的关系抽取实践 178
4.6.1 开源工具的技术架构 178
4.6.2 其他类似工具 180
参考文献 180
第5章 知识图谱的融合 184
5.1 什么是知识图谱融合 184
5.2 知识图谱中的异构问题 185
5.2.1 语言层不匹配 186
5.2.2 模型层不匹配 187
5.3 本体概念层的融合方法与技术 190
5.3.1 本体映射与本体集成 190
5.3.2 本体映射分类 192
5.3.3 本体映射方法和工具 195
5.3.4 本体映射管理 232
5.3.5 本体映射应用 235
5.4 实例层的融合与匹配 236
5.4.1 知识图谱中的实例匹配问题分析 236
5.4.2 基于快速相似度计算的实例匹配方法 240
5.4.3 基于规则的实例匹配方法 241
5.4.4 基于分治的实例匹配方法 244
5.4.5 基于学习的实例匹配方法 260
5.4.6 实例匹配中的分布式并行处理 266
5.5 开源工具实践:实体关系发现框架LIMES 266
5.5.1 简介 266
5.5.2 开源工具的技术架构 267
5.5.3 其他类似工具 269
5.6 本章小结 269
参考文献 270
第6章 知识图谱推理 279
6.1 推理概述 279
6.1.1 什么是推理 279
6.1.2 面向知识图谱的推理 282
6.2 基于演绎的知识图谱推理 283
6.2.1 本体推理 283
6.2.2 基于逻辑编程的推理方法 288
6.2.3 基于查询重写的方法 295
6.2.4 基于产生式规则的方法 301
6.3 基于归纳的知识图谱推理 306
6.3.1 基于图结构的推理 306
6.3.2 基于规则学习的推理 313
6.3.3 基于表示学习的推理 318
6.4 知识图谱推理新进展 324
6.4.1 时序预测推理 324
6.4.2 基于强化学习的知识图谱推理 325
6.4.3 基于元学习的少样本知识图谱推理 326
6.4.4 图神经网络与知识图谱推理 326
6.5 开源工具实践:基于Jena和Drools的知识推理实践 327
6.5.1 开源工具简介 327
6.5.2 开源工具的技术架构 327
6.5.3 开发软件版本及其下载地址 328
6.5.4 基于Jena的知识推理实践 328
6.5.5 基于Drools的知识推理实践 329
6.6 本章小结 329
参考文献 330
第7章 语义搜索 334
7.1 语义搜索简介 334
7.2 结构化的查询语言 336
7.2.1 数据查询 338
7.2.2 数据插入 341
7.2.3 数据删除 341
7.3 语义数据搜索 342
7.4 语义搜索的交互范式 348
7.4.1 基于关键词的知识图谱语义搜索方法 348
7.4.2 基于分面的知识图谱语义搜索 350
7.4.3 基于表示学习的知识图谱语义搜索 352
7.5 开源工具实践 355
7.5.1 功能介绍 355
7.5.2 环境搭建及数据准备 357
7.5.3 数据准备 357
7.5.4 导入Elasticsearch 360
7.5.5 功能实现 (views.py) 361
7.5.6 执行查询 363
参考文献 364
第8章 知识问答 366
8.1 知识问答概述 366
8.1.1 知识问答的基本要素 366
8.1.2 知识问答的相关工作 367
8.1.3 知识问答应用场景 369
8.2 知识问答的分类体系 371
8.2.1 问题类型与答案类型 371
8.2.2 知识库类型 374
8.2.3 智能体类型 375
8.3 知识问答系统 376
8.3.1 NLIDB:早期的问答系统 376
8.3.2 IRQA:基于信息检索的问答系统 380
8.3.3 KBQA :基于知识库的问答系统 380
8.3.4 CommunityQA/FAQ-QA:基于问答对匹配的问答系统 381
8.3.5 Hybrid QA Framework 混合问答系统框架 382
8.4 知识问答的评价方法 386
8.4.1 问答系统的评价指标 386
8.4.2 问答系统的评价数据集 387
8.5 KBQA前沿技术 392
8.5.1 KBQA面临的挑战 392
8.5.2 基于模板的方法 394
8.5.3 基于语义解析的方法 398
8.5.4 基于深度学习的传统问答模块优化 401
8.5.5 基于深度学习的端到端问答模型 405
8.6 开源工具实践 406
8.6.1 使用Elasticsearch搭建简单知识问答系统 406
8.6.2 基于gAnswer构建中英文知识问答系统 410
8.7 本章小结 415
参考文献 416
第9章 知识图谱应用案例 420
9.1 领域知识图谱构建的技术流程 420
9.1.1 领域知识建模 421
9.1.2 知识存储 422
9.1.3 知识抽取 422
9.1.4 知识融合 423
9.1.5 知识计算 423
9.1.6 知识应用 424
9.2 领域知识图谱构建的基本方法 425
9.2.1 自顶向下的构建方法 425
9.2.2 自顶向下的构建方法 426
9.3 领域知识图谱的应用案例 428
9.3.1 电商知识图谱的构建与应用 428
9.3.2 图情知识图谱的构建与应用 431
9.3.3 生活娱乐知识图谱构建与应用:以美团为例 435
9.3.4 企业商业知识图谱的构建与应用 440
9.3.5 创投知识图谱的构建与应用 443
9.3.6 中医临床领域知识图谱的构建与应用 448
9.3.7 金融证券行业知识图谱应用实践 452
9.4 本章小结 460
参考文献 461
^ 收 起
王昊奋,上海交通大学计算机博士。中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算专委会副秘书长、上海交通大学校友会AI分会秘书长。在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。漆桂林,东南大学计算机学院教授、东南大学认知智能研究所所长、南京柯基数据科技有限公司首席科学家、OpenKG发起人之一、中国中文信息学会语言与知识计算专业委员会副主任、中国科学技术情报学会知识组织专业委员会副主任、爱思唯尔(Elsevier)数据管理顾问委员会顾问、国际期刊 Journal of Data Intelligence 执行主编。科研成果在电力故障智能检测和知识推送、医药知识问答及网络安全态势感知系统等领域得到了实际应用。陈华钧,浙江大学计算机科学与技术学院教授。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、中国人工智能学会知识工程与分布智能专业委员会副主任委员、中国中文信息学会语言与知识计算专业委员会副主任委员、OpenKG发起人。曾获国际语义网会议ISWC论文奖。
^ 收 起
^ 收 起
知识图谱是较为典型的多学科交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。本书系统地介绍知识图谱涉及的关键技术,如知识建模、关系抽取、图存储、自动推理、图谱表示学习、语义搜索、知识问答、图挖掘分析等。此外,本书还尝试将学术前沿和实战结合,让读者在掌握实际应用能力的同时对前沿技术发展有所了解。本书既适合计算机和人工智能相关的研究人员阅读,又适合在企业一线从事技术和应用开发的人员学习,还可作为高等院校计算机或人工智能专业师生的参考教材。
比价列表
1人想要
公众号、微信群
缺书网
微信公众号
微信公众号
扫码进群
实时获取购书优惠
实时获取购书优惠