首著问世|集一线AI工程师十余载之功力|揭聊天机器人技术之面纱|深入探讨对话、问答、闲聊系统|产学界大咖力荐!
聊天机器人作为人工智能技术的杀手级应用,发展得如火如荼,各种智能硬件层出不穷。《自然语言处理实践:聊天机器人技术原理与应用》系统地阐述了聊天机器人的分类和关键技术,不仅给出了实际案例,还展望了聊天机器人在通往更智能化、更人性化、更趣味化的道路上所面临的挑战。同时,针对聊天机器人在从感知智能到认知智能的跨越中所面临的难题,《自然语言处理实践:聊天机器人技术原理与应用》着重讨论了知识图谱和深度学习技术在自然语言处理、问答、推理、服务融合等方面的应用。
《自然语言处理实践:聊天机器人技术原理与应用》适合有志于从事人工智能行业,以及想了解聊天机器人到底是什么的读者阅读。
1 聊天机器人概述 1
1.1 聊天机器人的发展历史 1
1.2 聊天机器人的分类与应用场景 6
1.3 聊天机器人生态介绍 9
1.3.1 典型聊天机器人框架介绍 11
1.3.2 聊天机器人平台介绍 13
1.3.3 典型的聊天机器人产品介绍 13
1.4 参考文献 19
2 聊天机器人技术原理 20
2.1 自然语言理解 21
2.1.1 自然语言理解概览 23
2.1.2 自然语言理解基本技术 26
2.1.3 自然语言表示和基于深度学习的自然语言理解 36
2.1.4 基于知识图谱的自然语言理解 46
2.2 自然语言生成 56
2.2.1 自然语言生成综述 56
2.2.2 基于检索的自然语言生成 58
2.2.3 基于模板的自然语言生成 59
2.2.4 基于深度学习的自然语言生成 60
2.3 对话管理 61
2.4 参考文献 65
3 问答系统 67
3.1 问答系统概述 67
3.2 KBQA 系统 71
3.2.1 KBQA 系统简介 71
3.2.2 主流的KBQA 方法 79
3.3 KBQA 系统实现 96
3.3.1 系统简介 96
3.3.2 模块设计 97
3.4 参考文献 105
4 对话系统 109
4.1 对话系统概述 109
4.2 对话系统技术原理 113
4.2.1 NLU 模块 115
4.2.2 DST 模块 120
4.2.3 DPL 模块 121
4.2.4 NLG 模块 126
4.3 基于聊天机器人平台搭建对话系统 126
4.3.1 NLU 模块实现 129
4.3.2 DST 与DPL 模块实现 130
4.3.3 NLG 模块实现 131
4.4 面向任务的对话系统实现 132
4.5 参考文献 137
5 闲聊系统 139
5.1 闲聊系统概述 139
5.2 基于对话库检索的闲聊系统 140
5.2.1 基于对话库检索的闲聊系统介绍 140
5.2.2 对话库的建立 143
5.2.3 基于检索的闲聊系统实现 145
5.3 基于生成的闲聊系统 150
5.3.1 基于生成的闲聊系统介绍 150
5.3.2 生成式闲聊系统的新发展 152
5.3.3 基于生成的闲聊系统实现 155
5.4 参考文献 157
6 聊天机器人系统评测 159
6.1 问答系统评测 159
6.1.1 问答系统评测会议 160
6.1.2 问答系统评测数据集 171
6.1.3 问答系统评测标准 173
6.2 对话系统评测 174
6.2.1 对话系统评测会议 176
6.2.2 对话系统评测数据集 177
6.2.3 对话系统评测标准 178
6.3 闲聊系统评测 179
6.3.1 闲聊系统评测介绍 179
6.3.2 闲聊系统评测标准 180
6.4 参考文献 183
7 聊天机器人挑战与展望 185
7.1 开放式挑战 185
7.2 技术与应用展望 187
7.3 从聊天机器人到虚拟生命 190
7.4 参考文献 193
《自然语言处理实践:聊天机器人技术原理与应用》是一本系统地介绍聊天机器人发展历史和技术体系的书籍,可作为学者和相关企业工程师随时翻阅的案头参考书。知识图谱是聊天机器人从感知到认知突破的关键技术,本书不仅有对其基础构建和应用的解读,还有基于知识图谱的问答方面的技术分析。本书内容基本涵盖了聊天机器人的各方面研究和前沿工程进展。我力荐本书给想从事这个领域工作的年轻人阅读。
——李涓子(清华大学计算机系教授,中文信息处理学会语言认知与知识计算专委会主任)
聊天机器人,包含了自然语言处理、知识图谱、机器学习等各方面技术,是多种技术的集大成者。在本书中,作者对聊天机器人涉及的技术做了详细介绍,还对深度学习的前沿研究有所涉及。在聊天机器人发展得如火如荼的今天,本书是入门者不可多得的技术参考书。
——张民(苏州大学特聘教授,国家杰出青年科学基金获得者)
本书作者用深入浅出的文字,介绍了聊天机器人的发展和技术,通过对不同类型聊天机器人的详细阐述,让读者能够深入技术细节、尝试具体实践。举例来说,作者通过大量篇幅,介绍了一种非常重要的聊天机器人类型——对话系统,着重阐述了如何在多轮复杂场景下提升对话的性能和效果。虽然聊天机器人远未达到与人自然交流的程度,但我力荐本书给更多的学者和工程师,希望他们能进一步推动技术的突破,打磨出经典的产品。
——刘挺(哈尔滨工业大学人工智能研究院副院长、教授,国家“万人计划”科技创新领军人才)
聊天机器人有很多落地的场景,除了智能客服,还包括个人助理、智能问答及在金融、电商、教育和娱乐等垂直领域的应用。从工业界的角度看,我们更关注技术在落地时能否满足用户需求,是否有较好的用户体验,以及是否有较通用的工程实现。本书内容兼顾理论阐述和技术实践,可以使工程师在尝试技术实现时事半功倍。
——何晓冬(京东人工智能研究院常务副院长、华盛顿大学ECE系兼职教授、IEEE Fellow)
推荐序
聊天机器人是社会关系网络、自动客服、语音助手、智能音箱、游戏等的重要支撑技术,它综合应用了自然语言处理技术。自然语言处理是体现语言智能非常关键的技术,它分析、理解和生成自然语言,实现人与机器的自然交流。同时,机器翻译、自动文摘、自动写作、邮件或者短消息的自动回复也有助于人与人之间的交流。如果语言智能可以实现突破,跟它同属认知智能的知识图谱与常识推理等技术也会得到长足的发展,并推动整个人工智能体系的进步,使更多的场景落地。自然语言处理被视为人工智能“皇冠上的明珠”。要做好这项技术,达到和人一样自然的交互是非常具有挑战性的一项课题。许多积极投身于自然语言处理研究和开发的同仁,迫切需要掌握自然语言处理的基础技术,了解技术前沿。
我很高兴看到本书的出版。它系统地介绍了聊天机器人的技术体系和自然语言处理在聊天机器人中的应用,辅以案例,理论和实践结合良好。本书深入浅出的风格对不同层次的读者都有帮助。
本书由王昊奋博士和邵浩博士主导,他们二位都是从学术界跨越到工业界的年轻人,并致力于将技术应用到产品实践中。我和王昊奋在中国计算机学会术语工作委员会和自然语言专委会等组织中有紧密的合作。我认为,他不仅在学术上积极进取,还特别希望尝试把各种新技术应用到产品中。他将理论和实践相结合,多年来积累了丰富的研发经验,走出了一条独到的创新之路。本书由多位相关企业的资深技术研发人员参与撰写。因此我相信本书一定会激发大家对聊天机器人的兴趣和更深入的思考。
从本书的内容上看,除了对聊天机器人的历史发展和技术体系的阐述,重点介绍了聊天机器人的3 种典型表现形式:闲聊、对话和问答。以闲聊型聊天机器人为例,虽然基于检索的方法是目前主流的产品实现方式,但随着自然语言处理端到端技术的发展,生成式对话越来越受重视,有很多研究者尝试用生成方法解决个性化、多轮对话和安全回复等问题。同时,本书介绍了知识图谱的重要作用,因为基于知识图谱的问答也是问答型聊天机器人的重要组成部分。本书尽可能完整地展现了聊天机器人相关技术的新进展,有兴趣的读者可通过此书全面了解聊天机器人。
聊天机器人已经在智能客服、知识问答等场景里有了较好的应用,未来会在大数据、深度学习和重要场景的推动下进一步提升智能水平。我们可以畅想,在未来的某个时刻,会出现一个基于人工智能技术的虚拟生命,它能够真正理解人类的语言,有自己的记忆和情感,并可以和人进行自然真实的对话。尽管我们离这个目标尚远,但是我们可以逐步靠近。这里孕育着无穷的研究、开发机会和乐趣。我期待本书能激励更多优秀的年轻人投身其中,做出更多成就!
微软亚洲研究院副院长、国际计算语言学会主席
周明