你一定能看懂的自然语言处理(NLP)入门教程!
这是一本把读者阅读体验放在首位的中文 NLP 图书,作者采用从问题到算法再到工程实现的写作思路,只允许必不可少的公式出现,降低了读者学习的门槛,通俗易懂、容易上手。是一本可以在地铁上也能学会 NLP 开发的图书。
全书有以下特点:
1. 图文并茂,算法、公式、代码相互印证,Java 与 Python 双实现。
2. 学习路径清晰,问题导向、算法实现、工程实战,简单易懂好上手,双色印刷阅读体验佳。
3. 业内专家——工业界周明、李航、刘群、王斌、杨攀,学术界宗成庆、刘知远、张华平 联合推荐。
4. 作者何晗(@hankcs)兼具一线实战经验与硬核学术背景。自然语言处理开源项目 HanLP 作者(GitHub Star 数远超宾夕法尼亚大学的 NLTK、斯坦福大学的 CoreNLP 以及哈工大的 LTP)埃默里大学计算机博士生,研究方向是句法分析、语义分析与问答系统。
5. 随书附赠大尺寸(60CM*74CM)思维导图,提供源码下载、 GitHub 答疑,为教师提供教学讲义 PPT。读者可到图灵社区本书页面下载。
这是一本务实的入门书,助你零起点上手自然语言处理。
HanLP 作者何晗汇集多年经验,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信 息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。
随着本书的学习,你将从普通程序员晋级为机器学习工程师,最后进化到自然语言处理工程师。
近几年 NLP 的研究进入高潮。很多人都想学习 NLP 但是不知道如何开始,目前国内 NLP 领域急需更多入门好书,HanLP 作者何晗即将出版的这本《自然语言处理入门》值得一读。这本书比较系统地介绍了 NLP 的基础技术,深入浅出、容易理解,对初学者很有帮助。
——周明,微软亚洲研究院副院长,国际计算语言学会会长
自然语言处理是人工智能颇具挑战的领域,我衷心希望有更多的人能加入这个领域的技术研究、开发、应用之中。相信何晗的这本《自然语言处理入门》会对大家有很大的帮助。本书以 GitHub 开源项目 HanLP 的代码实现为基础,介绍了从分词到句法分析再到深度学习的自然语言处理基本技术。本书叙述简洁清晰,讲解透彻深入,非常适合初学者。强烈推荐!
——李航,字节跳动人工智能实验室总监,《统计学习方法》作者
作者从实践的角度用通俗易懂的语言解释自然语言处理的概念,用应用实例和类程序语言描述算法,有鲜明的特色和很强的实用性,我相信这本书会深受读者的欢迎。
——宗成庆,中国科学院自动化研究所研究员、博士生导师,《统计自然语言处理》作者
本书作者何晗原来也是一个自然语言的爱好者,现在已成为自然语言处理的专业人士,美国埃默里大学计算机科学专业的博士生。他自主开发了一套完全开放源代码的自然语言处理工具包 HanLP,受到使用者的好评。这本书依托于 HanLP 工具包,从基本的概念和原理出发,讲解了自然语言处理中一些常用的问题和算法。我相信这本书融入了作者对这个领域各项技术的深刻理解和切身体会,一定会是一本非常好的入门书。
——刘群,华为诺亚方舟实验室语音语义首席科学家
这本书不仅介绍了 NLP 的任务及算法,也提供了可以实际运行的生产级代码,非常适合 NLP 初学者入门并快速布置到生产环境。本书的文字十分流畅,连标点符号都鲜有错误,展示了作者严谨的写作态度和极强的文字能力。虽然本书深度学习相关的篇幅不多,但是了解传统的 NLP 方法能够大大提升对问题的理解能力,推荐阅读!
——王斌,小米人工智能实验室主任、NLP 首席科学家
近年来人工智能技术应用日益广泛深入,自然语言处理(NLP)也随之成为一门“显学”。作为教计算机学习理解和使用人类语言的学科,NLP 在搜索引擎、推荐系统、社会计算、智能音箱、机器翻译等几乎所有与“语言”有关的方向发挥着重要作用。由于人类语言的复杂特点, NLP 所涉及的基础知识和技术非常多,虽然国内外有一些经典的教材,但与实际应用密切结合深入浅出讲授的著作凤毛麟角。本书作者是中文 NLP 工具包 HanLP 的开发者,本书结合 HanLP 细致讲解 NLP 的关键技术,是上手 NLP 不错的读物。我非常高兴将这本书推荐给对 NLP 感兴趣的朋友们。
——刘知远,清华大学副教授,MIT“35 岁以下科技创新 35 人”中国区榜单获得者
大数据与人工智能已经成为当今世界各国的战略必争之地,自然语言处理是人工智能科学皇冠上的明珠,大数据为自然语言处理的跨越式发展提供了算源与算力基础。HanLP 吸收了我所开源的汉语分词系统 ICTCLAS 的精髓,何晗跟我深入讨论过我发表的论文,其学习能力与勤奋严谨给我留下了深刻印象。何晗结合 HanLP 宝贵的开发经验与 NLP 领域研究成果所写的这本书,是一部难得的 NLP 启蒙之作,推荐阅读。
——张华平,北京理工大学副教授、NLPIR-ICTCLAS 创始人, 钱伟长中文信息处理科学技术奖一等奖获得者
几年前,得知 HanLP 的作者何晗是上外一名非科班同学时,我很吃惊。要知道,即使科班出身,要开发一个如此完备的 NLP 工具都相当有挑战,更不用说 HanLP 在中文 NLP 开源领域还相当成功了。而今,何晗在美国就读 CS 领域的博士,他在课余时间坚持写作,结合自己的学习历程和 HanLP 的开发经验给大家呈现了一本不太一样的 NLP 入门书。我很乐意把这本书推荐给大家。
——杨攀,我爱自然语言处理(52nlp)博主,公众号 AINLP 主理人