(1)三位作者资历深厚,分别是阿里巴巴的数据架构师和NLP专家、百炼智能的NLP专家(前明略数据的技术合伙人和科学家)、七牛云AI实验室NLP&OCR方向负责人
阿里巴巴、前明略数据和七牛云的资深NLP专家撰写
(2)以实战为导向,绕开各种复杂数学公式与证明,确保读者零基础入门,详细讲解自然语言处理 的各种核心技术、方法论和经典算法
(3)阿里巴巴达摩院高级算法专家、百炼智能CEO、七牛云AI LAB负责人、天善智能创始人联袂推荐
自然语言处理是一门融语言学、计算机科学、数学于一体的学科,比较复杂,学习门槛高,但本书巧妙地避开了晦涩难懂的数学公式和证明,即便没有数学基础,也能零基础入门。
本书专注于中文的自然语言处理,以Python及其相关框架为工具,以实战为导向,详细讲解了自然语言处理的各种核心技术、方法论和经典算法。三位作者在人工智能、大数据和算法领域有丰富的积累和经验,是阿里巴巴、前明略数据和七牛云的资深专家。同时,本书也得到了阿里巴巴达摩院高级算法专家、七牛云AI实验室Leader等专家的高度评价和鼎力推荐。
全书一共11章,在逻辑上分为2个部分:
第一部分(第1、2、11章)
主要介绍了自然语言处理所需要了解的基础知识、前置技术、Python科学包、正则表达式以及Solr检索等。
第二部分(第5-10章)
第3~5章讲解了词法分析相关的技术,包括中文分词技术、词性标注与命名实体识别、关键词提取算法等。
第6章讲解了句法分析技术,该部分目前理论研究较多,工程实践中使用门槛相对较高,且效果多是依赖结合业务知识进行规则扩展,因此本书未做深入探讨。
第7章讲解了常用的向量化方法,这些方法常用于各种NLP任务的输入。
第8章讲解了情感分析相关的概念、场景以及一般做情感分析的流程,情感分析在很多行业都有应用。
第9章介绍了机器学习的重要概念,同时重点突出NLP常用的分类算法、聚类算法,还介绍了几个案例。
第10章节介绍了NLP中常用的一些深度学习算法,这些方法比较复杂,但是非常实用,需要读者耐心学习。
——黄英 阿里巴巴达摩院高级算法专家
目前市面上的NLP书籍,要么是针对研究人员的偏理论性的教科书,要么是针对资深工程师进一步深入了解NLP技术的高级读物。为了填补这一空白,三位来自工业界的资深NLP专家,结合真实的项目,让读者能够以很快的速度掌握NLP技术的精髓。同时,穿插大量练习,可以帮助读者反复练习课本中的知识点。所有这些内容,都是为了让读者能够解决工作中遇到的实际问题,而不仅是纸上谈兵。本书通俗易懂、操作性强。
——冯是聪博士 百炼智能创始人兼CEO/人工智能与信息检索专家
本书作者通过对现有的NLP技术以及新兴的深度学习方法进行梳理和总结,形成了自己的NLP知识体系。本书在内容上平衡了理论和技术,在每章的理论之后都配备了实践课,便于读者通过动手加深理解,避免成为只会夸夸其谈的NLP理论“专家”。本书可以帮助研究者,特别是初学者,加强对NLP的理论与技术的学习,授人以鱼的同时授人以渔,帮助读者灵活解决实际工作当中遇到的各种NLP问题。
——林亦宁 七牛云AI实验室Leader/10余年人工智能和深度学习研究
技术的发展和普及,离不开教育的推动,从商业智能到大数据,再到如今的人工智能,莫不是如此。华章是IT技术图书出版领域的领军者,天善智能是IT技术在线教育领域的佼佼者,我们都在为推动IT技术在中国甚至是世界范围内的发展贡献力量。华章与天善智能结成了非常重要的战略合作伙伴关系,本书是双方合作的一本书,后续还会有更多的作品出版,希望能对大家有所帮助。
——周剑 天善智能联合创始人&咨询总监