NLTK是自然语言处理领域中非常受欢迎和广泛使用的Python库。NLTK的优点在于其简单性,其中大多数复杂的自然语言处理任务使用几行代码即可实现。本书旨在讲述如何用Python和NLTK解决各种自然语言处理任务并开发机器学习方面的应用。本书首先介绍任何文本挖掘/ NLP任务中所需的所有预处理步骤,如文本的整理、清洗、语法分析、分类等,然后讲述如何使用NLTK 3进行文本处理,如标记文本、替换和校正单词、创建自定义语料库等,讨论了如何使用Python完成自然语言处理任务,如语义分析、情感分析、信息检索等。
本书适合NLP和机器学习领域的爱好者、对文本处理感兴趣的读者、想要快速学习NLTK的Python程序员以及机器学习领域的专业人士阅读。
本书包括以下主要内容
● 使用词性标注和分块的方法对文本进行整理与清洗。
● 把文本标记为句子,把句子标记为单词。
● 文本分类和情感分析。
● 字符串匹配算法和归一化方法。
● 信息检索和文本摘要的概念。
● 使用Python解决各种NLP任务的方式。
展开