由于网上的信息载体主要是文本,所以信息抽取技术对于那些把互联网当成是知识来源的人来说是至关重要的.信息抽取系统可以看成是把信息从不同文档中转换成结构化数据系统。因此,成功的信息抽取系统将把互联网变成巨大的数据库。信息抽取技术是近十年来发展起来的新领域,遇到许多新的机遇和挑战.全书分两篇(原理篇共11章、应用篇共7章)。原理篇主要讨论了信息抽取(IE)概念、任务、挑战和评测方法;基于NLP、统计、认知的信息抽取方法;命名实体识别、共指消解、模板填充、Web信息抽取等。应用篇介绍了两个开发工具(GATE和WHISK),分析了IE在人机接口、电子交易、智能交通、竞争情报、问答系统、自动文摘等领域的应用。《中文信息抽取原理及应用》可作为本科高年级数据挖掘课程的参考书或研究生自然语言处理课程的教材,也可作为智能应用系统开发的参考资料。
展开