(2)关于语义信息检索研究现状
语义信息检索是在基于关键字词语匹配的传统信息检索无法满足用户需要的情况下提出来的,是智能信息检索的一个发展阶段。关于语义信息检索的研究,目前主要集中在四个方面:基于自然语义处理技术的语义检索,主要是通过对自然语言的分析来达到改善检索效果的目的;基于概念的语义检索则以用户检索词表达的概念为依据,应用该词的同义词、反义词、广义词以及狭义词同时进行检索,达到扩检、缩检的目的;基于潜在语义索引(Latent Semantic Indexing,简称LSI)方法的语义检索;基于本体的语义检索,目前国外已经开发并投入使用的基于本体的语义信息检索系统如FindUR,KIM平台②等。实践证明,基于本体的语义检索系统更能够表达语义,它可利用实例间语义关联达到快速、准确、有效地搜索知识的目的。
(3)关于引文分析研究现状
目前引文分析主要采用基于普通数据库的数理统计方法,能够获得的只是对象之间的简单直接关联;或者采用基于数据仓库的数据挖掘技术进行引文分析,即将引文数据库转化为数据仓库,采用数据挖掘技术(如关联规则挖掘、聚类分析等)发现数据仓库中隐藏的对象之间深层次关联,基于数据仓库的引文分析现在还处于实验室研究阶段。无论是数理统计分析还是数据仓库分析,它们面向结构的数据环境使得引文分析多停留在平面分析的层次上。另外,根据分析需要准备数据基础,使得数据被局限在分析需求的框架内,无法进行扩展分析。基于本体的思想进行引文数据组织,将原有面向结构的数据环境转化为面向对象的数据结构,从资源属性出发探讨资源关系,由数据驱动分析,可以得到更多具有价值的分析结论,而这些结论有可能是分析者根本想不到的。基于本体的引文分析充分利,用对象间复杂关系的数据基础,能够达到立体、全面分析的效果。目前学术界还没有学者尝试通过构建本体进行引文分析。
展开