《查询意图自动分类与分析》:
查询意图自动分类和查询意图分析是《查询意图自动分类与分析》研究的两个主要目标。其中,在查询意图分类中,基于已有工作提出的查询意图分类特征,《查询意图自动分类与分析》提出了四层面的新分类特征,且在人工标注集的基础上,实现信息类、导航类和事务类的有效区分;在查询意图分析中,主要探讨了以下三个方面:针对不同查询意图、搜索引擎的排序稳定性特征,查询个性化特征以及网络动态特征。具体而肓,《查询意图自动分类与分析》研究内容主要包括以下四个方面。
(1)查询意图自动分类。首先,在已有查询意图分类特征的基础上,提出了四层面的新分类特征。其次,基于Sogou查询日志数据集,利用人工标注数据集,在标注集基础上,利用SVM分类器实现信息类、导航类和事务类之间的有效区分,且探讨了不同层面特征以及不同查询属性对最终分类效果的影响。
(2)查询意图的搜索引擎稳定性分析。以Google、Baidu与Sogou三搜索引擎为例,通过采用已有对搜索引擎稳定性衡量的指标,分别探讨同一搜索引擎以及不同搜索引擎之间针对不同查询意图的排序稳定性。
(3)查询意图的个性化潜力分析。利用显式(人工评测)和隐式评测指标来衡量查询个性化潜力,针对两类指标,分析不同查询意图的个性化潜力,并在此基础上,分析隐式指标与显式指标的关系,以此来分析不同查询表征其个性化潜力的查询特征。
(4)查询意图的网络动态分析。分别从查询动态、文档内容动态和信息需求变化三角度出发,分析不同查询意图随时间变化所呈现的特征。然后,针对不同查询意图,分析了在不同查询动态中,其信息需求动态和文档动态变化情况。
……
展开