1.5.1研究内容
本书的研究是汉语框架语义知识库整体工程的一部分,即引进、吸收框架语义理论的研究成果,面向中文信息处理应用需要,研究汉语框架语义分析问题。一方面,确立汉语词汇的框架语义知识库构建方法、句子的框架语义标注规范;另一方面,以语义标注语料为基础,根据短语类型、句法功能以及短语内、外部其他句法语义特征,归纳汉语句子中框架元素的识别规则,并通过实验验证规则的有效性。此外,为满足精确化语义理解的需要,本书还对汉语介词短语的信息处理问题进行了专门研究。
各章内容如下:
第1章评述目前国内外词汇语义知识库构建现状以及语义组合关系分析模式的设计情况,确定本研究的语义分析方法体系,明确研究内容。
第2章确立汉语框架语义范畴知识体系的构建方法。分析汉语框架语义知识库建设的语料准备、数据库结构设计和软件需求等工作路线;根据框架语义理论,制定框架和框架元素的编写原则;借助语义Web描述语言,用本体(Ontology)组织框架语义知识库内容,使之成为机器可读、可理解的词汇语义资源。
第3章以认知语义领域为例,对汉语框架及框架元素体系的构建进行实践,构拟框架一框架关系,详细解析所构建的框架和框架元素的内涵和适用范围,从中总结汉语框架语义知识库的特点。
第4章设计汉语框架语义标注的方法体系。从句法功能类型、短语类型和框架元素标注三方面对汉语框架语义标注方法加以规定,并重点讨论句法和语义不一致造成的一些特殊情况的处理方法,形成一套完整的、实用的语义标注方法体系,为汉语框架语义分析提供语料加工规范。
第5章以真实语料标注为基础,通过统计、对比等方法,分析汉语框架元素的实现规律;考查短语类型、句法功能与框架元素的对应关系,以及短语内部、外部其他形式和意义特征与框架元素的对应关系。
第6章研究框架元素标注规则的获取方法和描述形式,并以认知语义领域为例,通过对真实语料的分析归纳其框架元素标注规则,通过实验,对规则的使用效果进行定量分析和评价。
第7章研究汉语介词短语的边界划分及其框架元素识别技术。采取基于搭配模板匹配的方法和基于词性边界统计模型的方法划分短语边界,再采取基于规则的方法,对其框架元素进行自动识别,最后通过语料标注实验证明方法的有效性。
……
展开