引言
一、《孟子》及其注疏信息处理研究现状
(一)传统的《孟子》及其注疏的研究
(二)句子对齐技术研究
(三)自动分词研究
(四)词性标注研究
(五)词义消歧研究
(六)风格计算研究
(七)修辞格的识别
(八)余论
二、研究思路和研究内容
(一)研究思路
(二)研究内容
三、本书的结构安排
第一章 注疏对齐
一、注疏结构和注疏文献的作用
(一)注疏结构
(二)注疏文献的作用
二、注疏文献的平行对齐
(一)原文与引文句子对齐
(二)原文与引文注释对齐
三、本章小结
第二章 自动分词
一、先秦汉语分词规范
二、基于规则的自动分词方法
(一)最大匹配法简介
(二)词表介绍
(三)实验结果
三、基于统计模型的自动分词方法
(一)条件随机场模型
(二)CRFs分词原理
(三)基于CRFs的分词实验
四、利用注疏文献的自动分词方法
(一)利用注疏文献自动分词方法概述
(二)利用注疏文献自动分词实验
五、本章小结
第三章 词性标注
一、词性标记集的构建
(一)名词作状语
(二)其他词类活用作动词
(三)使动用法
(四)意动用法
(五)为动用法
二、基于条件随机场模型的词性标注
(一)CRFs自动词性标注原理
(二)基于CRFs的词性标注实验
(三)标注错误分析
三、利用注疏信息自动校正词性
(一)注疏文献中的词性提示信息
(二)利用去声信息的词性自动校正方法
(三)实验和分析
四、本章小结
第四章 词义消歧
一、词义消歧的概念和难点
(一)词义消歧的概念
(二)词义消歧的难点
二、词义消歧树算法消歧
(一)义项的划分
(二)上下文的有效范围
(三)消歧方法的设计
三、CRFs模型词义消歧
(一)特征的选择提取
(二)特征模板的构造
四、实验结果与分析
(一)实验的语料
(二)实验环境与测评指标
(三)两种消歧算法比较
五、本章小结
第五章 风格计算
一、文本特征及语言风格分析
(一)基于字的文本特征及语言风格统计
(二)基于词的文本特征及语言风格统计
(三)基于句子的文本特征及语言风格统计
二、排比句的自动识别
(一)排比句自动识别的算法设计
(二)实验及结果分析
三、本章小结
结语
一、本研究的主要工作
二、进一步的研究计划
附录
附录A:注疏文献中抽取出的去声字表
附录B:注疏文献中抽取出的反切字表
附录C:人工标注的《孟子》排比句
附录D:人工标注的《论语》排比句
参考文献
后记
展开