搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
基于注疏文献的孟子信息处理研究
0.00     定价 ¥ 35.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787301320983
  • 作      者:
    作者:梁社会|责编:王铁军
  • 出 版 社 :
    北京大学出版社
  • 出版日期:
    2021-05-01
收藏
内容介绍
本书为作者主持的国家社会科学基金项目“基于注疏文献的先秦汉语语料信息处理研究”(项目批准号:15BYY096)阶段性成果。 本书主要以《孟子》及《孟子注疏》《孟子集注》《孟子正义》等《孟子》相关注疏文献为资源,对比《论语》《左传》等先秦文献的研究,对《孟子》进行了较深层次的加工和处理,尝试探索出一条基于注疏文献的《孟子》自动分词、词性标注等信息处理的新方法、新思路,研究了《孟子》及其注疏文献的句子对齐和词语对齐,《孟子》的自动分词、词性标注、词义消歧,《孟子》及其注疏的文本特征和语言风格统计,《孟子》中的排比句自动识别等问题。
展开
目录
引言
一、《孟子》及其注疏信息处理研究现状
(一)传统的《孟子》及其注疏的研究
(二)句子对齐技术研究
(三)自动分词研究
(四)词性标注研究
(五)词义消歧研究
(六)风格计算研究
(七)修辞格的识别
(八)余论
二、研究思路和研究内容
(一)研究思路
(二)研究内容
三、本书的结构安排
第一章 注疏对齐
一、注疏结构和注疏文献的作用
(一)注疏结构
(二)注疏文献的作用
二、注疏文献的平行对齐
(一)原文与引文句子对齐
(二)原文与引文注释对齐
三、本章小结
第二章 自动分词
一、先秦汉语分词规范
二、基于规则的自动分词方法
(一)最大匹配法简介
(二)词表介绍
(三)实验结果
三、基于统计模型的自动分词方法
(一)条件随机场模型
(二)CRFs分词原理
(三)基于CRFs的分词实验
四、利用注疏文献的自动分词方法
(一)利用注疏文献自动分词方法概述
(二)利用注疏文献自动分词实验
五、本章小结
第三章 词性标注
一、词性标记集的构建
(一)名词作状语
(二)其他词类活用作动词
(三)使动用法
(四)意动用法
(五)为动用法
二、基于条件随机场模型的词性标注
(一)CRFs自动词性标注原理
(二)基于CRFs的词性标注实验
(三)标注错误分析
三、利用注疏信息自动校正词性
(一)注疏文献中的词性提示信息
(二)利用去声信息的词性自动校正方法
(三)实验和分析
四、本章小结
第四章 词义消歧
一、词义消歧的概念和难点
(一)词义消歧的概念
(二)词义消歧的难点
二、词义消歧树算法消歧
(一)义项的划分
(二)上下文的有效范围
(三)消歧方法的设计
三、CRFs模型词义消歧
(一)特征的选择提取
(二)特征模板的构造
四、实验结果与分析
(一)实验的语料
(二)实验环境与测评指标
(三)两种消歧算法比较
五、本章小结
第五章 风格计算
一、文本特征及语言风格分析
(一)基于字的文本特征及语言风格统计
(二)基于词的文本特征及语言风格统计
(三)基于句子的文本特征及语言风格统计
二、排比句的自动识别
(一)排比句自动识别的算法设计
(二)实验及结果分析
三、本章小结
结语
一、本研究的主要工作
二、进一步的研究计划
附录
附录A:注疏文献中抽取出的去声字表
附录B:注疏文献中抽取出的反切字表
附录C:人工标注的《孟子》排比句
附录D:人工标注的《论语》排比句
参考文献
后记
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证