搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
古籍计算机自动断句标点与自动分词标引研究
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787567610019
  • 作      者:
    黄建年著
  • 出 版 社 :
    安徽师范大学出版社
  • 出版日期:
    2013
收藏
作者简介
  黄建年(1966-),男,博士,研究馆员,先后担任图书馆办公室主任、图书馆馆长助理、物资设备处副处长等职。曾兼职担任镇江市图书馆学会学术委员会副主任,现为江苏省黄氏文化研究会(筹)常务理事。主持或者参与国家社科基金、教育部人文社科科学基金、江苏省教育厅等各类基金项目10余项,在《中国图书馆学报》、《情报学报》等发表学术论文70余篇,出版专著4部、软件2种。主要研究方向:古籍整理、数字图书馆、信息组织。
展开
内容介绍
  《中国文化典籍计算机整理与开发技术研究系列:古籍计算机自动断句标点与自动分词标引研究》侧重于自动断句标点、自动分词标引研究,兼顾古籍计算机整理与开发系统的构建与集成。作者黄建年,博士,研究馆员,现就职于南京财经大学。
展开
精彩书摘
  我国关于利用计算机进行自动标点的研究与国外研究基本上处于同一时期。1997年,北京大学计算语言研究所和北京大学古文献研究所合作开发的以《全宋诗》为对象的古诗研究取得阶段性成果。该系统通过选取任一诗作的第一句和偶句的尾字与系统中储存的韵书和押韵规则相匹配,自动判断诗作的押韵状况与韵脚,这实际上就是对诗作自动断句标点的先声。
  中国台湾陈郁夫先生在主持《古今图书集成》项目时,便想开始探索自动标点的可行性。虽难度较高,但已能对句法严整,兼有押韵的收录诗文辞赋的“艺文”和名句佳对选的“选句”,约1700余万字的韵文,进行自动标点。2000年11月在信息网络时代中日韩语文现代化国际学术研讨会上,陈先生递交的论文详细论述了古籍诗、词、赋标点的构思与技术,并演示了部分程序。
  除上述两项成果外,还有多位学者提出了自动断句标点的设想和思路。
  实际上关于利用计算机进行古籍标点的构想,并不一帆风顺,至今还存在着争论。北京大学李铎博士曾提出要自动标点《四库全书》,香港迪志公司和书同文公司邀请专家对自动标点构想进行认证,结论是:“不可能……人还不能够完全正确标点,计算机怎么可能呢?”但是,李铎博士坚持自己的看法,认为计算机并不按人的思维方式(在读懂一句话的意思之后再行标点)运行。众所周知,IBM的“深蓝电脑”能够战胜国际象棋大师,但是程序设计员却并不是国际象棋大师级高手。
  ……
展开
目录
出版说明
1 绪论
1.1 课题依据及意义
1.2 国内外研究综述
1.3 研究的主要理论与技术路线
1.3.1 断句标点
1.3.2 分词标引
1.4 研究的主要内容、结构与创新之处
1.4.1 主要內容
1.4.2 结构
1.4.3 创新之处

2 古籍计算机自动断句标点技术研究
2.1 断句标点概述
2.1.1 句读、圈点
2.1.2 断句、破句
2.1.3 标点
2.1.4 普通古籍断句标点
2.1.5 农业古籍断句标点
2.2 古籍计算机自动断句标点技术进展
2.2.1 自动断句标点的概念和意义
2.2.2 自动断句标点研究进展
2.2.3 自动断句和标点的基础
2.2.4 自动断句标点存在的问题及对策
2.3 古籍计算机自动断句标点算法、流程与功能设计
2.3.1 传统古籍断句标点方法
2.3.2 计算机辅助断句标点的主要算法
2.3.3 计算机辅助断句标点的流程设计
2.3.4 计算机断句标点的功能设计
2.3.5 计算机断句标点规则库构建
2.4 古籍计算机自动断句标点实验结果评价与展望
2.5 本章小结

3 古籍计算机自动分词标引技术研究
3.1 古籍计算机自动分词标引研究进展
3.1.1 古籍文本分词标引概念和意义
3.1.2 古籍文本分词标引研究进展
3.1.3 古籍文本分词标引的基础
3.1.4 古籍文本分词标引存在的问题及对策
3.2 古籍计算机自动分词标引的理论与关键技术研究
3.2.1 分词词典研究
3.2.2 分词系统介绍
3.3 古籍计算机自动分词标引的主要算法与流程
3.3.1 概述
3.3.2 古籍分词主要算法
3.3.3 古籍分词流程设计
3.3.4 古籍分词词典群构建
3.4 古籍计算机自动分词标引效果测试
3.4.1 数据来源
3.4.2 新词识别
3.4.3 分词结果
3.5 古籍计算机自动分词标引结果分析
3.5.1 词频等级与频次乘积研究
3.5.2 齐夫第一定律验证
3.6 古籍计算机自动分词标引结果应用
3.6.1 古籍索引编制
3.6.2 古籍词库编纂
3.6.3 同义词识别
3.6.4 自动摘要与自动标引
3.6.5 古籍自动问答系统
3.7 本章小结

4 古籍计算机整理与开发系统的构建与集成
4.1 古籍计算机整理与开发系统的研究背景
4.2 古籍计算机自动断句标点子系统
4.2.1 实验语料
4.2.2 系统功能结构
4.3 古籍计算机自动分词标引子系统
4.3.1 实验语料
4.3.2 系统功能结构
4.4 农业古籍计算机整理与开发系统设置子系统
4.4.1 用户单位设置
4.4.2 用户账号管理
4.4.3 试验数据清除
4.4.4 数据维护与备份
4.5 本章小结

5 结语
6 附录
附录一 古籍计算机自动断句样例
附录二 古籍计算机自动标点样例
附录三 古籍计算机自动分词样例
附录四 古籍计算机自动标点规则
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证