搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
统计自然语言处理
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787302165989
  • 作      者:
    宗成庆编著
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2008
收藏
编辑推荐
  《中文信息处理丛书·统计自然语言处理》可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
展开
作者简介
  宗成庆,1998年3月毕业于中国科学院计算技术研究所,获博士学位。1998年5月至2000年4月在中国科学院自动化研究所模式识别国家重点实验室从事博士后研究,博士后出站以后留在模式识别国家重点实验室工作至今。曾于1999年和2001年两次在日本国际电气通信基础技术研究所(ATR)做客座研究员,2004年在法国格勒诺布尔(Grenoble)信息与应用数学研究院(IMAG)做短期高访,现为模式识别国家重点实验室副主任、研究员、博士生导师。

  近几年来,他主要从事自然语言处理的理论与方法、机器翻译、人机对话系统等技术的研究和教学工作,作为项目负责人承担国家自然科学基金项目、国家“863”项目、国家支撑计划项目和国际合作项目等10余项,在Machine Translation,IEEE TASLP,ACM TALIP等国内外重要学术刊物和会议上发表论文60作篇,获多项国家发明专利。现任国际信息联合会(IFIP)人机交互技术委员会委员,亚洲自然语言处理联合会(AFNLP)执行理事,中国人工智能学会理事及自然语言处理专业委员会副主任,中国中文信息学会理事,中国科学院研究生院兼职教授,清华大学中国语言文学系讲座教授,山东大学兼职教授和北京邮电大学兼职教授,以及多个国际、国内学术期刊的编委,若干国际、国内学术会议的程序委员会主席、委员等职务。
展开
内容介绍
  本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
  本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
展开
精彩书摘
  第1章 绪论
  1.1 基本概念
  1.1.1 语言学与语音学
  我们知道,语言作为人类特有的用来表达情感,交流思想的工具,是一种特殊的社会现象,由语音、词汇和语法构成。语音和文字是构成语言的两个基本属性,语音是语言的物质外壳,文字则是记录语言的书写符号系统〔黄伯荣等,1991〕。
  根据《现代语言学词典》〔克里斯特尔,2002〕的定义,语言学(linguistics)是指对语言的科学研究。作为一门纯理论的学科,语言学在近期获得了快速发展,尤其从20世纪60年代起,已经成为一门知晓度很高的广泛教授的学科。
  根据语言学家的注意中心和兴趣范围,语言学可以区分为一些不同的分支,例如,历时语言(diachronic linguistics)或称历史语言学(historical linguistics)、共时语言学(synchronic linguistics)、一般语言学(descriptive linguistics)、理论语言学(theoretical linguistics)、描述语言学(descriptive linguistics)、对比语言学(contrastive linguistics)或类型语言学(typological linguistics)、结构语言学(structural linguistics)等。
  语音学(phonetics)是研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。语音学一般有三个分支:①发音语音学(articulatory),研究发音器官是如何产生语音的;②声学语音学(acoustic phonetics),研究口耳之间传递语音的物理属性;③听觉语音学(auditory phonetics),研究人通过耳、听觉神经和大脑对语音的知觉反应。仪器语音学(instrumendal phonetics)则是利用各种物理设备,如测量气流或分析声波的仪器等,来研究上述三个问题的任一方面〔克里斯特尔,2002〕。
展开
目录
第1章 绪论
1.1 基本概念
1.1.1 语言学与语音学
1.1.2 自然语言处理
1.1.3 关于“理解”的标准
1.2 自然语言处理研究的内容和面临的困难
1.2.1 自然语言处理研究的内容
1.2.2 自然语言处理涉及的几个层次
1.2.3 自然语言处理面临的困难
1.3 自然语言处理的基本方法及其发展
1.3.1 自然语言处理的基本方法
1.3.2 自然语言处理的发展
1.4 自然语言处理的研究现状
第2章 预备知识
2.1 概率论基本概念
2.1.1 概率
2.1.2 最大似然估计
2.1.3 条件概率
2.1.4 贝叶斯法则
2.1.5 随机变量
2.1.6 二项式分布
2.1.7 联合概率分布和条件概率分布
2.1.8 贝叶斯决策理论
2.1.9 期望和方差
2.2 信息论基本概念
2.2.1 熵
2.2.2 联合熵和条件熵
2.2.3 互信息
2.2.4 相对熵
2.2.5 交叉熵
2.2.6 困惑度
2.2.7 噪声信道模型
2.3 支持向量机
2.3.1 线性分类
2.3.2 线性不可分
2.3.3 构造核函数
第3章 形式语言与自动机
3.1 基本概念
3.1.1 图
3.1.2 树
3.1.3 字符串
3.2 形式语言
3.2.1 概述
3.2.2 形式语法的定义
3.2.3 形式语法的类型
3.2.4 CFG识别句子的派生树表示
3.3 自动机理论
3.3.1 有限自动机
3.3.2 正则文法与自动机的关系
3.3.3 上下文无关文法与下推自动机
3.3.4 图灵机
3.3.5 线性界限自动机
3.4 自动机在自然语言处理中的应用
3.4.1 单词拼写检查
3.4.2 单词形态分析
3.4.3 词性消歧
第4章 语料库与词汇知识库
4.1 语料库技术
4.1.1 概述
4.1.2 语料库语言学的发展
4.1.3 语料库的类型
4.1.4 典型语料库介绍
4.1.5 汉语语料库建设中的问题
4.2 词汇知识库
……
第5章 语言模型
第6章 隐马尔可夫模型
第7章 汉语自动分词与词性标注
第8章 句法分析
第9章 语义消歧
第10章 统计机器翻译
第11章 语音翻译
第12章 文本分类
第13章 信息检索与问答系统
第14章 自动文摘与信息抽取
第15章 口语信息处理与人机对话系统
附录 项目作业
名词术语索引
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证