搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
基于语言复杂度的文本分类研究
0.00     定价 ¥ 36.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787307232464
  • 作      者:
    作者:朱浩然|责编:谢群英
  • 出 版 社 :
    武汉大学出版社
  • 出版日期:
    2022-09-01
收藏
作者简介

朱浩然,副研究员,博士生导师。华中科技大学与美国 University of Arizona联合培养博士,澳大利亚 University of Newcastle客座研究员,主要研究方向为语料库语言学、会议口译、数字人文等。在SSCI期刊上以第一作者身份发表论文成果十余篇。主持教育部人文社科项目一项,参与国家社科项目2项。曾获海峡两岸口译大赛湖北省复赛冠军、华中区决赛冠军、全球总决赛二等奖(中国大陆选手第二名),中译杯全国口译大赛华中区决赛季军。人事部(CATTI)及上海高级口译认证口译员。在硅谷武汉创业论坛、武网公开赛、世界超级计算机峰会、中欧低碳城市峰会、武汉军运会申办签约仪式等数十场国际会议中担任交传、同传译员。

展开
内容介绍
本专著详细介绍了语言复杂度作为一个多维度概念的内涵,回顾了语言学各分支所开展的语言复杂度研究,探讨了语言复杂度特征应用于文本分类的可能;详细介绍了本研究所使用的语言复杂度指标及其计算方法;简要介绍了机器学习实现文本分类的基本原理。其中以自建国际期刊英语论文语料库为数据,以布朗家族语料库以及《红楼梦》的两种英语全译本为实证案例,针对不同译本进行聚类分析。另外,本研究还深入分析了不同类型文本在各种语言复杂度维度上所体现出的语言风格,指出了存在的不足和未来的研究方向。
展开
目录
第1章 绪论
1.1 研究背景与意义
1.2 研究目标与问题
1.3 研究语料与方法
1.4 内容与结构
第2章 文献综述
2.1 语言复杂度的多个维度
2.1.1 数量
2.1.2 多样性
2.1.3 难度
2.1.4 时间
2.1.5 信息量
2.1.6 概率分布
2.2 语言学各分支的复杂度研究
2.2.1 语言类型学视域
2.2.2 二语习得视域
2.2.3 计算语言学领域
2.2.4 语言复杂度特征的应用
2.3 文本分类与语言复杂度特征
2.4 现有研究局限
第3章 计量指标与方法
3.1 词汇复杂度指标及计算
3.1.1 指标介绍
3.1.2 指标计算
3.2 句法复杂度指标及计算
3.2.1 指标介绍
3.2.2 指标计算
3.3 信息熵指标
3.3.1 指标介绍
3.3.2 词汇信息熵
3.3.3 屈折形态熵
3.4 依存语法指标
3.4.1 依存距离
3.4.2 平均依存距离
3.4.3 标准化依存距离
3.4.4 邻接依存关系比
3.5 机器学习实现文本分类的基本原理
3.5.1 机器学习文本分类流程
3.5.2 K阶最近邻算法
3.5.3 朴素贝叶斯模型
3.5.4 随机森林
3.5.5 支持向量机模型
3.5.6 主成分分析
3.5.7 聚类分析
3.6 本章小结
第4章 基于语言复杂度指标的学术英语文本分类
4.1 引言
4.2 语料与方法
4.3 实验结果
4.3.1 词汇复杂度指标分类效果
4.3.2 句法复杂度指标分类效果
4.3.3 综合复杂度指标分类效果
4.4 分类指标的区分度
4.5 三种文本分类特征的比较
4.6 本章小结
第5章 基于语言复杂度指标的通用英语体裁分类
5.1 引言
5.2 语料与方法
5.3 实验结果
5.3.1 词汇复杂度指标分类效果
5.3.2 句法复杂度指标分类效果
5.3.3 综合复杂度指标分类结果
5.4 分类指标的区分度
5.5 三种文本分类特征的比较
5.6 地域差异与历时差异分析
5.7 本章小结
第6章 基于语言复杂度指标的译者风格研究
6.1 引言
6.2 语料与方法
6.3 两译本复杂度特征聚类分析结果
6.4 三种特征聚类分析对比
6.5 两译本复杂度指标差异分析
6.5.1 词汇密度维度
6.5.2 词汇稀有度维度
6.5.3 不同单词数量维度
6.5.4 类符形符比维度
6.5.5 词汇变化度维度
6.5.6 信息熵维度
6.5.7 句子单位长度维度
6.5.8 句子复杂程度
6.5.9 依存距离维度
6.6 本章小结
第7章 结论
7.1 主要研究发现
7.2 研究启示
7.3 局限与展望
参考文献
附录1 信息熵计算文本示例
附录2 信息熵指标计算Python程序源代码
附录3 依存距离指标计算Python程序源代码
附录4 不同学科间语言复杂度指标描述性统计
附录5 不同体裁间语言复杂度指标描述性统计
附录6 四种体裁文本复杂度指标历时差异统计检验结果
附录7 四种体裁文本复杂度指标地域差异统计检验结果
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证