第1章 绪论
1.1 研究背景与意义
1.2 研究目标与问题
1.3 研究语料与方法
1.4 内容与结构
第2章 文献综述
2.1 语言复杂度的多个维度
2.1.1 数量
2.1.2 多样性
2.1.3 难度
2.1.4 时间
2.1.5 信息量
2.1.6 概率分布
2.2 语言学各分支的复杂度研究
2.2.1 语言类型学视域
2.2.2 二语习得视域
2.2.3 计算语言学领域
2.2.4 语言复杂度特征的应用
2.3 文本分类与语言复杂度特征
2.4 现有研究局限
第3章 计量指标与方法
3.1 词汇复杂度指标及计算
3.1.1 指标介绍
3.1.2 指标计算
3.2 句法复杂度指标及计算
3.2.1 指标介绍
3.2.2 指标计算
3.3 信息熵指标
3.3.1 指标介绍
3.3.2 词汇信息熵
3.3.3 屈折形态熵
3.4 依存语法指标
3.4.1 依存距离
3.4.2 平均依存距离
3.4.3 标准化依存距离
3.4.4 邻接依存关系比
3.5 机器学习实现文本分类的基本原理
3.5.1 机器学习文本分类流程
3.5.2 K阶最近邻算法
3.5.3 朴素贝叶斯模型
3.5.4 随机森林
3.5.5 支持向量机模型
3.5.6 主成分分析
3.5.7 聚类分析
3.6 本章小结
第4章 基于语言复杂度指标的学术英语文本分类
4.1 引言
4.2 语料与方法
4.3 实验结果
4.3.1 词汇复杂度指标分类效果
4.3.2 句法复杂度指标分类效果
4.3.3 综合复杂度指标分类效果
4.4 分类指标的区分度
4.5 三种文本分类特征的比较
4.6 本章小结
第5章 基于语言复杂度指标的通用英语体裁分类
5.1 引言
5.2 语料与方法
5.3 实验结果
5.3.1 词汇复杂度指标分类效果
5.3.2 句法复杂度指标分类效果
5.3.3 综合复杂度指标分类结果
5.4 分类指标的区分度
5.5 三种文本分类特征的比较
5.6 地域差异与历时差异分析
5.7 本章小结
第6章 基于语言复杂度指标的译者风格研究
6.1 引言
6.2 语料与方法
6.3 两译本复杂度特征聚类分析结果
6.4 三种特征聚类分析对比
6.5 两译本复杂度指标差异分析
6.5.1 词汇密度维度
6.5.2 词汇稀有度维度
6.5.3 不同单词数量维度
6.5.4 类符形符比维度
6.5.5 词汇变化度维度
6.5.6 信息熵维度
6.5.7 句子单位长度维度
6.5.8 句子复杂程度
6.5.9 依存距离维度
6.6 本章小结
第7章 结论
7.1 主要研究发现
7.2 研究启示
7.3 局限与展望
参考文献
附录1 信息熵计算文本示例
附录2 信息熵指标计算Python程序源代码
附录3 依存距离指标计算Python程序源代码
附录4 不同学科间语言复杂度指标描述性统计
附录5 不同体裁间语言复杂度指标描述性统计
附录6 四种体裁文本复杂度指标历时差异统计检验结果
附录7 四种体裁文本复杂度指标地域差异统计检验结果
展开