信阅平台

内容介绍

《日语语料库研究的理论与实践》结合研究实例，从理论和实践两个方面探讨了语料库在语言研究中的具体应用。内容涉及语料库研究的学科定位、理论意义、日语语料库建设的现状与不足以及语料库的设计规划等方面的诸多问题。在此基础上，运用语料库信息自动处理技术，实现了语料自动赋码、信息自动筛选和提取等各项功能，并结合具体研究课题，对其进行了实践和拓展。
《日语语料库研究的理论与实践》内容翔实，紧贴语言研究的实际，具有一定的创新性和启发意义。

展开

精彩书摘

    正是由于基于问卷调查的研究方法存在着以上不足，自20世纪80年代以来，研究者开始尝试运用存储于计算机内的大量实际语料对语言现象进行考察，涌现出大量基于语料库（corpus）的研究成果。这一方面是由于计算机技术日新月异，硬件性能不断提高，海量存储设备逐渐普及，软件在易用性方面也取得了长足进步，在很大程度上降低了研究者进入的门槛。另一方面也是由于人们对于实际语料的价值有了新的认识。
    这些研究的共同之处在于，它们都是在大量现有的出版物或口语素材中检索包含某种语言现象的实例。通过进一步的观察、分析和统计，总结出其中蕴含的客观规律。因此，从本质上看，都属于实证性研究方法。近年来，基于语料库的实证性研究已经产生了许多成果，在语法、词汇以及句法等各个领域奠定了自己稳固的地位。
    对于这种建立在观察分析自然语言现象基础上的实证性研究来说，语料库是不可或缺的研究基础。实证性研究方法在语言学研究的各个领域广受推崇也使得语料库的重要性不断提高，逐渐成为研究者不可或缺的工具之一。
    语料库一词来源于拉丁语Corpus，意为“资料的总体”。英语中的corpus一词继承了拉丁语的原意。但我们现在所说的语料库显然不再是简单的资料的集合，它被赋予了新的意义。
    Crystal（1991）认为，语料库是语言资料的集合，其资料来源既可以是书面语篇，也可以是话语的记录脚本。Sinclair（1991）将语料库定义为对自然发生的语篇的收集，目的在于描述一种状态或某种语言中的变化。Bmer（1998）认为语料库是对自然语篇大宗的、有原则的收集。顾日国（1998）则将语料库定义为放置语言材料的仓库，存放在计算机里的原始语料文本或经过加工后带有语言学信息标注的语料文本。

展开

第一部理论篇
第1章语料库研究概述
1．1 何谓“语料库”
1．2 关于语料库在语言研究中的价值的论争
1．3 “语料库语言学”和“计量语言学”的关系
1．4 “语料库语言学”质疑
1．5 小结

第2章日语语料库建设的现状及问题
2．J语料库的分类
2．2 日语语料库建设的现状
2．3 日语语料库存在的问题及原因分析
2．4 小结

第3章语料库的设计与构建
3．1 语料库的内容设计
3．2 语料库的结构设计
3．3 语料的后期加工及赋码
3．4 小结

第4章信息自动抽取技术的原理及实现
4．1 形态素自动分析和赋码
4．2 检索对象的定位
4．3 赋码的删除
4．4 小结

第5章语料库素材对结论信度的影响
5．1 语料库的规模问题
5．2 语料库素材的类型
5．3 语料库素材的时代特征
5．4 关于网上素材的使用问题
5．5 小结

第6章分析手法对结论信度的影响
6．1 如何进行科学取样
6．2 关注样本的数量问题
6．3 重视样本的时代特性
6．4 样本的分布与去伪存真
6．5 样本归纳的客观、合理
6．6 小结

第二部实践篇

第7章共时语法研究领域的应用之一
7．1 先行研究
7．2 对机能辞功能的假设
7．3 关于先行词的限制
7．4 语气层面的考察
7．5 小结

第8章共时语法研究领域的应用之二
8．1 先行研究
8．2 对先行词的初步观察
8．3 先行词的意义范畴
8．4 语气方面的考察
8．5 小结

第9章历时语法研究领域的应用之一
9．1 先行研究
9．2 使用情况的初步分析
9．3 机能辞语法化时期的判断
9．4 功能的分析
9．5 各个形态使用频率的历史变迁
9．6 小结

第10章历时语法研究领域的应用之二——对瞬间继起机能辞历史变迁的考察
10．1 表示瞬间继起关系的各机能辞间的竞争
10．2 各机能辞的核心功能
10．3 使用频率出现消长的原因分析
10．4 前后事项之间的时间关系
10．5 小结

第11章词汇研究领域的应用
11．1 引入语料库信息自动处理技术的必要性
11．2 先行研究
11．3 例句自动筛选方案
11．4 自动筛选方案二的思路
11．5 对筛选结果的分析
11．6 小结

第12章文体研究领域的应用——夏目漱石短篇小说的计量性研究
12．1 何谓“文体”
12．2 先行研究
12．3 夏目漱石短篇小说的统计结果
12．4 数据的换算
12．5 对于作品近似程度的观察
12．6 小结
附录1日本国立国语研究所研究报告一览
附录2与语料库研究有关的部分参考文献
附录3本书使用的语料库素材一览
附录4本书各章节与已发表论文的关系

展开