语言的概率,指的是构成整个语言系统的各种结构要素在使用频率方面所呈现出来的随机性与出现频率相关的可能性。语言符号在使用频率上既有很强的随机性,又有一定的必然性。充分利用语言概率进行语言信息处理,可以使我们在较短的时间内达到尽可能大的语言交际、语言教学和语言测试效果。
就汉语而言,语言信息处理又叫中文信息处理,包括汉字信息处理和汉语信息处理两个部分。中文信息处理,是自然语言信息处理的一个分支。现阶段的中文信息处理技术,虽有了很大的发展,但离现代化的要求还有较大的差距。许多语言信息处理技术,既需要计算机技术的不断发展,更需要从语言信息处理的角度加强对汉语本身的研究。目前,汉语信息处理在机器翻译、汉语的人机对话和中文情报检索等方面,已经取得了一定的成果。汉语信息处理,还包括言语统计、计算机辅助语言教学(编制各种语言教学软件)、汉语语音识别和言语合成、汉语照排系统、方言研究、修辞学研究(用统计的方法研究风格特征,并进行风格比较)等。
四语文现代化与语言信息处理
语言文字是一个国家主权的象征,也是民族自信心的体现。语言文字是一个民族团结的象征。语言文字是一个民族文化传统的标志。现在世界上的各个国家、民族都比以往任何时候更加珍视自己的语言文字所具有的标志性意义。
语言文字是交流的工具,也是文化的载体,承载着丰富、厚重的社会文化信息,服务于社会的经济、政治和文化,是能够产生社会效益和政治、经济、文化、科技等效益的特殊社会资源,是国家最宝贵的财富。语言是人类重要的文化资源和经济资源。当今时代,语言已经进入到经济和高新科技领域,成为经济发展的重要资源。随着信息时代的发展,语言作为经济资源的性质会体现得越来越明显,其经济意义越来越显著。
语言是人类最重要的交际工具,也是人类最重要的信息载体和信息处理工具。人类历史上的每一次信息革命都与语言息息相关,都使语言的表现产生了新的形式。从语言的本体来看,有声语言的产生是人类第一次信息革命,这是一次人类信息手段的根本性的革命。文字的产生是第二次信息革命,文字的出现使语言除了口语形式外又多了书面语的形式。造纸和印刷术的产生是第三次信息革命,这次革命的成果使得语言能够以纸的形式记录下来并得到传播,从而产生了中华民族光辉灿烂的物质文明和精神文明。通信技术的产生和发展是第四次信息革命,这次革命的成果使得语言能够以光、电、磁的形式记录下来,并得到广泛的传播,有力地推动了现代科学技术的发展。计算机的出现和发展是第五次信息革命,这次革命对语言进行数字化加工,极大地扩充了语言的各种功能。
展开