《HNC理论全书:论语言概念空间的总体结构》:
第一章 概念基元总论
引言
第1节 概念基元有限性的形而上思考
(语言概念空间基本景象的描述)
本节标题后面的括号里有一个不寻常的短语—语言概念空间基本景象的描述,这个短语可简化成“语言概念空间的基本景象”,还可进一步简化成“彼山基本景象”。这些短语都更适合作本章首节的标题,但考虑再三,还是选用了现在的标题。这不是为了保持撰写风格的一致性,而是为了凸显科学探索的要害所在,对于揭秘语言脑这一极为特殊的探索,这一点乃是攸关成败的第一大事,因为,如果没有形而上思考的足够功力,是很难看清彼山的基本景象的。当然,彼山景象本身的描述非常重要,前文已经用了不少篇幅,后文还会继续这么做,本《全书》以着重描述彼山景象为己任,也有成就一部彼山专著的梦想,但毕竟孤掌难鸣,笔者将仅以披荆斩棘为满足。描述此山景象的专著早已浩如烟海,通俗读物也不乏精彩之作,如果将来能出现兼述两山景象的专著或通俗读物,那将是一件功德无量的事。
“概念无限而概念基元有限”是HNC 探索起步时的一个基本假定。该假定的提出受到两件事的启发或激励:一是黑格尔的名言—哲学的开端就是一个假定;二是汉字的“减而不增”现象,《理论》里对此有符合世界知识阐释标准的论述[*01] 。
基于“概念无限而概念基元有限”假设而得到的第一批探索成果既包括本章后续3 节所描述的内容,也包括本编第二、第三章的内容,那是20 世纪90 年代初期的事。当时,一些研究HNC 的朋友曾把这一初步成果比作“元素周期表”的发现。这个比喻一直使笔者深感不安,因为“概念无限”或许有点类似于物质结构和形态的无限,但“概念基元”不能等同于元素,而“概念基元有限性”更不能等同于“元素周期表”。
“概念基元”是什么?它是所谓的语义基元或概念节点么?这是本节必须回答的第一个问题。“概念基元”如何定义?“概念基元”与“基元概念”是什么关系?这是本节必须回答的第二个问题。“概念基元有限”是假设还是公理?公理之说的依据何在?这是本节必须回答的第三个问题。以下用3 个小节进行论述,每小节的标号方式与前两卷相同,以达到《全书》的统一。
1.1.1 概念基元不是语义基元或概念节点
“语义”是当下中国的热门词语,国家级科技项目都高举着“语义”的大旗。这一景象非常奇特,笔者也不明白其究竟,但有一点是清楚的,多年来主宰着计算语言学的语法派(理性主义)和语料库派(经验主义)都遇到了巨大的危机,传统的词法和句法分析已经难以有所作为了,基于语料库的各种统计算法(语料库语言学)已开始显露出“黔驴”的本相。双方都要寻求出路,不约而同地都求救于语义学,以为语义是一根靠得住的救命稻草。
英语词典里并没有“语义”这个词语,只有“语义学”这个词语,《现汉》也如法炮制,《现范》则反其道而行之,收录了“语义”而未收录“语义学”,因为《现范》原则上不收录带后缀“学”的三字词。《现范》对“语义”的解释十分宽泛,大大超出了《现汉》对“语义学”的解释范围。
《现范》对“语义”的解释[*02] 需要大力依靠“意义”这个通用词语,还要依靠“词汇”、“句子”、“语法”、“语用”、“语境”等专业词语,以及其他一系列通用词语(如“概念”、“交际”、“适应”等)。《现范》对“语义”的解释在形式和内容两方面似乎都十分到位,但语言脑对“语义”的理解依靠这样的解释么?这里的“依靠”既有“能不能”的问题,又有“需要不需要”的问题。不追问这两个问题是形而下思维或“一根筋”思维的习惯或表现,追问下去才是形而上思维或灵巧思维的习惯或表现,这将在下一小节细说。
下面回到本小节的主题:概念基元不是语义基元或概念节点。先说“概念基元是什么”,然后再说为什么“概念基元不是语义基元或概念节点”。
概念基元是指456 株概念树所对应的各级延伸概念,不包括概念树本身,更不包括居其上位的概念林(群)和概念范畴。延伸概念这个术语的提出较晚,笔者在使用这个术语之初也没有特意强调它的极端重要性,这是HNC 探索历程中最为遗憾的一件事。基于一种弥补最大遗憾的心情,这里特意写下对应的英语符号:extended concept ,简记为EC。
各级延伸概念的总和是有限的,本《全书》的前两卷已充分揭示了这一点。所谓“概念基元的有限性”就是指“各级延伸概念总和的有限性”。理解了这一点,才算是真正理解了HNC 理论的精髓。
但真正理解这一点并非易事,这既需要向上思考,把握“概念树-概念林-概念范畴”的有限性;又需要向下思考,把握延伸级别(纵向延伸)的有限性和同级延伸数量(横向延伸)的有限性。上行思考和下行思考都要力行齐备性和透彻性的原则(简称“透齐原则”,前两卷经常使用这个简称),这确实是“一根筋”思维习惯难以适应的。
这里的“上行思考”和“下行思考”是以概念树为参照来说的,如果以概念范畴为参照,则上述“上行思考”也变成了“下行思考”,HNC 之“概念范畴-概念林-概念树”的最终确定是上行思考与下行思考多番交织的结果,“1200 个汉字”虽然曾是此项交织思考的基本依托,但该思考的主心骨还是康德先生所强调的理性法官[*03] ,这就是说,上行思考与下行思考要在不断改变参照层级的过程中交织进行,而关键是:要善于中间切入,先上后下。一味“上而不下”者叫空想家,专注“下而不上”者叫专家,善于“中间切入,先上后下”者才是思想家。上行思考的通俗名称叫“仰望星空”,下行思考的通俗名称叫“俯瞰大地”。语言的“星空”叫作语言概念空间,简称“彼山”,描述彼山景象的东西叫原则或公理;语言的“大地”叫作自然语言空间,简称“此山”,描述此山景象的东西叫规则或定理。乔姆斯基先生虽然自视甚高,但并不明白这个关于原则与规则的区分依据或区别法则。“一根筋”思维的基本特征是:既不仰望,更不俯瞰,而是随波逐流。一个世纪以来,语言和大脑的探索是否处于随波逐流的可悲状态呢?是提出这个问题的时候了。
当然,随波逐流是一股巨大的惯性力量,是文明主体之现代化历程的心理引擎之一,也是一把双刃剑,其积极意义的一面不能抹杀。但是,许多重大的科学探索活动要力求避免随波逐流的消极面,而这项特定的“力避”非常困难,在HNC 探索的《理论》阶段,这种消极影响可谓历历在目,最典型的印迹就是“语义网络”、“语义块”、“语义距离”等术语的提出或使用。其中,“语义块”这一术语最令笔者痛心疾首,因为那个“义”字不仅是多余的,而且为害极大。
语形、语义、语用之“三语”说[*04] 是符号学对20 世纪人文社会学的一项重要贡献,但“三语”说乃是貌似体说而实为线说的典型学说,并未发展成为适用于彼山景象描述的指导理论。语形、语义、语用不过是仅供分析与归纳之用的三条线而已,不能构成符合“综合与分析+演绎与归纳”要求的三维度思考空间,因而也必然不能胜任对彼山景象的描述。语言学界曾应用“三语”说进行此山景象的描述,但收效不大。表面上似乎形成了语形学、语义学和语用学之间的分工与合作,实际上是形成了一幅独特的“推卸责任”景象,把困难(矛盾)逐级上交,语形学解决不了的问题上交给语义学,语义学解决不了的问题再上交给语用学。其结果是出现了许多有趣的责任纷争,这主要发生在语义学与语用学之间。但是,自然语言处理的基本责任究竟是什么?该项处理所面对的“劲敌”(根本问题或战略性问题)和“流寇”(枝节问题或战术性问题)[*05] 有哪些?纷争的参与者们并不明确,甚至都没有认真思考过。
语形学实际上是语法学的“老地盘”,千年老店,品牌价值无与伦比;语义学也有许多不俗的成绩,语用学更是曾风光无限,促成了20 世纪哲学研究的著名语用学转向。但品牌价值、不俗成绩和无限风光几乎丝毫无助于机器翻译遭遇的半世纪尴尬[*06] 。这是一个严酷的现实,但被一些传统的光环掩盖了。当然,不能说学界有人在刻意隐瞒什么,但实际上在起着一种掩盖作用,中国计算语言学界的表现尤为突出,林杏光先生的重庆遭遇[*aaa]就是一个非常值得反思的事件或证据。
这里应该明确告知读者:HNC 探索就是从对这一严酷现实的反思起步的,其理论目标就是试图建立一个符合“语形、语义、语用”体说要求的理论体系。当时对语义学的认识还是比较清醒的,知道它绝对没有能力独立承担起降服“劲敌”和扫荡“流寇”的重任,可是为什么《理论》竟然还是提出了“语义块”的术语呢?现在回想起来,未免感到不可理喻,因为当时已非常清楚:“语义块”不仅是语义的基元,也是语形和语用的基元,是三者的综合基元。这个“义”字添加的失误造成了巨大的贻害,现在不理解此话的读者将来会逐步明白的。
……
展开