第1章绪论
汉语与印欧语有类型学上的差异。印欧语有丰富的形态变化,词固有的形态标记决定了其在句法结构中所充当的句法成分,句法成分之间潜在的语义关系与其结构关系大体是一致的,计算机利用词类、句法树等资源可以比较有效地分析句法结构、语义结构,从而达到理解句子语义的目的。汉语缺乏严格意义上的形态标记,词类与句法成分之间缺乏一一对应的关系,句法语义关系与句法结构并不完全一致。一个词入句后充当何种句法成分、语义角色因句法环境而改变,汉语信息处理依靠词类、句法树、语义角色很难有效地进行句法分析、语义理解。我们必须找到一个初始的特征即词的词汇语义类,通过建立词的词汇语义类、词类、句法成分、语义角色之间的关系,以词的词汇语义类为抓手,才能有效地解决汉语句法分析、语义推导的问题。本着这样的目的,我们进行本书的研究。所谓语义角色句法实现的词汇语义制约就是指语义角色映射为句法成分时在词语语义方面所受的制约,即哪个词汇语义类的词语充当哪些语义角色时可能映射为哪些句法成分,其中有什么样的规律、特征。
语义角色的句法实现就是要研究句法与语义接口问题或者说深层的语义格如何映射为表层的句法成分的问题,也称联接理论或映射理论。该理论旨在研究句法和语义的对应规律,以及题元角色同句法论元联接的制约条件,并对它们作出合适的形式化描写。
1.1研究综述
1.1.1国外相关研究
国外对词汇语义在句法语义实现中的作用认识大致经历了无意识、不自觉相联系和积极探索三个阶段。
1.1.1.1词汇语义与句法语义关系无意识阶段
现代意义上的句法语义关系的探讨应在结构主义的鼎盛时期,乔姆斯基在《句法结构》(2022)中提到了主张建立语法需依赖于意义的学者的两条论据:主语—动词之间的语法关系(也就是把句子分析成名词组—动词组)对应于动作者—动作这一“结构意义”;动词—宾语之间的语法关系(也就是把动词组分析成动词—名词组)对应于动作—目标或动作—动作的宾语这一结构意义。
上面的“动作者”“目标”从一定意义上来说就是一种语义关系,由此可见,句法语义关系的探讨在Chomsky之前就有了,并且乔姆斯基(2022)本人也承认语言的形式和语义之间,不可否认地存在着某些对应关系,虽然这些对应关系不是十分贴切。一般认为结构主义和早期的生成语法是不考虑意义的,但句法语义关系的探讨恰恰孕育其中,这一时期Chomsky的词库只起到存放终端符号的作用。
这一阶段对句法语义的关系不够重视,句法研究和语义研究脱节,对词汇语义在句法语义实现中的作用的探讨是无意识的。
1.1.1.2词汇语义与题元角色关系不自觉相联系阶段
动词的语义特征蕴含着题元角色,这一阶段人们探讨的是题元角色如何实现为句法结构,而词汇语义则是与题元角色直接相联系的。
Gruber(1965)和Fillmore(1968)对题元角色的划分都是基于动词的词汇语义特征的,他们认为题元角色是谓项的语义特征中蕴含的某些固有语义角色。Chomsky在标准理论阶段通过把词库里的词次范畴化和添加选择限制特征来保证所生成的句子的合法性。在管约论阶段,他指出每一个论旨角色能且只能分派给一个论元,而且每一个论元有且只有一个论旨角色,这时词库里的词通过论旨角色来映射为句法成分。在*简方案中,语言只包括词库和运算系统两部分,词库明确且详细地描写进入运算过程的词汇项目的特征,制约生成句子的合法性。在这三个阶段,Chomsky的词汇语义是和论旨角色关联的,词汇语义通过论旨角色与表层结构发生关系。
1969年G.赫尔比希(G.Herbig)与W.申克尔(W.Schenkel)合编了《德语动词配价与分布词典》,他们在词典中标出了动词具有的语义特征和可词汇化的论元的语义特征,在词汇层面处理语义层到句法层的映射问题(冯志伟,2017)。
俄罗斯学者阿普列相(Апресян,1974)在界定他所说的“语义配价”时指出语义配价是从词汇意义中直接引出的,它不同于语法意义,语法意义是许多词共有的一类语法范畴的体现。语义配价直接从词的词汇意义中引出,并将这个词与其他词区别开来。语义配价赋予词的内容,即菲尔默(C.J.Fillmore)所说的“施事”“对象”“工具”等,实质上是这个词的词汇意义的一部分。
Jackendoff(1976)等立足“词汇—概念结构”观,认为题元角色是由词汇概念结构赋予某个结构位置,亦即题元是词汇的词汇蕴涵或词汇预设,词汇(谓词)语义就是题元结构、词汇概念结构的具体表现。
HPSG由C.Pollard和I.A.Sag创建,是中文信息领域一种至关重要的语法。它是以制约条件为基础的词汇主义的语法理论,词汇尤其是动词语义和词语类化特征是语言描写的重要方面,这跟Chomsky标准理论阶段的词库描写有相似之处,词汇语义是用来描述论旨角色的(转引自冯志伟,2001)。
1989年Bresnan和Kenerva提出了词汇功能语法,其中词汇映射理论集中探讨了词汇语义如何实现为句法的问题,他们认为论元结构是连接词汇语义和句法结构的纽带,词汇的语义特征只有赋予到论旨角色上才能映射为句法成分,即论旨角色是词汇语义和句法成分之间的桥梁。图1.1是词汇映射理论的示意图。
图1.1词汇映射理论示意图
这一阶段,词汇语义与论旨角色的关系是直接的,与句法成分的关系则必须通过论旨角色,是间接的。对词汇语义和句法成分关系的直接探讨将集中于下一个阶段。
1.1.1.3词汇语义和句法成分关系积极探索阶段
Pinker(1989)运用语义分解的手段从词汇语义中提取与语法相关的、能直接影响动词语法表现的语义因素,以此研究句法语义的联接机制。
Levin和Hovav(1996)提出了谓词的词汇语义表达与其论元的句法表达形式之间的映射关系是完全可以预测的假设,他们认为既然一个论元的语义角色是由选择它的谓词的意义决定的,谓词的意义在句子的句法结构上就成为决定因素。
莫斯科语义学派认为动词所要求的句法成分深层次上来源于动词词汇语义,动词语义预示了其句法搭配特点,动词表层句法特征可由其深层语义推导,在特定的意义上说明了题元的语义实质,即“语义决定论”。
这一阶段人们开始迈过题元角色,直接假设词汇语义和句法表达之间的关系,并在此基础上进行相关研究。
1.1.2国内相关研究
在国内,句法和语义的关系研究虽然较早,但将词汇语义与句法语义的关系联系起来大约是20世纪90年代的事了。
龚群虎(1996)指出,把句法—语义信息放入带“主目”的词中,不但可以解释句子的意思,而且可能实现句法和语义的接口。
陆俭明(2006a)认为,句法语义的接口问题可以有不同的研究、探索思路,但都不可忽视词语特征的研究。词语携带了丰富的句法语义信息,在很大程度上决定了它所在的句子的句法语义结构。反过来,句子之所以表现出不同于其他句子的句法语义结构,也正是因为其中所包含的某些关键词语不同。因此,重视词语的句法、语义特征的研究与描写,将是解决好句法语义接口问题的重要一步。
王葆华(2006)认为,动词为一个句子提供了复杂的句法和语义信息,决定了一个句子可能的句法结构或句法框架,也决定了那些与之共现的名词性成分的语义选择限制。动词的词汇语义在一定程度上决定了论元的句法表达。
孙道功和李葆嘉(2009)认为,“词汇语义—句法语义”的衔接是句法结构生成的关键。他们依据词汇语义(词汇义征,义场)—句法范畴义征—句法语义(句法范畴—角色)的思路,基于词汇义征和范畴义征的分析,初步揭示了动核结构中的“词汇语义—句法语义”,即词汇单位如何凭借范畴义征转化为句法范畴的衔接机制。当相关词元组合时,范畴义征虽然成为与角色衔接的环节,但是始终基于词汇语义。
以上的研究取得了骄人的成果,但还存在一些不足,表现在:①从所涉及的动词、名词类来看还是一些举例性质的,而不是全量的研究,其中分出的语义类程度、层次不同,有的是词汇语义,有的是抽象的语法意义,其结论理论意义突出,实用价值不高。②研究语料不是标注句法结构与语义结构、语义角色与句法成分、词汇语义类的对应的大规模真实文本的语料,研究结果不能反映大规模真实文本的实际状况,决定了其应用价值的局限性。
因此,我们有必要进行面向信息处理的、基于大规模真实文本标注语料库的语义角色句法实现的词汇语义制约研究。
1.2研究思路
本书研究目标是为汉语信息处理提供语义角色映射为句法成分所受词汇语义制约的具体、实用的规则、规律。为此,我们拟选取大规模真实文本的现代汉语语料,进行分词、词性、句法成分、语义角色标注,并对涉及的每个谓语动词、名词进行词汇语义类的标注,建立句法结构、语义结构、词类、句法成分、语义角色、词语词汇语义类对应的语料库,在此基础上进行归纳、统计、分析,总结出系统的语义角色映射为不同句法成分时不同词汇语义类的优先度不等式序列。
我们认为词汇语义决定了一个论元的语义角色,语义角色可以映射为句法成分,这样,词汇语义也就在一定程度上预示、决定了句法成分。一般认为动词是句子的核心,决定了其语义角色、句法结构,但句子中动词词义和名词词义是互相缠绕的,两个词汇语义单位组合的前提是有共同的义素,即句子能否成立是动词词义和名词词义共同作用的结果。词汇语义与句法语义关系图见图1.2。鉴于目前词汇语义特征提取的困难,我们选用梅家驹等编著、上海辞书出版社1983年出版的《同义词词林》的语义分类和标记体系作为词汇语义类的标注依据。
图1.2词汇语义与句法语义关系图
如图1.2所示,句法配位指语义角色可以映射为句法成分的关系,“配位”这一概念我们借用于袁毓林(1998a)的“配位方式”,他在《汉语动词的配价层级和配位方式研究》一文中指出:“为了方便,我们称动词的配项之间的这种同现选择限制以及主语宾语等句法成分对施事受事等语义成分的选择关系为配位方式(argument selection)。”语义角色和句法成分对应关系的抽象表达序列就是简缩的句模。句法填位指词汇语义类可以投射为句法语义成分(如施事主语、受事宾语)的关系,这个概念是为了研究的需要我们自己定义的一个概念,句法配位和句法填位将贯穿整个研究。投射和映射本来可以不去细分,但为了表述的明晰性,我们把语义角色和句法成分发生关系的手段称为映射,把词汇语义类和句法语义成分发生关系的手段称为投射。
从目前的语义角色自动标注研究来看,形式特征已经细化到了一定的程度,词汇语义的引入成为人们思考的一个方面,从邵艳秋等(2009)实验的结果来看,词汇语义特征对语义角色的标注有着一定的作用。建立语义角色句法实现的词汇语义制约信息库成为一条值得尝试的路。
语义角色是一个有层级的体系,由于语义角色与目标动词关系的亲疏远近并不一样,根据原型论的观点,可以把语义角色分为核心语义角色、非核心语义角色。核心语义角色与目标动词关系*为密切,不可或缺,如施事、受事等。核心语义角色一般出现在主宾语位置上,另外,“把”字句和“被”字句的状语、“和、跟、与、同、对”等介词引导的状语也往往是核心语义角色。借鉴前人的经验,根据处理语料的实际需要,我们对语义角色做如下分类,具体见表1.1。
展开