也谈汉语“V N”类潜歧义结构

 2022-01-19 23:59:41

论文总字数:21014字

目 录

1综述 1

1.1歧义与潜歧义 1

1.1.1 歧义的界定 1

1.1.2 潜歧义的界定 1

1.2汉语歧义与潜歧义结构研究综述 1

1.2.1汉语歧义研究 1

1.2.2 汉语“V N”类潜歧义结构研究 2

1.2.3前人研究述评 2

2“V N”类歧义度调查与统计 2

2.1“V N”类歧义度调查 2

2.2调查结果统计与分析 3

3“V N”类致歧原因分析 4

3.1“V(双音节) N(双音节)”结构的致歧原因分析 4

3.1.1“V N”结构语义特征分析 4

3.1.2“V N”结构优选认知分析 5

3.2“VP N1 的 N2”结构的致歧原因分析 5

3.2.1“VP N1 的 N2”结构句法分析 6

3.2.2“VP N1 的 N2”结构语义成分制约分析 6

3.2.3“VP N1 的 N2”结构优选原因分析 7

4“V N”类歧义的消解 7

4.1 自然语言中的消歧 7

4.1.1依靠语境消歧 7

4.1.2依靠韵律消歧 8

4.1.3依靠ICM关联消歧 8

4.2 机器语言处理中的消歧 9

4.2.1基于“制约”的消歧 10

4.2.2基于“优选”的消歧 10

5余论 12

参考文献 12

附录 14

致谢 16

也谈汉语“V N”类潜歧义结构

刘星宇

,China

Abstract: As Chinese is a language that lacks morphological changes, the percentage of ambiguity in Chinese is particularly high. Phonetic and syntactic structure ambiguities are the preparatory stage of ambiguity formation, known as "latent ambiguity". In many latent ambiguities, the "V N" class of ambiguous construction is one of the most universal and representative objects of study. Based on the study of ambiguity degree, this paper analyzes the relationship between the ancestor "V N" and the extended "VP N1 de N2" from the perspective of syntactic structure and semantic control and so on. Based on the study of the causes and disambiguation methods of "V N" divergent ambiguity structure, it is innovative to explore the reasons for partial preference from the ICM cognitive perspective .With a view to the machine translation and other information processing areas,this paper may provide some helpful reference .

Key words: ambiguity degree;V N ;VP N1 de N2 ;disambiguation

1综述

歧义作为一种普遍语言现象,产生的原因很多,汉语歧义现象的研究对中文信息处理领域有重要意义,存在较高的研究价值。

1.1歧义与潜歧义

1.1.1歧义的界定

一种语言的结构是有限的,而想表达的却是无限的,所以多义现象不可避免。语言中存在大量需要用一种语言形式表达两种或更多的意思的现象,然而多义和歧义不完全相同,多义是单义发展的结果,歧义的产生既有语言因素,也有非语言因素。传统语言学界认为“多义”指词的多义,“歧义”指结构(包括句子、短语)上的多义。从朱德熙先生《汉语句法里的歧义现象》(1980)一文开始,越来越多的学者认同把歧义界定在语用层面,因为同样的结构甚至相同的词句在具体的语境下不一定产生歧义,歧义应该是在交际过程中发生的语言理解偏差,是一种动态的、连续的变化。综上,本文将歧义定义为:在自然交际中,听话人对说话人的话语有两种或两种以上的理解。

1.1.2潜歧义的界定

计算语言学家冯志伟是最早提出“潜歧义”这一概念的。冯先生《论歧义结构的潜在性》(1995)一文将脱离语境后存在理论上歧义的静态短语、句子认定为潜在歧义。叶文婷在《歧义与潜歧义——歧义的两种存在状态研究》(2006)一文中认为词汇和句法语义方面的歧义是语用歧义的准备阶段,提供了语用歧义的可能性,被视为潜在的歧义,简称“潜歧义”。叶文从潜歧义与歧义入手对歧义进行阶段性研究,避免传统切割式分类研究造成的矛盾,更有利于对歧义产生过程的系统认识。潜歧义能通过一定的触发因素变成歧义,这涉及到句子加工等中文信息处理领域,此后学者们大多将语用中的歧义与静态的潜歧义分开研究。

1.2汉语歧义与潜歧义结构研究综述

1.2.1汉语歧义研究

汉语歧义研究始于赵元任《汉语的歧义问题》(1959),他首次从语义施受分析角度讨论并分化了歧义。朱德熙《汉语句法里的歧义现象》(1980)借用结构主义语言学的分析方法,重点分析了由层次构造造成的歧义,并从语音、词汇、语法三个平面的角度对汉语的歧义现象进行比较系统的论证。吕叔湘《歧义类型》(1984)对汉语歧义现象做了详细的分类,将汉语歧义现象分为语音歧义、语义歧义、语法结构歧义和语用平面的歧义等类型。在解释致歧原因时,前人主要从本体和认知两方面进行探讨。本体方面的研究主要在沿袭朱德熙和吕叔湘等人研究思路的基础上进一步拓展研究范围和研究方法,比如沈家煊(2000)运用配价理论探讨了句式的致歧能力等。近年来,语言学界开始尝试运用心理学和认知科学的理论,研究人在自然交际中是如何消解歧义的;随着计算机网络的发展,学者又针对机器在自然语言处理中的消歧提出了很多信息处理模型,比如冯志伟(2003)对“花园幽径模型”设计了自动分析算法,彭琦(2016)设计了一种基于词频的歧义消解通用中文分词法等。

1.2.2汉语“V N”类潜歧义结构研究

虽然“潜歧义”一词出现较晚,但学界对潜歧义结构的实际研究早已有之。朱德熙《语法讲义》(1982)一书中举了“咬死了猎人的狗”这一经典案例,众多学者从语义认知、配价等各角度对此都有深入的研究,将其总结为“VP N1 的 N2”潜歧义结构。此后很多学者研究潜歧义结构,发现“V N”类潜歧义结构最具代表性。施春宏(2000)对“V N”类潜歧义结构模型进行推演,将“V N”结构作为“V N”类潜歧义结构始祖模型,一轮扩展为“V NP”型、“VP N”型、“VP NP”型,二轮对VP向右扩展为“V X”,得到“V X NP”,(X可以为动词、名词、形容词、副词.)将NP向左扩展为“X N”,得到“VP X N”,(X可以为动词、名词、形容词、副词)当两个X重合时,理论上必然会引起结构上的歧义。但施文仅作理论性的推导,对各种复杂歧义的解释涉及不多。

在解释致歧原因方面,唐依力(2011)从音节、语体、构词方式以及配价的角度分析了现代汉语“V N”定中短语中V的特性。彭静(2014)从动词的配价成分和动词本身的意义两个方面着手,解释了“V N”的施事和工具歧义。类似的纯本体研究的文章还有不少,都存在一定的局限性,所以在语言学研究越来越讲科学的今天,许多学者尝试通过实验的方法进行研究,以期得出更多有价值的成果。天津大学于秒(2012)多次利用先进的语言学实验室,采用ERP、眼动仪等对“V N”结构的消歧进行认知和神经方面的研究,方法科学,结论可信。认知科学和语言学结合的成果不仅限于研究自然语言,也对计算机处理自然语言中的潜歧义结构有很多的启发,袁毓林《基于认知的计算语言学》(2007)就将认知语言学的一些重要成果运用到中文信息处理领域。

1.2.3前人研究述评

学界对歧义现象的研究主要集中在语用方面,对于潜在歧义的研究较少。在众多潜歧义格式中“V N”类潜歧义结构最具普遍性和代表性。前人对汉语“V N”潜歧义结构的研究主要集中于语义认知和句法结构上,缺乏深层次的研究和比较分析,针对该类结构在实际语境中偏正/述宾优选倾向调查不多,对造成此优选倾向原因的研究讨论也不多见。本文拟在施春宏(2000)等前人研究的基础上,从歧义度调查出发,多角度全方位地对“V N”类歧义致歧原因进行分析,探讨具体的消歧方法,尝试创新性地从ICM认知角度探索解释偏正优选的原因,以期对“V N”类歧义结构机器翻译等信息处理方面提供一些参考性意见。

2“V N”类歧义度调查与统计

2.1“V N”类歧义度调查

早在1959年,赵元任先生在国外发表的《汉语的歧义问题》一文中就已论及歧义度的问题:“影响某一形式歧义程度的一个重要因素是各种解释的相对频率。如果各种解释的频率旗鼓相当,就是不可预期的歧义;如果相差悬殊,某种解释的频率大大超过其他解释,那么这种解释就是可预期的。”为了更好地理解什么是“歧义程度”,什么是“可预期”和“不可预期”,我们参考了尤庆学(2000)和于秒(2012)的歧义度调查方法,从前人公开发表的论文和BCC语料库中搜索到一些 “V N”类潜在歧义结构。我们选取了15个较为典型的“V N”始祖结构和5个“VP NP1 的 NP2”扩展型结构进行歧义度调查。参加此次问卷调查的是13级汉语国际教育专业的50位在校生。调查结果如下:

表1:“V N”实例相对歧义度调查统计表

短语

A义

A首频

B义

B首频

相对歧义度

参观队伍

述宾

31

偏正

19

0.61

顶嘴后妈

述宾

41

偏正

9

0.21

吹奏乐器

述宾

44

偏正

6

0.14

观赏花卉

述宾

44

偏正

6

0.14

进口食品

述宾

2

偏正

48

0.04

出租汽车

述宾

11

偏正

39

0.28

共享空间

述宾

29

偏正

21

0.72

学习本领

述宾

43

偏正

7

0.16

投资项目

述宾

29

偏正

21

0.72

推荐人员

述宾

26

偏正

24

0.92

保留意见

述宾

35

偏正

15

0.43

分析材料

述宾

26

偏正

24

0.92

测试水平

述宾

21

偏正

29

0.72

下放干部

述宾

12

偏正

38

0.31

记忆内容

述宾

18

偏正

32

0.56

表2:“VP NP1 的 NP2”实例相对歧义度调查统计表

短语

A义

A首频

B义

B首频

相对歧义度

咬死了猎人的狗

述宾

11

偏正

39

0.28

热爱人民的总理

述宾

7

偏正

43

0.16

喜欢李方的老师

述宾

10

偏正

40

0.25

守卫学校的学生

述宾

9

偏正

41

0.21

讨厌啰嗦的老张

述宾

27

偏正

23

0.85

(以上表格中相对歧义度计算方法补充说明:以“参观队伍”为例,A义为动宾,B义为偏正,首选A义的频数为31,频率为0.62,首选B义的频数为19,频率为0.38,相对歧义度=0.38/0.62=0.61。)

2.2调查结果统计与分析

剩余内容已隐藏,请支付后下载全文,论文总字数:21014字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;