6.1 句子理解的理论
6.1.1 句子理解的经典理论
模块化模型
(1)基本假设
模块化模型的基本假设是:在句子理解过程中,句子不同维度的信息是由大脑的不同功能性模块或加工器完成的。来自词汇加工器的信息同时流向句法加工器和语义加工器,由它们分别加工自下而上输入的句法与语义信息(余林,舒华,1999)。
(2)花园路径模型
模块化模型中最有影响的是花园路径模型(garden path model),提出者是Frazier和Rayner(1982)。这个模型是因为读者或听者会被歧义句误导或引导至花园路径之中而命名。该模型提出的假设如下:
第一,对任何一个句子,开始时均只考虑一个句法结构。
第二,在选择初始的句法结构时并没有考虑语义。
第三,最简单的句法结构是基于两个一般原则而选出的:即最小修饰原则和后期闭合原则。
第四,根据最小修饰原则,产生最少节点(指一个句子的核心部分,如名词短语和动词短语)的语法结构将会受到欢迎。
第五,后期闭合原则是指如果语法允许的话,一个句子中出现的那些新词会被用来修饰短语或从句。
(3)支持花园路径模型的实验
第一,支持最小修饰原则的实验。
Frazier和Rayner(1982)的眼动实验是最小修饰原则的典型例子。
在研究中,包括了a和b两个例句。
句子a:The girl knew the answer by heart(这个女孩通过熟记知道答案的)。
句子b:The girl knew the answer was wrong(这个女孩知道这个答案是错误的)。
在句a中,“the answer”是“know”的直接宾语;在句b中,“the answer”既是内嵌句的主语,又是“know”的补语。与句a相比,句b中的补语从句结构包含一个额外的节点,结构更为复杂。当整合“the answer”时,最小修饰原则认为读者会采用较简单的分析。但当分析到“was wrong”时,发现自己误入歧途,从而放弃初始分析,进行再分析。研究者还发现,读者在处理以句子为补语的复合句时会出现加工困难,具体表现为眼睛注视时间的增加和回视比率的增大。
第二,支持后期闭合原则的实验。
Frazier和Rayner(1982)的实验也是支持后期闭合原则的经典实验。在研究中,还包括了句c和句d。
句c:Since Jay always jogs a mile seems like a short distance(由于Jay总是慢跑1英里,这似乎是不长的一段距离)。
句d:Since Jay always jogs a mile this seems like a short distance to him(由于Jay总是慢跑1英里,所以这似乎对他来说是不长的一段距离)。
对于句c来说,后期闭合原则导致“a mile”被放置于前面一个短语而不是作为后一新短语开始,这将导致一个不准确的句法结构。
对于句d来说,后期闭合原则则产生一个正确的句法结构。
(4)花园路径模型的反思
虽然花园路径模型具有许多优势,特别是它对句子加工所涉及的某些关键过程给予了相当单一和一致的解释,但是有研究者对该模型提出了质疑(M·W·艾森克,M·T·基恩,2004)。具体表现为:第一,读者和听者时常构建句子的不正确的语法结构,这会是无效率的。然而Frazier和Rayner(1982)则提出,最小修饰原则和后期闭合原则是高效率的,因为它们对读者的短时记忆所造成的负担较小。在被试阅读句子c、d时,实验者记录了被试的眼动数据。他们提出的假设是:如果读者构建两个(或全部)可能的句法结构,那么在歧义结束点的停留时间会延长。具体来说,读者在阅读句子c中的seems和句子d中的this时的注视时间会长。相反,根据花园路径模型,当运用最小修饰原则和后期闭合原则所构建的句c语法结构与实际语法结构相冲突时,在歧义结束点的反应时会延长。Frazier和Rayner记录的眼动数据支持了花园路径模型的假设。第二,语义在一个句子的语法结构的初期分配中没有起什么作用的观点似乎是站不住脚的。例如,语境研究表明这个假设不正确。根据Frisson和Pickering(1999)的观点,有充分证据表明语义因素对歧义判断具有非常迅速的效应。如果像花园路径模型这样一个有局限性的解释是正确的,那么忽视这些因素的初始阶段必须是非常短暂的。第三,对语法结构的初期选择只依赖于最小修饰原则和后期闭合原则是不太可能的。有研究者提出,对于语法结构的判断也会受到阅读时的标点符号的影响,以及听讲时的韵律特征(如音韵、重音等)的影响。
交互作用模型
(1)基本假设
交互作用模型(interactive model)假设:在句子加工过程中,句法分析器所得到的句法结构是各种信息交互作用、相互制约与满足的结果。
(2)制约—满足模型
交互作用模型中最着名的是McClelland和Kawamoto(1986)提出的制约—满足模型(constraint-satisfaction model)。该模型主张:在句子加工过程中,词汇所对应的各种句法表征会平行通达,但每个表征的通达程度受频率、语境的合适性等因素的制约。句法加工器不需要任何包含特定目的的决定原则。相反,任何符合语法的分析均可能被激活,而某个解释被激活的强度则取决于支持它的证据。最可能的句法结构解释必须满足一系列的句法、语义和语境信息的要求。词汇信息在对被激活的各种可能句法结构的判断、评价和选择过程中起着决定性作用。所形成的暂时解释,既要与当前输入的语义信息一致,同时也受句法信息的限制。而许多句法限制要么被看作是词汇性表征,要么是在词汇信息的触发下起作用。如动词后成分(即可能是补语)的句法和语义信息在动词的论元结构(argument structure)中被编码。动词被识别之后,将同时激活与其有关的论元结构,而各结构的激活强度则取决于其相对频率。因而论元和句法的信息将限制论元结构的选择,因为它们都存储于词汇性特定论元结构之中,并随动词的识别而影响句法结构的建构(余林,舒华,1999)。
花园路径模型与制约—满足模型的区别
花园路径模型与制约—满足模型的差异主要在于:在句子加工的早期过程中,对词汇信息,特别是对存储在动词中的短语类型共同发生的信息(词汇共现频率信息)的利用(余林,舒华,1999)。
花园路径模型主张,动词信息是在最初句法分析完成之后用来修正不正确的句法结构的。制约—满足模型主张,动词的偏向在句子加工之初就影响到对歧义短语的不同结构之间的选择。如果动词的偏向足够强大,而且其他来源的信息也与之不冲突,那么在歧义结构上就观察不到任何加工困难的现象。
对某些句法结构中的词汇效应,花园路径模型用快速修正效应来解释词汇的影响,但还不能系统说明,为什么在有些句法环境下词汇效应强大到足够隐蔽这一阶段的句法效应,而在另一些句法结构中却不能。而制约—满足模型则把句子加工中某些非句法线索上的异常现象解释为这些非句法线索的效应不够强大,以致不能抵消句法信息的效应。
同时作用模型
(1)基本假设
Boland(1997)提出了同时作用模型(concurrent model)。其基本假设是:承认句法加工器的自主性,即认为不管是语义还是语境,所有与自下而上句法信息一致的结构平行产生,语义信息经常被用来选择单一的句法表征。需要指出的是,该模型是对花园路径模型和制约—满足模型的综合。
(2)基本观点
同时作用模型主张:句法和语义加工并非严格有序;相反,它们同时进行,都从词典中接受输入。这一点与花园路径模型是不同的。在同时作用模型中:①亚范畴和词汇频率制约最初的结构生成,尽管这种影响并不破坏句法加工器的模块性或自主性;②句法加工器暂时建构多重句法表征;③既不允许论元加工器向句法加工器提供有吸引力的指派,也不允许论元加工器向句法分析器传送错误信号;④允许对输入的语义解释先于单一句法分析的选择。
在同时作用模型中,当每一个新词被觉察时,句法加工器自动地平行生成所有合法的结构,更新所有与自下而上输入一致的结构,排除任何不一致的结构。语义加工器将句法系统的输出作为输入。尽管语义加工器在缺乏自下而上的句法结构时能建构一个暂时的解释,但是,如果句法信息可以利用,那么将阻止语义加工器作出合理但不符合语法的解释。因为语义系统能用非句法信息从平行输入中作出选择,所以语义系统在句法歧义消解之前就能形成一个解释。当语义分析以这种方式先于句法分析时,与这一解释一致的句法结构将被选择,而不被支持的句法结构将逐渐变得不可通达。
参照支持模型
(1)基本假设
参照支持模型(referential support model)由Crain和Steedman(1985)提出。其基本假设是:来自话语的与句法有关的语用信息与句法结构的话语功能紧密联系。因此该模型能引导句法歧义消解。
(2)基本观点
根据参照支持模型,句法分析平行进行,即所有可能的句法结构平行建构。然后,读者快速选择一个其语用预先假定最符合话语的结构。如果话语中缺乏合适的信息,读者将按照经济原则,选择一个要求最少额外预先假定的结构(池莲子,张亚旭,黄永静,2006)。
参照支持模型预期话语语境能立即起作用,合适的话语语境能逆转句法优势。然而,因为主要目的在于说明正常、恰当的语境中的句子加工,该模型对局部的因素,特别是如动词题元的适合性,没有分派任何权重。这样,这类模型与基于制约的模型之间的最主要区别在于词汇信息,特别是语义和概率的信息被强调的程度。此外,尽管也假定句法系统是模块的,但是与花园路径模型所假设的序列建构句法结构不同,参照支持模型主张句法分析器是平行地输出所有符合语法的结构,高层次的过程指导最可能结构的选择。
6.1.2 句子理解的脑机制模型
句子加工的三阶段模型
研究者采用ERP、fMRI、PET等电生理和脑成像技术,对句子加工中句法和语义的关系进行了研究。基于这方面的研究结果,Friederici(2002)对传统的句法优先理论和交互作用理论进行了修改,在综合前两种理论的基础上,提出了句子加工的三阶段模型。因此该模型既包含了句子加工的时间信息,也有对应的脑功能定位信息(方小萍,刘友谊,2012)。
句子加工的三阶段模型主张句子加工分成三个阶段,每个阶段均有句法加工的参与。
阶段一,句子加工的最初阶段,主要是基于词汇类别信息的句法建构。这一过程独立于语义加工,是一个快速自动化的过程。首先,其发生时间大约在100—300ms,主要任务是根据词的类型信息形成句法结构,以ELAN/LAN的出现为标志。在许多句法违反条件下的ERP研究中,发现了一种负波,其潜伏期长短差异较大,在100—500ms之间变化,但大脑皮层分布比较一致,都出现在左半球的前部,因此将其称为左前负成分(left anterior negativity,LAN)。后来,把潜伏期较早的LAN(潜伏期在150—200ms之间)称为ELAN。有时研究者还将反映句法违反的ELAN和潜伏期较晚的LAN统称为LAN(韩宗义,吕勇,白学军,2007)。其次,功能定位在于左侧额下回岛盖部和左侧颞上回前部。Friederici和Kotz(2003)研究发现,与正常句子相比,当句子中存在词类违反而无法形成正常的句子结构时,左侧的额下回岛盖部和颞上回前部会有额外的激活。
阶段二,语义加工阶段。首先,其发生时间大约在300—500ms,主要任务是进行词的语义加工和句法形态的加工,以N400的出现为标志。在该阶段,语义加工和句法形态的加工是相互独立的,前者负责单词间的语义关系,后者负责单词间的句法关系。其次,功能定位涉及左侧额叶和颞叶的一系列脑区,其中左侧额下回的BA44/45区与句法加工有关,而靠前些的BA45/47区与语义加工有关,参与语义加工的还有左侧颞中回。
阶段三,信息的整合阶段。首先,其发生时间大约在500—1000ms,以P600的出现为标志。其次,功能定位在于左侧颞上回/颞上沟后部和基底核左侧颞叶后部。特别是当句子较复杂或者存在句法或语义的违反时,句法信息和语义信息不能迅速地整合,句子的再分析或者针对存在的错误进行修复的过程均在该阶段进行,该过程发生在左侧颞上回/颞上沟后部和基底核左侧颞叶后部。
监控假设模型
Kolk等人于2003年提出了监控假设模型(monitoring hypothesis model),主张执行控制在句子理解中起到了重要作用(Kolk,Chwilla,van Herten,& Oor,2003)。在句子加工的三阶段模型中,P600并不完全是句法加工再分析的特异性指标,语义错误但句法正确的句子同样可以产生P600,即语义P600。语义P600和句法P600的本质是相同的,其出现是人脑错误加工监测的结果。而且,这种认知冲突并不限于句法的再分析过程。在日常生活中,只要人们感知到的错误与自身的分析解释相矛盾时,就会形成冲突,导致P600出现。具体来说,在日常听、读时,人们经常会遇到感知错误的情况,然而我们最后听、读的结果很少出现错误,这是由于语言感知与语言产生类似,也有监控加工在起作用。在句子加工过程中,当通过句法分析所形成的解释与通过词汇意义联系所形成的解释之间存在冲突时,就会引发监控加工。因此,监控假设认为,P600效应反映的并不是纯粹的句法再分析加工,而是更为广泛意义上的语言理解过程中的认知监控,即认知监控系统对可能出现的加工错误的检测与解决(王瑞乐,李妮,陈宝国,2010)。
Vissers、Chwilla和Kolk(2006)探讨了荷兰语句子中出现词汇拼写错误时的ERP效应。结果发现,当把句子中高预期的关键词替换为同音假词时,会出现较大的语义P600效应。而在关键词低预期条件下,同音假词却只引发了N400效应。研究者认为,在高预期条件下,加工系统一方面试图接受同音假词,另一方面试图拒绝,这种冲突引发了P600效应。因此,Vissers等人主张P600反映了句子、词汇和概念等不同语言水平的再分析过程。这种再加工过程是由预期表征与非预期表征的强烈冲突造成的,并不是单纯的句法修复或者再建构,而是一般意义上的针对加工错误所产生的监控。被试读到语义不合理的句子时会产生P600效应,但这时,如果实验者告知被试只需要注意句法结构,那么原来出现在中央顶叶的P600就会消失,而只在大脑皮层左侧部分仍有P600出现。这说明,实验指导语降低了被试的预期冲突,被试的监控在句子加工中起到了不可忽视的作用。
非句法中心动态模型
Kuperberg(2007)提出了非句法中心动态模型(non-syntactocentric dynamic model)。该模型主张,句子加工的最初阶段并不一定是纯句法的加工过程,语义信息会进入到这一阶段中。句子加工存在着两条交互作用的加工流,即基于语义记忆的加工流(semantic memory based stream)和联合加工流(combination stream)。
语义加工流以语义记忆为基础,主要负责处理词类信息间的语义关系,并与语义记忆的存储信息相联系。如果句子中出现语义违反,那么N400就会出现。
联合加工流负责处理词汇的句法信息和题元角色的关系。如果处理的结果与我们原来储存的知识信息相悖,就会启动再分析过程,而这种再分析过程就诱发了P600。
非句法中心动态模型否定句子加工三阶段模型中句法加工的优势作用,认为语义加工流和联合加工流是共同作用的,而且不强调加工者的认知监控作用。但是,有一些研究的结果不支持该模型。例如,有ERP研究显示,单词拼写错误和句法违例都能引发P600,且大脑皮层的激活区域基本相同。而fMRI研究却显示单词拼写错误和句法违例的脑内激活区域有较大差异,虽然两者都激活了左额下回,但拼写错误还激活了右额下回、右侧枕上叶和顶叶区域以及双侧小脑等区域(Van de Meerendonk,Indefrey,Chwilla,& Kolk,2011),说明拼写错误和句法违反的脑机制并不重合。
扩展论元依存模型
Bornkessel和Schlesewsky(2006)提出扩展论元依存模型(extended argument dependency model),主张句子加工分为三个阶段(李霄翔,季月,2014)。
第一阶段:负责处理词汇范畴的句法信息。对句法加工仅限于句子加工的第一阶段,后面的两个阶段都与句法加工相独立。
第二阶段:负责动词和论元之间的关系,完成论元角色的指派。在第一阶段的基础上,读者根据论元的生命性、词序和动词特征等信息进行论元指派,并根据句子中的词汇、情景和长时记忆中的储存信息进行分析。
第三阶段:分两个过程,即总体映射(general mapping)过程和适合性分析(well-formedness)过程。总体映射过程将前两阶段的信息和加工结果进行整合,适合性分析过程按任务要求对句子形成最后的解释。
扩展论元依存模型主张,第二阶段在ERP上表现为N400。在第三阶段的两个过程中,P600都会出现,但性质不同。在总体映射过程中出现的是语义P600,在适合性分析过程中出现的是句法P600。扩展论元依存模型的优点在于指出了语义P600和句法P600的差异所在,而且有着不同的加工机制。这一模型与监控假设模型和非句法中心动态模型的差别在于它能够解释N400+P600双阶段效应。如果出现语义违例,那么第二阶段中的动词和论元之间的语义关系就发生异常,从而阻断了总体映射过程。这会导致语义P600不出现,但还是能根据任务需要进入第三阶段的适合性分析过程,出现句法P600。也就是说,N400+P600的双阶段模型是语义和句法违例的联合表征形式。然而,扩展论元依存模型并没有得到fMRI研究的支持。
另外,该模型依然无法解释句子加工判断中出现的无P600现象。根据这一模型,句法加工的第三阶段都以语义P600或句法P600的出现完成对句子的最后理解,并没有其他成分产生。但是,大量的二语句法加工研究发现,第三阶段没有出现P600效应,而是出现了负成分,或N600,甚至还出现了N400+N600的双阶段模式(Ojima,Nakata,& Kakigi,2005;Hahne,Mueller,& Clahsen,2006;Chen,Shu,Liu,Zhao,& Li,2007;季月等,2013)。
MUC模型
基于神经生物学方面的研究成果,Hagoort(2003,2005,2013)提出了MUC模型。即主张句子加工由记忆(memory)、整合(unification)、控制(control)等三个成分组成(杨玉芳,2015)。
记忆成分是指存储在长时记忆中的词汇信息,包括各类词汇(动词、名词、形容词等)的音系表征、语义信息、句法模板等内容。
整合成分是指将提取的词汇信息整合成为更复杂、更大的多词汇结构,整合不仅仅指句法结构的整合,而且在句法、语义和音系三个层面上也有发生。
控制成分涉及行为,用来说明语言系统如何在一定的背景下,将目标与行为建立联系。在语言加工过程中,需要执行控制功能的参与。例如,控制使一个人在看着他人说话的同时自己也能说话。
MUC模型主张,句法加工不一定优先于语义加工。哪种信息先出现,就对哪种信息进行加工。如果语义信息先从记忆中提取出来,就先对语义信息进行加工。如果句法信息先从记忆中提取出来,就先对句法信息进行加工。从记忆中提取出的不同层面、不同类型的语言信息相互竞争,最终达到一个平衡的状态,从而实现对句子意思的理解。
MUC模型主张,句法框架储存在记忆中,会在口语或书面语的词形输入后自动获取,与单个词条相联系的句法框架会通过动态连接进行整合,从而成为一个跨句子的结构表征。心理词典(记忆)中的每一个词条都与结构框架有关。该结构框架包括三层,分别对应于某个特定词条的可能结构环境。最上面一层是单一的短语节点(如名词短语)。第二层是功能节点,如主语、直接宾语。第一层的节点与框架中一个或多个功能节点有联系。第三层是与词条或其他框架能够相联系的短语节点。这种分析观点属于词汇语义,即主张所有的句法节点(名词短语、动词短语等)都是从心理词典中提取的。换言之,大量的句法结构都储存在记忆中,没有依据句法规则引入的额外节点。
Hagoort认为,在句子理解过程中,受输入词条时间进程的影响,这些词条被序列地提出。这样与单个词条有关的结构框架,按照输入顺序不断地进入到整合工作空间中。在工作空间中,通过整合操作而形成跨越整个句子成分的结构。这种操作包括将词汇框架与相同的节点和根节点进行连接,并检查一致性的特征(如数、阴阳性和人称等)。词汇框架之间形成的整合连接是动态产生的,即整合连接之间的强度会随着时间而变化,直到形成一个平衡的状态。由于自然语言内部存在分歧,在分析过程中的任何时间点上,其他潜伏的约束因素都会起作用。换言之,一个特定的根节点(如介词短语)经常会发现不止一个可匹配的根节点,并形成整合连接,最后形成一个短语框架。这要求在多个可能的连接的备选项中,使其中一个保持激活。这种平衡的状态是在两个或者多个可能的连接中,通过侧向抑制加工产生的。
由于激活的逐渐减弱,最近进入的根节点会比早进入整合空间的节点具有更高的激活水平。在语义和音系层面,词汇成分也会组合成为更大的结构。在语义层面,一个词汇的意义会与一个句子的表征发生整合。在音系层面,词汇成分会整合成为语调短语。在语言理解过程中,句法、语义和音系整合过程同时发生,并在一定程度上产生交互。






本书评论