5.3 汉语书写系统的词切分机制
与英语等拼音文字不同,汉语在书写形式上具有以下两个明显特点:第一,汉语以汉字为基本书写单元。汉字是一种结构复杂的方块字,不同汉字之间在视觉复杂性上迥然不同,具体表现在汉字的部件数(由笔画组成的表示语音或语义信息的组块)、笔画数以及构字方式(部件构成汉字的形式)上。第二,汉语文本由一连串汉字组成,汉字之间因自然存在的空间而有着均匀的间隔。除了以标点符号标注语义停顿和划分外,词与词之间没有其他视觉词切分线索。此外,汉语读者对词的概念较为模糊,即使是语言学家对“什么是词”这个问题也存在较大争议。鉴于汉语在书写形式上的特殊性,外加汉语读者词意识的薄弱,近年来,汉语的词切分机制成为汉语阅读研究的核心问题。对该问题的探讨和研究,不仅是揭示汉语阅读认知机制的一个关键环节,还是现代信息科学发展的要求,可以为计算机科学的中文信息处理提供科学依据。
5.3.1 视觉词切分线索在汉语读者阅读中的作用
视觉词切分线索在汉语读者阅读中的作用
在早期研究中,研究者采用了传统的研究方法来探讨词间空格这种视觉词切分线索在汉语词汇识别中的作用。例如,Liu、Yeh、Wang和Chang(1974)最早采用速示器测量识别阈限的方法进行实验。研究者要求实验组被试阅读词间空格文本,控制组被试阅读正常汉语文本。结果发现,实验组被试的阅读速度比控制组慢。研究者解释道,一种可能是被试作为汉语母语者已经适应了传统的文本呈现方式,而在句子中人为地加入词间空格改变了阅读的视觉环境,打乱了被试原有的阅读眼动习惯;另外一种可能是在速示器上测量识别阈限干扰了被试阅读,或者词间空格的插入将许多汉字置于可视区域之外,致使被试因难以看到汉字而造成阅读速度降低。
后来,杨忠明(1998)试图通过训练的方式来消除阅读习惯这一无关变量对实验结果的影响。他以小学生为研究对象,将学生分为一般阅读组与阅读障碍组,并对被试在各种词间空格比例下进行了12周的阅读训练,以尽可能减少被试已经熟悉无空格文本阅读这一习惯的影响。结果表明,词间与词内空格大小的比例变化,对一般阅读能力学生的阅读绩效没有显着影响。然而,对于阅读障碍学生的阅读绩效有显着的促进作用。因此,词间空格对阅读绩效的影响可能存在个体差异。
此外,Hsu和Huang(2000a)采用反应时记录法,操纵了词间空格大小(传统无空格文本、半角空格、全角空格)和句子难度这两个变量。结果显示,词间空格并不会影响阅读理解的正确率,但会显着地减少阅读时间。在阅读较难的句子时,词间空格会显着地增加阅读绩效。研究者认为,当文章较难,被试不熟悉文章的词汇句法结构时,空格的插入能够将词作为一个知觉单位和意义加工单元,使之明确地独立出来,便于被试阅读。在Hsu和Huang(2000b)的另一项研究中,探讨了较长语篇的难度、显示方式与词间空格对阅读绩效的影响。结果发现,词间插入空格的版面设计优于传统的标准词间距的版面设计,而且词间插入空格的形式有利于阅读难度较高、不熟悉的材料。因此,词间空格有利于提高读者阅读较难材料时的阅读绩效。
在近期研究中,研究者采用更为精密的研究工具(如眼动记录仪),综合多种眼动指标对词间空格在汉语阅读中的作用进行深入考察。例如,Inhoff、Liu、Wang和Fu(1997)最早采用眼动仪考察了汉语读者在三种呈现条件(正常无空格、词间空格和随机空格)下句子阅读的眼动情况。结果显示,在总注视时间、平均注视时间、平均眼跳幅度等眼动指标上没有出现呈现条件的主效应。对于这一结果,研究者认为可能是由一些方法学上的原因所导致的。例如,实验中所使用的眼动仪空间分辨率和采样率(50Hz)均较低,无法采集到可靠数据。空格大小的操纵本身也可能是一个潜在因素,比如因插入空格过小而导致这种无差效应。
鉴于此,Bai、Yan、Liversedge、Zang和Rayner(2008)采用精密的眼动仪(1000Hz),通过两项实验研究进一步考察了视觉词切分线索在汉语阅读中的作用。实验一包含四种条件:正常无空格条件、字间空格条件、词间空格条件和非词空格条件,如表5.1所示。

该实验的被试是大学生。在大学生阅读该语句的同时记录其眼睛运动轨迹。结果发现,各项眼动指标在词间空格条件和正常无空格条件下并无显着差异,但是在这两种条件下的阅读速度却要远远快于另外两种实验条件(包括字间空格条件以及非词空格条件)。这说明词间插入空格并未提高汉语读者的阅读速度,同时也未阻碍读者的阅读过程。需要注意的是,词间空格条件的句子长度远远长于正常无空格条件。为了控制该因素,实验二采用隔一加灰的方法来代替词间空格,用以保证四种条件下句子长度保持一致。最后发现两个实验结果保持高度一致。研究者在讨论中提到,造成该结果的一个不容忽视的现象是:汉语读者在多年的阅读中习惯了无空格切分文本,所以有可能存在不熟悉文本呈现方式和词间空格促进作用之间的权衡。
为了控制上面所述的权衡作用,沈德立等人(2010)采用相同实验范式,选用三年级小学生作为被试,继续考察词间空格在汉语阅读中的作用。之所以选择三年级小学生作为实验被试,是因为他们(相比成人)拥有相对较少的阅读中文无空格文本的经验,这样可以在一定程度上控制Bai等人(2008)实验中的权衡作用。研究结果发现,小学三年级学生表现出了和成人读者相一致的阅读模式,即人为地插入词间空格并未促进他们的阅读。当研究者将被试的阅读技能分为高、低水平时,却有了新的发现,即与阅读技能高的小学生相比,词间空格对阅读技能低的小学生的促进作用更大(见图5.1),这表明词间空格在汉语阅读中的作用受读者阅读技能高低的调节。

此外,白学军等人(2012)用相同的实验范式,考察了词间空格在老年人阅读中的作用。结果也发现,老年人阅读词间空格文本和阅读正常文本一样容易,并未表现出词间空格的促进作用。
以上三项研究表明,在汉语阅读中,人为地插入词间空格并未促进汉语读者的阅读过程。那么,它是否会影响汉语读者的眼动控制?为此,Zang、Liang、Bai、Yan和Liversedge(2013)在实验中要求一组大学生和小学生在正常无空格文本和词间空格文本条件下阅读汉语句子,随后,研究者对其注视位置进行了详细分析。结果发现,在读者的第一遍注视中,有且只有一个注视点的情况下,汉语读者的注视位置多数落在词的中间部分,表现出了典型的最佳注视位置效应,这和拼音文字的研究结果保持一致;在多次注视条件下,汉语读者的首次注视位置多数落在词的开始部分,并且儿童和成年人表现出了一致的注视位置模式,这表明汉语读者(包括成人和儿童)的注视位置并未受到词间空格的影响。即使对于汉语阅读障碍儿童,词间空格的插入也并未有效地引导他们的眼动(白学军等,2011)。
当继续考察词间空格是否促进汉语读者的词汇学习时,研究者却有了新的发现。例如,Blythe等人(2012)通过两个眼动实验考察了大学生和小学生在新词学习时词间空格所起的作用。研究者选取与大学生和二年级小学生阅读水平相对应的新词各20个(都是双字词),然后为每一个新词创设四个不同的语境,以便读者在语句阅读中形成该新词的词汇表征。一半被试在正常无空格文本中阅读新词,另一半被试在词间空格文本中阅读。为了考察词间空格的作用能否延伸到后期的阅读中去,该实验还设有一个测试阶段,所有被试在正常无空格文本中阅读与新词相关的另外一个语句(实验范式和实验材料举例见表5.2)。


(注:左图为大学生结果,右图为小学生结果。)
结果如图5.2所示:在学习阶段,不论是大学生还是小学生,词间空格均起到了显着的促进作用,表明词间空格对汉语读者的新词学习过程会起到促进作用。然而,只有小学生将词间空格在学习阶段的促进作用保持到了随后的测试阶段。这表明,与大学生相比,词间空格在小学生新词学习中起到的促进作用更大。研究者解释道,一方面有可能是由于与小学生相比,同样的新词学习任务对于阅读经验丰富的大学生来说相对简单,依据在学习阶段提供的四个语境,大学生不论是在词间空格文本还是正常无空格文本中,均已完全形成了该词汇的心理表征,所以在测试阶段,无论有无词间空格,大学生依然能够保持较高的阅读效率。然而,对于阅读经验相对贫乏的小学生读者而言,该任务会显得相对较难。在学习阶段的四个语境中,虽然小学生读者在词间空格文本中形成的词汇表征要比正常无空格文本中形成的词汇表征完全,但是在两种条件下均无形成完全的心理表征,因此词间空格的促进作用在测试阶段依然表现出来。
综上所述,词间空格这种视觉词切分线索在汉语读者的词汇识别过程中并未起到促进作用,然而,它却有效地促进了汉语读者的词汇学习,并且对阅读经验相对贫乏的小学生读者的促进作用更大。
视觉词切分线索在汉语二语学习者阅读中的作用
近年来,全世界掀起了“汉语热”。越来越多来自世界各地的人把汉语作为第二语言来学习。据国家汉办统计:截至2013年年底,已在120个国家和地区建立了440所孔子学院和646个孔子课堂,注册学员85万之多。相比之下,在2006年,仅有54个孔子学院分布在世界的30个国家和地区。依据《孔子学院发展规划(2012—2020年)》所设想的发展目标,到2015年底,全球孔子学院将达到500所,中小学孔子课堂将达到1000个,注册学生将突破150万人。虽然汉语二语学习者的人数迅猛递增,但是学习汉语并不是件容易的事情。这主要是因为和其他书写系统相比,汉语无论是在语言特点还是在书写形式上都有很大的区别。因此,研究者开始关注视觉词切分线索在汉语二语学习者进行汉语阅读时所起的作用。
Shen等人(2012)以四组母语不同(母语分别为日语、韩语、英语、泰语)的汉语二语学习者作为研究对象,探讨视觉词切分线索在汉语二语学习者阅读中的作用,同时也考察这种作用是否会受读者母语文本呈现方式的调节。在这四种母语中,泰语属于拼音文字,词与词之间没有空格;韩语和英语属于拼音文字,词与词之间有空格信息;日语相对比较特殊,平假名(hiragana)类似于拼音文字,词与词之间有空格信息,但是片假名类似于汉字,无词间空格信息。五种语言(包括中文)的呈现方式如表5.3所示。

该实验设有四种文本呈现方式:正常无空格文本、字间空格文本、词间空格文本和非词间空格文本。结果发现,插入词间空格能明显地提高汉语二语学习者的阅读速度,字间或是非词间插入空格都不同程度地阻碍了读者的阅读。此外,词间空格这种视觉词切分线索在汉语二语学习者阅读中的促进作用并没有受其母语文本呈现方式的调节。
白学军、梁菲菲等人(2012)从注视位置的角度继续对上述实验进行分析,结果发现,汉语二语学习者和汉语读者在注视位置上有着一致的趋势,即注视位置之间存在着分离现象:当第一遍阅读该词汇,有且仅有一个注视点时,汉语二语学习者倾向于注视一个词的中间部分,如图5.3a所示;当第一遍阅读该词汇,有两个或两个以上注视点时,读者倾向于注视单词的开始部分,如图5.3b所示。词间空格以及母语文本呈现方式均没有对注视位置起调节作用。随后,研究者又以印—英双语者(白学军等,2012)和日—汉双语者(郭志英,白学军,谷莉,王永胜,王丽红,2014)作为研究对象,进行了类似实验,也发现视觉词切分线索在一定程度上会促进汉语二语学习者的词汇识别,但不会有效引导他们的眼动。


近年来,研究者考察了词间空格在汉语二语学习者新词学习中的作用。例如,Bai等人(2013)选取美国留学生作为研究对象,采用与Blythe等人(2012)相同的实验范式。结果发现,视觉词切分线索在汉语二语学习者新词学习中的促进作用不仅表现在学习阶段,同样也保持到了随后的测试阶段。这和Blythe等人研究中小学二年级学生的结果相类似。然而,相比于小学生汉语母语者,词间空格在汉语二语学习者词汇学习中的促进作用表现在了更多的眼动指标上,如再注视时间、回视比率、总阅读时间和总注视次数等。由此,我们也可以看出,读者汉语阅读经验的多少的确是影响视觉词切分线索作用发挥的一个重要因素。
5.3.2 语言词切分线索在词汇识别与习得中的作用
当词间空格存在时,它作为一种视觉词切分线索在读者的词切分过程中发挥着重大作用。当词间空格不存在时,读者可以利用一些语言线索进行词切分,例如泰语读者在其阅读过程中,可以熟练利用元音特性、音调符号、字母位置概率等语言线索进行词切分。汉语读者同样如此。研究者已经发现汉字的偏向位置信息和成词概率是汉语阅读中两种有效的词切分线索。
偏向位置信息
所谓汉字的偏向位置信息,是指一部分汉字在多字词中的固定位置(如词首、词中或词尾),或是偏向用于词的某个位置的现象。拿双字词来举例,“各”可以组成29个不同的双字词,如“各位”、“各家”、“各路”等。在这29个双字词中,“各”都用在词首,我们就称“各”字的偏向位置是词首。另外,如果一个汉字常常用在某个词的特定位置,我们也可以说这个汉字携带了特定的偏向位置信息。例如,在“巨”构成的29个双字词中,“巨”位于词首的双字词个数为28个,如“巨大”、“巨轮”、“巨款”等;相比之下,“巨”位于词尾的双字词个数只有1个,如“艰巨”。我们就认为“巨”字的偏向位置是词首。据统计,在5915个常用汉字中,约20%的汉字在多字词中有着固定位置或者仅可以用作单字词(2.1%的汉字仅仅可以作为单字词来使用,如“咦”、“喂”等;
8.2%的汉字仅仅用在多字词的开始而不能用在结尾,如“咨询”的“咨”;
7.5%的汉字只能用在词尾而不能用在词首,如“衣裳”的“裳”)。这意味着,当这些汉字在语篇中出现时,会给读者提供明确的词边界信息,如“主持人请各位获奖选手上台领奖”,由于“各”只能用在词首,因此,“各”字的出现意味着上个词的结束,下个词的开始。
Yen、Radach、Tzeng和Tsai(2012)考察了汉语阅读中词素的偏向位置信息是否是一种有效的语言词切分线索。研究者将双字词作为目标词(C12),将其嵌在句子中以供被试阅读。其中,研究者操纵了目标词尾字(C2)的词素位置概率,即一半的尾字经常用在词首,另一半尾字则经常用在词尾。此外,研究者采用边界范式同时操纵了目标词后的第一个字(C3),即三种副中央凹预视条件:相同预视条件(C3为单字词)、模糊预视条件(C23是一个双字词)和控制条件。结果发现,当汉字在双字词中的位置与其偏向位置不相符时,会延长读者在词上的凝视时间,同时也会增加读者对该词的再注视概率。这表明词素的偏向位置信息的确是一种行之有效的语言词切分线索。此外,词素的偏向位置信息并未在三种不同预视条件下出现显着差异,这也表明词素的偏向位置信息未涉及副中央凹的加工,而主要涉及中央凹加工。
既然词素的偏向位置信息是一种有效的语言词切分线索,那么,它和视觉词切分线索如何共同作用于汉语阅读的词汇学习?Liang等人(2015)通过两项实验研究对该问题进行了详细探讨。在该实验中,研究者操纵词素的偏向位置信息这一变量,构成以下三类新词:(1)一致性条件,即首词素经常用在词首,尾词素经常用在词尾;(2)不一致性条件,即首词素经常用在词尾,尾词素经常用在词首;(3)平衡条件,即首词素和尾词素用在词首和词尾的比率都是50%。将每一新词放在六个不同的语句中,以供被试理解该新词的含义,其中三个语句在学习阶段呈现,三个语句在测试阶段呈现。在学习阶段,一半被试在正常无空格文本条件下阅读;另一半被试在空格文本条件下阅读。在测试阶段,所有被试均在无空格文本条件下阅读。此外,在测试阶段,除包含新词的三个句子之外,还设有一个多项语义类别选择题目,要求被试在十个类别中选出该新词所属的语义类别,以此来考察被试是否获得了新词的语义类别信息。实验范式和实验材料如表5.4所示。

研究结果发现,新词类型的主效应显着,即不论是大学生还是小学生,在一致条件下的阅读时间都要短于不一致条件,这表明汉语读者在新词学习过程中可以利用词素的偏向位置信息进行词切分。但是,小学生利用这种语言词切分线索的能力要低于大学生。另外学习组和测试阶段的交互作用显着,即不论是大学生还是小学生,在词汇学习的早期阶段,词间空格这种视觉词切分线索均起到促进作用,但是并未保持到随后的测试阶段。这项研究最为重要的一个发现是,新词类型和学习组之间在所有眼动指标上都未表现出交互作用,这表明词素的偏向位置信息和词间空格对于中文阅读词切分的作用方式是系列累加,而非交互作用。
成词概率
和英语相类似,汉语词长也不固定。据最新的汉语词汇语料库统计(Cai & Brysbaert,2010),仅仅考虑词长这一因素,单字词、双字词、三字词和四字词所占比例依次为5%、46%、25%、12%。如果同时考虑使用频率,那么单字词和双字词所占比例分别为64%、34%。这意味着虽然在汉语词汇中,双字词所占的比例最高,但是在汉语文本阅读中,超过60%的词是单字词。也就是说,汉语阅读中单字词的使用频率最高。因此,在汉语阅读中,单字词的出现意味着该词的结束和下一个相邻词的开始。那么汉语读者是否会利用单字词的这种特性来完成词切分过程?
Zang等人(2016)采用边界范式,通过记录44名大学生的眼动轨迹,探讨了汉语读者是否会利用汉字的成词概率(即一个字作为单字词的概率)进行词切分以及成词概率是否会影响对下一个字的预视效应。在该实验中,研究者选取了96个双字词作为目标词,一半目标词的首字成为单字词的概率较高(平均数为84.5%);一半目标词的首字成为单字词的概率较低(平均数为10%)。将目标词嵌在语境中以供被试阅读。结果发现,当首字成为单字词概率较高时,读者对第二个汉字的预示效应显着减小。该研究结果表明,汉字的成词概率这一信息是调节预示效应的重要因素,同时也表明汉语读者会利用这一信息进行词切分。
综上所述,汉字的偏向位置信息和成词概率是汉语阅读中两种有效的词切分线索。那么,这两种线索如何作用于汉语阅读的词切分,汉语读者又是如何在阅读过程中习得这两种词切分线索的?这些问题都有待于进一步的研究。
5.3.3 汉语阅读词切分的认知过程
在汉语阅读中,由于词与词之间没有视觉词切分线索的存在,经常会发生词汇重叠现象。例如,在“花生长在屋后的田里”这一句子中,“生”字可以与“花”组合在一起,形成双字词“花生”,这样该句子就变成“花生/长在屋后的田里”;此外,“生”字可以与长组合在一起,形成双字词“生长”,于是该句子就变成“花/生长在屋后的田里”。至于哪种切分是正确的,则依赖于上下文的语境信息。据统计发现(Yen,Radach,Tzeng,& Tsai,2012),约3.6%的汉字既可以和其左边的汉字构成双字词,也可以和其右边的汉字构成双字词。那么,汉语读者如何在阅读过程中对模糊词进行切分,就成为一个关键且有趣的问题。研究者对此作了以下相关研究。
Perfetti和Tan(1999)认为汉语读者有可能利用“双字词组合策略”(two-character assemly strategy)来切分模糊词汇。根据这一观点,汉语读者倾向于将相邻的汉字组合成一个词。如果相邻的两个汉字可以构成一个双字词,那么这个词就会存储在工作记忆中,并不再参与接下来的词切分。为了检验这一观点,Perfetti等人将模糊词(其正确词切分是“A—BC”)嵌在语境中供被试阅读。例如,把“照顾客”嵌在句子“经理同意照顾客的想法来设计产品”中。此外,该实验还设有控制条件。在控制条件中,除了用近义词来代替模糊词以外,其余部分与实验句相同,如“经理同意按照顾客的想法来设计产品”。研究发现,模糊词后的句子总阅读时间要长于控制条件。对此,研究者认为,被试有可能首先采用“AB—C”的切分策略进行切分,由于该切分不符合语境,他们不得不根据接下来的语境来对首次切分进行更正,这样就会增加后半部分句子的加工难度,因此花费更长的加工时间。该研究结果支持了“双字词组合策略”这一观点。
Inhoff和Wu(2005)在此基础上提出并检验了模糊词加工的两种可能方式:单向切分假设(unidirectional parsing hypothesis)和多重激活假设(multiple activation hypothesis)。单向切分假设是指知觉广度范围内的汉字都会被激活,这些汉字能否组成词则严格按照序列方式,从左向右逐步进行。以四字序列ABCD为例,所有汉字被激活后,系统先确定AB是否是一个词。如果AB是词,然后确定ABC是否是一个三字词。如果ABC是词,那么ABC将会被选择;如果不是词,AB会被选择。系统确定了上一个词的组成后,开始加工下一个词。接着从已确定词的下一个汉字开始组词,即如果ABC是词,则从D开始;如果AB是词,则从C开始。多重激活假设认为知觉广度内所有与邻近字构成的词都会被平行激活,读者根据文本背景选择合适的词汇表征并抑制不合适的,最终完成词切分过程。仍以四字序列ABCD为例,假定AB、BC和CD都可构成词,但只有AB和CD符合文本背景,BC不符合文本背景。多重激活假设预测AB、BC和CD同时被激活,但是BC随后被抑制(吴俊,2008)。为了检验这两种假设,Inhoff等人在研究中,采用了两种类型的汉语四字序列:在模糊条件下,AB、BC和CD都是双字词(如在“专科学生”中,“专科”、“科学”、“学生”都是词),但只有AB和CD(“专科”、“学生”)符合文本背景;在非模糊条件下,只有AB和CD是词,BC不是词(如“专科毕业”是两个词:“专科”和“毕业”),这两个词都符合文本背景。结果发现,汉语读者在模糊条件下的ABCD区和BC区上的凝视时间和总注视时间显着长于非模糊条件,表明虽然BC不符合语境,但是仍然在一定程度上被激活。该结果证明知觉广度范围内的所有词都在一定程度上被激活,因此符合多重激活假设的假设,而非单向切分假设。
虽然以上研究初步证明了模糊词是基于多重激活假设的一种加工,然而,当知觉广度范围内的所有词都被激活时,它们是如何进行竞争的,这一问题有待于进一步研究。Ma、Li和Rayner(2014)在前期相关文献的基础上,提出三种可能假设:第一,左边优先假设(left-priority hypothesis)。该假设认为,由于在阅读中遵循着从左到右的顺序,因此保证左边词的优先加工可以保证所有词汇按照正常顺序进行加工。该假设符合E-Z读者模型的基本假设。第二,独立加工假设(independent processing hypothesis)。该假设认为,在ABC三字序列中,词AB和词BC首先被平行激活,但此时二者不会存在任何竞争。至于汉字B究竟属于左边词还是右边词,取决于随后的句子语境和语义信息。该假设和当前较为流行的眼动控制模型SWIFT的基本假设保持一致。第三,竞争假设(competition hypothesis)。该假设认为,知觉广度范围内的所有词都会被激活,这些词相互竞争,最后,被激活程度最高的词将胜出,进而被识别。
Ma等人通过三个实验检验了这三种假设。实验一采用部分报告任务检验了“左边优先假设”的正确性。研究者选取44个多音字作为目标字,并将其作为中间字构造由三个汉字组成的汉字串(目标字处于中间位置),例如“卫校订”。在一半的三字序列中,左边词的词频高于右边词;在另一半中,右边词的词频高于左边词。在实验中,三字串呈现80ms之后消失,随后,目标字呈现在屏幕上,要求被试输入中间汉字的拼音和声调。结果发现,读者倾向于将中间字和右边相邻字结合,而不是左边相邻字。该结果并不支持“左边优先假设”。在实验二中,研究者将三字串放在语境中,通过记录被试的眼动轨迹来检验“独立加工假设”的正确性。其中,“AB”和“BC”都是双字词:一种条件下“BC”为低频词,一种条件下“BC”为高频词。所不变的是,不论在哪种条件下,“AB”都是高频词。结果发现,在“AB”区域内,BC高频条件下的首次注视时间和凝视时间显着长于BC低频条件。该研究结果有悖于“独立加工假设”的预测,表明在词汇重叠词的切分和识别过程中,前后词是相互竞争的。实验三在同一个实验中同时检验了这三种假设。在该实验中有四种条件:低—高频A—BC条件、低—高频AB—C条件、高—低频A—BC条件和高—低频AB—C条件,实验材料如图5.4所示。

结果发现,在句子阅读过程中加工模糊词汇重叠现象时,高频词胜出的几率远远高于低频词。一旦这种切分方式符合语境,将会缩短对该区域的重读时间。该研究结果表明,当读者的首次切分和整体语境一致时,加工会变得相对容易,进而证明了“竞争假设”的正确性。综上所述,这三个实验均证明了“竞争假设”的正确性,表明汉语读者在加工模糊词汇重叠现象时,知觉范围内的所有词均会被激活,至于谁最后胜出,则取决于相互竞争的结果。激活程度最高的词条将会胜出,同时其他词条会被抑制。由此,研究者认为,汉语阅读的词切分包括两个过程:词汇识别和语境整合。在词汇识别过程,基于刺激的个别属性(如词频)等起了重要作用。随后,读者会根据语境信息对早期的切分过程进行检验,如果早期切分符合语境信息,则被保留;如果早期切分不符合语境信息,则会被重新切分。该观点对汉语阅读的词切分认知机理有重要启示。
此外,研究者(张智君,刘志方,赵亚军,季靖,2012)通过分析动态协助或干扰词切分对阅读过程的影响,对汉语阅读词切分的位置与数量进行了考察。实验一通过改变相应兴趣区域内文字的颜色,将目标词显现出来,从而在文本中形成一个物理边界,以此达到促进相应词汇加工的目的。共包括四个实验条件:(1)条件1,词n与其左侧文本字体由红变黑,此操作有助于将词n从其后面的文本中切分出来;(2)条件2,词n+1与其左侧文本字体由红变黑,此操作有助于将词n+1从其后面的文本中切分出来;(3)条件3,仅词n的字体由红变黑,此操作可排除词n两侧文字的干扰;(4)控制条件,即正常呈现的红色字体句子。结果如表5.5所示,条件2的平均凝视时间和再注视兴趣区数显着低于控制条件,跳读次数则显着多于控制条件,说明该条件加速了词n+1的激活,该结果表明至少加工词n+1时可导致词切分效果。然而,实验一并不能排除如下解释,即条件2中发现的较短平均凝视时间和较少的再注视也可能是由词n+1文本颜色改变导致外源性注意引导眼球运动所致。

因此,实验二旨在通过干扰词汇加工进程,即通过提供词切分的反面证据,排除实验一得到的结果完全是外源性注意引导眼球运动所致的可能性。该实验同样设有和实验一类似的四个实验条件(三种实验处理,一种正常显示)。所不同的是,在实验二中,研究者将所有兴趣区向左平移一个字的距离,从而将本来不属于同一词的两个字划分到一个兴趣区(句首和句末兴趣区内仅保留一个汉字)。这样,实验二的三种处理不仅不能协助相应的词切分,反而会对词切分产生干扰。如果实验一的结果可以归因于外源性注意的影响,那么实验二将能获得与实验一相似的数据模式,否则将不支持外源性注意效应的解释。结果发现,被试在条件2中的凝视时间与控制条件相比无显着差异,跳读次数却显着多于控制条件。实验一、二中条件2的眼动数据均与正常呈现之间差异模式不同,说明实验一得到的结果不是由外源性注意引导眼动所致。综合两项实验结果,得出如下结论:汉语读者在阅读过程中不仅能对词n进行切分,同时也有可能对词n+1进行切分,即汉语阅读的词切分是并行加工,而非串行加工的。
5.3.4 词切分和词识别模型
一些研究者在实验论证和理论假设的基础上,尝试通过构建模型来解释词切分过程。例如,Hoosain(1991)认为词的切分过程需要读者自身的语言知识、语境加工等来协助才能完成一个个词的切分。这些一个个的词单元再组合成多种多样的句子。按照这种方式,一个个独立的汉字识别的平行加工过程隶属于词的识别,读者从自上而下和自下而上过程中获取足够多的信息,才能完成词的切分。Perfetti和Tan(1999)采用花园路径句子材料,发现汉语读者更倾向于将系列汉字串切分成由两个汉字组成的单元,而不是将每一个汉字都看作一个词。因而,他们提出读者在阅读中文句子时,倾向于采用“双字词组合策略”。
Li、Rayner和Cave(2009)借鉴英文词汇识别的理论,模拟了中文词的识别和切分过程,构建了一个汉语词切分和识别的计算模型(图5.5),并且很好地拟合了实验观测到的数据。该模型借鉴了McClelland和Rumelhart(1988)提出的交互激活模型的一些假设,如英文词汇识别包括多层次加工单元,即视觉感知单元、字母加工单元和词汇加工单元。Li等人认为,在中文词的识别过程中,首先,字的一些视觉特征被视觉系统感知到,相继传送到字识别与词识别层级,并激活相对应的词,被激活的词反过来影响字的识别。在词汇识别单元,相关的词相互竞争。通过多次循环,词汇识别单元中将会有一个唯一的词条胜出。当某一个词胜出后,词就被识别出来,也就完成了词的切分。该模型假设各个层次间存在交互作用,因而相应位置的字的识别与视觉加工也会受到影响。属于该词的字的加工单元以及相应的视觉处理单元会被促进,而不属于该词的单元会被抑制。在Li等人(2009)研究中的二词条件下,由于视觉注意等因素的影响,第一个词往往更容易在竞争中胜出,从而会对属于该词的字的识别有促进作用,因此属于第一个词的字更容易被识别出来。由于属于第二个词的字不容易在竞争中取胜,而且相应的字的识别只能接受自下而上的信息,所以识别速度会相对较慢。这样,就会在字的识别与视觉加工水平呈现出词的边界效应。

除了交互假设外,该模型还作出了以下重要假设:首先,词的识别与切分是一个统一的过程,二者不可区分。只有当词被识别出来时,词才被切分开来。第二,落在视野中的字的加工是并行进行的。但是,这些字的识别效率受到视觉注意的影响。离注视点距离越远,识别效率越低。第三,词的识别是一个串行的过程。在词汇识别单元,一次竞争过程中只能有一个词胜出。第四,当一个词被识别出来后,刚刚识别出的词和字所对应的单元被抑制,然后再开始下一轮的竞争,从而开始下一个词的识别过程。
到目前为止,Li等人(2009)提出的模型首次尝试通过计算机仿真,模拟和解释中文词切分和识别的认知机理。虽然该模型还需要一定的改进和完善(例如继续探讨语境在词切分中的作用),但是它仍然能够为解释中文词切分的机理问题提供一种思路,从而有助于更深入地理解汉语阅读的认知机理。
参考文献
白学军,郭志英,曹玉肖,顾俊娟,闫国利,臧传丽.(2012).词切分对印—英双语者阅读影响的眼动研究.心理科学,(3),544—549.
白学军,梁菲菲,闫国利,田瑾,臧传丽,孟红霞.(2012).词边界信息在中文阅读眼跳目标选择中的作用:来自中文二语学习者的证据.心理学报,44,853—867.
白学军,孟红霞,王敬欣,田静,臧传丽,闫国利.(2011).阅读障碍儿童与其年龄和匹配儿童阅读空格文本的注视位置效应.心理学报,43(8),851—862.
郭志英,白学军,谷莉,王永胜,王丽红.(2014).词切分对日—汉和汉—日双语者日语阅读影响的眼动研究.心理与行为研究,12(6),775—781.
黄伯荣,廖序东.(2007).现代汉语教学与自学参考:增订四版.北京:高等教育出版社.
李兴珊,刘萍萍,马国杰.(2011).中文阅读中词切分的认知机理述评.心理科学进展,19(4),459—470.
沈德立,白学军,臧传丽,闫国利,冯本才,范晓红.(2010).词切分对初学者句子阅读影响的眼动研究.心理学报,42(2),159—172.
吴俊.(2008).基于词汇切分的中文阅读眼动控制模型.博士学位论文,华南师范大学.
杨忠明.(1998).中文词间、词内空格调整对阅读的影响.台南师范学报,31,303—326.
张智君,刘志方,赵亚军,季靖.(2012).汉语阅读过程中词切分的位置:一项基于眼动随动显示技术的研究.心理学报,44(1),51—62.
Bai,X.J.,Liang,F.F.,Blythe,H.I.,Zang,C.L.,Yan,G.L.,& Liversedge,S.P.(2013).Interword Spacing Effect on the Acquisition of New Vocabulary for Readers as Chinese a Second Language.Journal of Research in Reading ,36(S1),S4-S17.
Bai,X.J.,Yan,G.L.,Liversedge,S.P.,Zang,C.L.,& Rayner,K.(2008).Reading Spaced and Unspaced Chinese Text:Evidence from Eye Movements.Journal of Experimental Psychology :Human Perception and Performance , 34(5),1277-1287.
Blythe,H.I.,Liang,F.F.,Zang,C.L.,Wang,J.X.,Yan,G.L.,Bai,X.J.,& Liversedge,S.P.(2012).Inserting Spaces into Chinese Text Helps Readers to Learn New Words:An Eye Movement Study.Journal of Memory and Language , 67(2),241-254.
Cai,Q.,& Brysbaert,M.(2010).SUBTLEX-CH:Chinese Word and Character Frequencies Based on Film Subtitle.PLoS One , 5(6),e10729.
Hoosain,R.(1991).Psycholinguistic Implications for Linguistic Relativity :A Case Study of Chinese .Hillsdale,NJ:Lawrence Erlbaum Associates.
Hsu,S.-H.,& Huang,K.-C.(2000a).Effects of Word Spacing on Reading Chinese Text from a Video Display Terminal.Perceptual and Motor Skills ,90(1),81-92.
Hsu,S-H.,& Huang,K-C.(2000b).Interword Spacing in Chinese Text Layout.Perceptual & Motor Skills , 91(2),355-365.
Inhoff,A.W.,Liu,W.,Wang,J.,& Fu,D.J.(1997).Use of Spatial Information During the Reading of Chinese Text.In D.L.Peng,H.Shu,&;
H.C.Chen (Eds.),Cognitive Research on Chinese Language (pp.296-329).Jinan,China:Shan Dong Educational Publishing.
Inhoff,A.W.& Radach,R.(2002).The Role of Spatial Information in the Reading of Complex Words.Comments on Theoretical Biology ,7,121-138.
Inhoff,A.W.,Radach,R.,& Heller,D.(2000).Complex compounds in German:Interword spaces facilitate segmentation but hinder assignment of meaning.Journal of Memory and Language , 42(1),23-50.
Inhoff,A.W.,& Wu,C.(2005).Eye Movements and the Identification of Spatially Ambiguous Words During Chinese Sentence Reading.Memory & Cognition ,38(8),1345-1356.
Juhasz,B.J.,Inhoff,A.W.,& Rayner,K.(2005).The Role of Interword Spaces in the Processing of English Compound Words. Language and Cognitive Processes ,20(1),291-316.
Kasisopa,B.,Reilly,R.G.,Luksaneeyanawin,S.,& Burnham,D.(2013).Eye Movements While Reading an Unspaced Writing System:The Case of Thai.Vision Research ,86(10),71-80.
Kohsom,C.,& Gobet,F.(1997).Adding Spaces to Thai and English:Effects on Reading.In Michael G.Shafto & Pat Langley (Eds.),Proceedings of the 19th Annual Conference of the Cognitive Science Society (pp.388-393).Mahwah,NJ:Lawrence Erlbaum.
Li,X.S.,Rayner,K.,& Cave,K.R.(2009).On the Segmentation of Chinese Words During Reading.Cognitive Psychology ,58(4),525-552.
Liang,F.,Blythe,H.I.,Zang,C.,Bai,X.,Yan,G.and Liversedge,S.P.(2015).Positional Character Frequency and Word Spacing Facilitate the Acquisition of Novel Words During Chinese Children's Reading.Journal of Cognitive Psychology ,27(5),594-608.
Liu,I.M.,Yeh,J.S.,Wang,L.H.,& Chang,Y.K.(1974).Effects of Arranging Chinese Words as Units on Reading Efficiency.Chinese Journal of Psychology ,16,25-32.
Ma,G.,Li,X.,& Rayner,K.(2014).Word segmentation of overlapping ambiguous strings during chinese reading.Journal of Experimental Psychology :Human Perception & Performan ,40(3),1046-1059.
Malt,B.C.,& Seamon,J.G.(1978).Peripheral and Cognitive Components of Eye Guidance in Filled-Space Reading.Attention,Perception ,& Psychophysics ,23(5),399-402.
McClelland,J.L.,& Rumelhart,D.E.(1988).An Interactive Activation Model of Context Effects in Letter Perception:Part I.An Account of Basic Findings.Readings in Cognitive Science ,88,580-596.
McConkie,G.W.,Kerr,P.W.,Reddix,M.D.,& Zola,D.(1988).Eye Movement Control During Reading:I.The Location of Initial Fixations in Words.Vision Research ,28(10),1107-1118.
Perea,M.,& Acha,J.(2009).Space Information is Important for Reading.Vision Research ,49,1994-2000.
Perfetti,C.A.,& Tan,L.H.(1999).The Constituency Model of Chinese Word Identification..In J.Wang,A.W.Inhoff,&;
H.-S.Chen (Eds.), Reading Chinese Script :A Cognitive Analysis (pp.115-134).Mahwah,NJ:Erlbaum.
Radach,R.,& McConkie,G.W.(1998).Determinants of Fixation Positions in Words During Reading.In G.Underwood (Ed.),Eye Guidence in Reading and Scene Perception (pp.77-100).Oxford:Elsevier.
Rayner,K.,Fischer,M.H.,& Pollatsek,A.(1998).Unspaced Text Interferes with Both Word Identification and Eye Movement Control.Vision Research ,38(8),1129-1144.
Reilly,R.G.,Radach,R.,Luksaneeyanawin,S.,& Aranyanak,I.(2009).Factors in involved in eye guidance in reading Thai .Paper presented at ECEM 2009,August 23-27,University of Southampton.
Shen,D.L.,Liversedge,S.P.,Tian,J.,Zang,C.L.,Cui,L,Bai,X.J,Yan,G.L.,& Rayner,K.(2012).Eye Movements of Second Language Learners When Reading Spaced and Unspaced Chinese Text.Journal of Experimental Psychology :Applied ,18(2),192-202.
Winskel,H.,Radach,R.,& Luksaneeyanawin,S.(2009).Eye Movements When Reading Spaced and Unspaced Thai and English:A Comparison of Thai-English Bilinguals and English Monolinguals.Journal of Memory and Language , 61(3),339-351.
Yen,M.-H.,Radach,R.,Tzeng,O.J.-L.,& Tsai,J.-L.(2012).Usage of Statistical Cues for Word Boundary in Reading Chinese Sentences.Reading and writing ,25(5),1007-1029.
Zang,C.L.,Liang,F.F.,Bai,X.J.,Yan,G.L.,& Liversedge,S.P.(2013).Interword Spacing and Landing Position Effects During Chinese Reading in Children and Adults.Journal of Experimental Psychology :Human Perception and Performance , 39(3),720-734.
Zang,C.,Wang,Y.,Bai,X.,Yan,G.,Denis Drieghe,& Liversedge,S.P.(2016).The Use of Probabilistic Lexicality Cues for Word Segmentation in Chinese Reading.Quarterly Journal of Experimental Psychology , 69(3),548-560.






本书评论