汉语语音范畴性知觉及其发展

本文由wanghuihumer贡献
pdf文档可能在WAP端浏览体验不佳。建议您优先选择TXT，或下载源文件到本机查看。
心理学报 2009, Vol141, No17, 572 - 579
A cta P sych o log ica S in ica
DO I: 10. 3724 / SP. J. 1041. 2009. 00572
汉语语音范畴性知觉及其发展
席洁姜薇
1 1、 2
张林军舒华
3
1
( 1认知神经科学与学习国家重点实验室 ,北京师范大学 ,北京 100875)
( 航空医学研究室 ,中国民用航空总局民用航空医学中心 ,北京 , 100025) ( 3汉语学院 ,北京语言大学 ,北京 100083)
2
摘要范畴性是言语知觉的一个显著特征 ,长期以来一直受到研究者的普遍关注。但汉语不同语音特征的范畴性知觉特点及其发展模式迄今为止还很少有研究涉及。本研究利用语音合成的方法分别改变辅音的送气 /不送气特征和声调的基频曲线 ,生成语音刺激连续体 ,采用范畴性知觉的经典研究范式探讨了汉语正常成人被试嗓音启动时间 (Voice onset tim e, VOT)和声调范畴性知觉的特点及不同年龄儿童的发展模式。研究结果表明 : ( 1 ) 成人被试对 VOT和声调的知觉是范畴性的 ; (2)对于汉语声调特征 , 6 岁儿童已经具有类似成人的范畴性知觉能力 ; 而在
VOT这一维度上 ,范畴知觉能力随着年龄发展不断精细化 , 但 7 岁儿童也尚未达到成年人的敏感程度 , 说明汉语 VOT和声调这两个不同的语音特征经历了不同的发展模式。
关键词范畴性知觉 ; VOT; 声调 ; 发展模式分类号 B842
1 前言
1. 1 语音范畴性知觉
语音知觉是一种非连续性的、具有离散特点的范畴性知觉 ( Categorical percep tion, CP ) ( L iberman, Cooper, Shankweiler, & Studdert - Kennedy, 1967 ) , 即语音刺激被知觉为数量有限的范畴 , 人们对同一范畴内的语音差别难以区分 , 而对范畴间的差异则非常敏感。范畴性是言语知觉的一个显著特点 , 在言语的感知和表征过程中起着重要作用 ,因此在过去的 50 年中范畴性知觉一直是言语知觉研究的热点问题。西方音系的范畴性知觉研究主要集中在两个重要的辅音特征上 , 即嗓音启动时间 ( Voice onset tim e, VOT)和第二共振峰过渡。嗓音启动时间是指从声音除阻到声带振动之间的时间间隔 , 这是区分辅音清 /浊和送气 /不送气的主要特征。第二共振峰过渡则是区分塞音发音部位的主要特征 (D iehl, Lotto, & Holt , 2004 ) 。范畴性知觉在儿童早期语言发展过程中具有重要作用 ,婴儿语言发展研究表明 ,出生不久的婴儿能
够识别所有的语音区分特征 ( Eim as, Siqueland, Jusczyk, & V igorito 1971; Jusczyk, 1997 ) ,但是这种辨别是

基于声音的物理特征差异做出的 , 而不是有组织的声音归类 (即范畴化知觉 ) ( Sim on, & Fourcin, 1978 ) 。随着语言经验的增多 , 6 个月大的婴儿开始形成语音范畴的概念 , 但和成人模式存在明显差异 ,因为儿童要获得和成人一样的语音知觉能力 ,不仅要学会区分两个不同的语音刺激 ,还要将这些刺激按照一定的规律组织到各自的音位范畴之中。婴幼儿和儿童语音加工能力的发展和精细化过程可能与其日益提高的其他语言能力有关。那么 ,从什么年龄开始儿童具有了和成年人一样的语音范畴化知觉能力呢 ? 一些研究发现儿童进入学龄期以后其语音范畴性知觉能力和成人相比仍有差异 ( Bogliotti, 2003; Elliott, Longinotti, M eyer,
Raz, & Zucker, 1981; Flege & Eefting, 1986; Heeren, 2005; D roge, 1995; N ittrouer, M iller, 1997; W alley & Flege, 1999; Bogliotti, 2003; M eyer, Raz, & Zucker, 1981; Elliott, Longinotti, Flege & Eefting, Holden 2Pitt, Hazan, Revoile, Edward, &
收稿日期 : 2008 - 05 - 26 通讯作者 : 舒华 , E 2 mail: shuh@ bnu. edu. cn
3 长江学者和创新团队发展计划 ( IRT0710) 、国家自然科学基金项目 ( 60534080) 、北京市教育委员会共建项目 ( SYS100270661) 资助。
572
1986; Heeren, 2005; Holden 2Pitt, Hazan, Revoile,
3
7 期
席等 : 汉语语音范畴性知觉及其发展洁
573
Edward, & D roge, 1995; N ittrouer, M iller, 1997; W alley & Flege, 1999 ) ,比如 Hazan 和 B arret ( 2000 )
使用 2 项迫选范式 ,对 84 个听力正常的 6 ～12 岁儿童和 13 个成年人进行了 6 个语音连续体的知觉能力的考察 ,这 6 个语音连续体是通过改变单独的一个或联合的几个语音特征形成的。结果发现 , 识别函数随年龄的增长斜率逐渐增加 ,但即使是 12 岁的儿童 ,其识别能力仍与成人显著不同。 1. 2 汉语语音的范畴性知觉研究汉语音系具有自己的特点 , 辅音的强送气性以及声调的存在是两个最显著的特征。汉语普通话一共有 22 个辅音 , 其中有 6 对以是否送气相区别 , 而在英语语音体系以及东亚的日语等语音体系中 , 送气 /不送气都不是区别性特征。汉语辅音的送气 /不送气特征主要靠 VOT来区分。王韫佳和上官雪娜 ( 2004 )发现 , 和英语等音系中决定清、浊音的 VOT 一样 , 汉语母语者对决定汉语送气 /不送气特征的 VOT也有良好的范畴性感知。汉语还是一种代表性的声调语言 ( tone lan2 guage ) ,声调是一种能够区分语义的音高模式 ,声学上主要表现为基频 ( f0 )的变化 ( A t, 1976 ) 。汉语的四个声调在语音学上可以描述为高平、、高升降升和高降。对于汉语声调的范畴性知觉 , 有限的几项研究结果并不完全

一致。王士元 ( 1976 ) 的研究发现汉语一声 (阴平 )和二声 (阳平 )的感知是范畴性的 ; 而 Halle, Chang和 B est ( 2004 )对台湾语被试声调感知的研究发现 ,被试在识别任务中表现出良好的范畴边界 ,但在分辨任务中除一声二声外 ,其余声调连续体的区分高峰不明显 , 他们因此认为汉语声调的范畴性知觉可能不如辅音那么明显。 Francis, Cioc2 ca和 Ng ( 2003 )针对这种不一致的现象使用广东话声调连续体进行了研究 , 发现刺激从广东话的高低型声调变换为平调时 ,知觉模式为范畴性知觉 ; 当使用广东话的两个平调作为刺激时 , 识别任务表现出良好的范畴边界 ,而分辨任务没有出现明显的区分高峰。因此 Francis等人认为声调范畴边界可能由自然听觉的敏感区域和语言经验共同影响 , 是类范畴化的。最近 Xu, Gandour和 Francis ( 2006 )使用普通话的一声和二声声调连续体进行的研究发现汉语被试对于一声二声的感知是范畴性的。总之 ,对汉语语音范畴性知觉的系统研究还很少 ,汉语的语音特征与英语有一定的差别 ,汉语语音特征的知觉是否也象英语语音特征那样是范畴性的 ,还需要有更多的实验证据。同时 ,儿童语音发展
研究发现语音范畴性知觉受到语言经验的影响 , 随着年龄的增长 ,语音范畴性知觉能力不断改善 ,但是目前还几乎没有来自汉语儿童语音范畴性知觉能力发展的报告。那么 , 汉语语音的两个重要特征 — VOT和声调的知觉模式是怎么样的以及以汉语为母语的儿童在知觉这两个特征时的发展模式又是怎样的 ,都需要进一步的研究。 1. 3 研究目的参考前人研究 ( Francis et al , 2003; Halle et . al , 2004; Hazan et al , 2000; Xu et al , 2006 ) ,我 . . . 们在实验一中首先采用语音范畴性研究普遍使用的经典范式 — 识别 ( identification ) 和分辨 ( discrim ina2 tion )任务共同考察汉语成人被试对 VOT和声调这两种不同语音特征的知觉模式是否为范畴性的 , 然后在实验二中进一步考察不同年龄儿童 ( 5 ～7 岁 ) 的发展模式。
2 实验一 : 成人 VOT和声调的范畴性
知觉实验
本实验通过语音范畴的识别实验和分辨实验 ,
分别操纵 VOT和声调形成语音刺激的连续体 ,以成人为被试考察这两个语音特征是否为范畴性知觉模式。 2. 1 被试本实验被试为 20 名北京师范大学在校学生 ,年龄 18 ～25 岁 ,平均年龄 22 岁 ,其中女生 15 人 ,男生 5 人。全部被试以汉语普通话为母语 , 裸视或矫正视力正常 ,听力正常。 2. 2 实验材料语音连续体使用 Klatt合成器 ( 1979, 1980 ) 制作 ,合成参数参考了中国科学院声学所 80 年代报告的声学分析数据 (基

于一个成年男性普通话发音测定 ) ,并参考 Hazan等人 ( 2000 ) 的人工合成方法 , 这样可以得到比一般共振峰合成的语音刺激更接近自然语音的刺激。
VOT连续体包括 10 个人工合成的音节 , 10 个刺激 VOT的长度从 0m s到 90m s,以 10m s的步长递增 ,即从 0m s的不送气辅音范畴的极端值逐步线性变化到 90m s送气辅音范畴的极端值 (如连续体中第一个刺激 s1 的 VOT 长度为 0m s, 第二个刺激 s2 的 VOT长度为 10m s 等 ) 。每个音节的长度都是
290m s,呈现时强度固定在 85dB。刺激被知觉为从 / bá /p á。 /到 /
识别和分辨实验中使用了不完全相同的声调连
574
心理学报
41 卷
续体材料。识别实验中声调连续体包括 21 个人工合成的音节 ,每个音节的长度都是 270m s,呈现时强度固定在 85dB。 21 个刺激声调从一声逐渐变化到二声 ,声调的变化附着在韵母上 ,因此基频的变化是从 80m s开始。起始的基频频率从第 1 个到第 21 个刺激逐渐从 204. 8Hz变化到 149. 2Hz, 每个刺激大约以 2. 8Hz的步长降低起始基频频率 , 所有音节结尾频率都保持 204. 8Hz 不变。刺激被知觉为从 / m ā /到 /m á /。而分辨实验中的声调连续体只包括 o o 10 个音节 , 主要是加大了刺激之间基频频率的变化 ,每个刺激大约以 6. 2Hz的步长降低起始基频频率 ,以减少分辨实验的刺激对数目 , 缩短分辨实验时间。 2. 3 实验程序识别实验包括 VOT和声调识别两个子实验 ,在
VOT识别任务中被试听到一个单一的声音刺激 , 然
VOT或声调连续体中所有相邻的刺激 ( 9 对 ) 、间隔一个的刺激 ( 8 对 ) 以及间隔两个的刺激 ( 7 对 ) , 每
个刺激对重复 6 次 , VOT和声调连续体分别有 144 对语音刺激。每个子实验都包括练习和正式实验 , 练习过程和正式实验一样 , 以便被试熟悉实验程序。正式实验中 ,被试舒服地坐在笔记本电脑前 ,佩戴好专业耳机 ,语音刺激通过耳机以双通道的方式随机呈现 ,要求被试尽量准确快速的按键反应。使用 DMDX 实验系统呈现实验材料。 DMDX 软件在一台 Dell笔记本电脑上运行 ,笔记本电脑和具有掩蔽噪音功能的专业耳机相连。 2. 4 结果和讨论 2. 4. 1 识别实验结果 1 是 VOT和声调在识别图任务中的范畴曲线。左侧图横坐标代表改变 VOT 获得的语音刺激连续体 ,其中 1 号刺激的 VOT值为 0m s, 10 号刺激的 VOT 值为 90m s, 每个刺激之间 VOT差值为 10m s,纵坐标代表识别为某一个范畴的识别率。可以看到 ,在 VOT为 40 ～50m s之间时 ,范畴曲线的斜率出现了突变 , 表明汉语被试对于送气辅音的识别率有了显著提高。观察识别曲线中正

确率为 50%的刺激序列 ,我们可以推断送气和不送气辅音的区分边界大约在 45m s左右。
后判断这个声音是 / bá /还是 /p á 在声调识别任务 /; 中被试则判断是 /m ā /还是 /m á / ) 。 VOT 连续体 o o 中的 10 个独立的语音刺激各重复 4 次 , 共 40 个语音项目 ,声调连续体的 21 个独立的语音刺激也各重复 4 次 ,共 84 个语音项目。分辨实验也包括 VOT和声调分辨两个子实验 , 实验要求被试认真听前后呈现的两个刺激 , 然后判断这两个刺激是否相同。成对呈现的刺激包括
图 1 汉语语音特征识别函数的范畴曲线 (左侧为 VOT特征 ,右侧为声调特征 )
1 右侧横坐标代表改变基频获得的语音刺激图连续体 , 第 1 个刺激是标准的一声 , 第 21 个刺激是标准的二声 ,纵坐标代表识别为某一个范畴的识别率。可以看到 ,对汉语声调一声和二声的识别也具有明显的范畴性 , 从第 10 个刺激开始 , 识别为二声的比率明显提高 , 第 13 个刺激识别率达到 50%左右 ,可以认为是两者的边界。 2. 4. 2 分辨实验结果 2 是 VOT和声调在分辨图
实验中的结果 (间隔一个刺激 ) 。分辨实验得到了和识别实验类似的结果。对 VOT的辨别率做单因素方差分析 , 结果表明刺激对的主效应显著 , F ( 7, 47 ) = 11. 61, p < 0. 001。进一步多重比较发现 , s2
- s4、 - s5、 - s6、 - s7 几个刺激对的分辨率高 s3 s4 s5 于 s1 - s3、 - 8、 - 9 和 s8 - s10 ( p < 0. 001 ) 。这 s6 s7
说明前一个部分的刺激对跨范畴边界 , 分属不同范畴 ,因而识别率较高 ; 而后面的这些刺激对来自同一
7期
席等 : 汉语语音范畴性知觉及其发展洁
575
个范畴内部 ,所以不易分辨它们之间的差异。从图 2 来看 ,辨别曲线有明显的峰值 , VOT的范畴边界在 30 ～40m s左右 ,与识别任务的边界值相似。
范畴性知觉模式的比较 , 进一步考察哪个年龄段的儿童语音范畴性知觉能力可以达到与成年人相似的水平。 3. 1 被试 51 名儿童被试 , 其中来自幼儿园的儿童 32 共名 ,分为中、大班两个年级水平。 5 岁儿童 16 人 (男生 7 名 ,平均年龄 5. 3 岁 ) , 6 岁儿童 16 人 (男生 9 名 ,平均年龄 6. 5 岁 ) ,这些儿童没有接受过正规的读写教育。来自小学一年级的儿童 19 人 (男生 9 名 ,平均年龄 7. 5 岁 ) 。参加实验儿童的家庭背景在社会经济地位、父母受教育水平等方面基本相同。 3. 2 实验材料 VOT连续体和成人实验相同 ,只有嗓音启动时间 (VOT)发生变化 ,表现为从音节 / bá 到音节 /p á / / 逐渐变化。为减少儿童实验时间 , 声调连续体使用成人识别实验的 11 个奇数语音刺激 ,只有基频 ( f0 )

发生变化 ,表现为从音节 /m ā /到 /m á /逐渐变化。 o o 3. 3 实验程序要求儿童判断单独呈现的每一个刺激是 / bá / 还是 /p á (或者是 /m ā /还是 /m á / ) , 并根据屏幕 / o o 上呈现的图片进行选择。儿童实验采用更为形象的指导语 ,以调动儿童参与的积极性。并增加学习和练习的次数 ,确保儿童正确理解实验要求。而且 ,在正式实验中增加休息时间和休息次数 , 使儿童保持注意力集中。另外 , 使用两张图片表示两个备选答案 ,实验过程中在屏幕上一直呈现 ,以最大程度地减小短时记忆的影响。其余程序同成人实验。 3. 4 结果和讨论 3. 4. 1 VO T 和声调特征的发展模式辅音 VOT 和声调范畴知觉的年龄曲线见图 3, 其中横坐标是线性变化的刺激序列 , 纵坐标代表被试把语音刺激识别为 /p á /或者 /m á /的识别率。四条曲线分别是 o 3 个不同年龄组和成人 (实验一中成人结果 )的平均识别率 ,每个点是所有被试对横坐标相应刺激四次反应的总平均。可以看到 , 5 岁儿童对于汉语辅音 VOT和声调的知觉都已经表现出了明显的范畴性 , 为了更好地反映范畴性知觉能力的年龄差异 , 我们首先利用线形回归的方法将每个刺激系列点的平均数生成一个斜率值 ,以此作为个人语音范畴性知觉能力的指标 (表 1 ) , 然后对斜率值做单因素方差分析 , 结果发现 : VOT特征上 , 年龄的主效应显著 , F ( 3, 67 ) 在 = 7. 77, p < 0. 001。进一步的多重比较 ( TUKEY检
图 2 两个声音连续体二阶刺激对分辨分数与刺激对之间的关系 ( s1 代表连续体的第一个刺激 )
对声调的辨别率做单因素方差分析 , 结果表明刺激对的主效应显著 , F ( 7, 147 ) = 22. 94, p <
01001。进一步的多重比较发现 , s2 - s4、 - s5、 s3 和 s4 - s6 几个刺激对的分辨率高于 s6 - s9、 - s8 和 s7 s8 - s10 几个刺激对 ( p < 0. 001 ) ,这是因为这些刺
激分别属于同一或者不同的声调范畴。从辨别曲线的峰值 ,我们可以近似地推论 ,一声和二声两个声调的范畴边界在 s3 - s5 之间 ,这与识别范式得到的范畴边界值非常相似。汉语作为一种有声调的音节语言 , 与西方的重
音语言在语音特征上存在很大差异 , 而对汉语语音范畴性知觉的系统研究还很少。实验一发现汉语成人被试对嗓音启动时间和一声、二声的声调感知具有明显的范畴性。那么这种范畴性感知的能力是如何发展的 ,汉语儿童何时能够获得和成人类似的语音范畴区分能力 ,这种范畴性感知能力的发展是否存在一个关键年龄 ? 在实验二中 , 我们将进一步考察这种言语知觉能力的发展模式。
3 实验二 :

汉语语音范畴性知觉的
发展
由于在实验一中 , 分辨范式和识别范式得到的
结果基本一致 ,因此实验二中儿童只进行记忆负荷较小的识别范式实验以缩短实验时间。本实验考察 5 岁到 7 岁的汉语儿童嗓音启动时间 (VOT) 和声调两个语音特征知觉的发展模式 , 并通过儿童和成人
576
心理学报
41 卷
验 )分析结果表明 , 成年组与三个儿童组之间的差异都是显著的 ( p < 0. 001, p = 0. 001, p = 01021 ) ,而三个儿童组之间 , 5 岁组与 6 岁、岁组存 7 检验 ) 分析结果表明 , 5 岁组与 6 岁组、岁组的差 7 异显著 ( p = 0. 012, p = 0. 001 ) ,而 6 岁组、岁组 7 和成年人之间的差异都不显著 ( p > 0. 05 ) 。
表 1 VOT和声调知觉的斜率
VOT L iner 斜率
M SD
在显著差异 ( p = 0. 006, p < 0. 001 ) , 6 岁组与 7 岁组差异不显著 ( p > 0. 05 ) 。
图 3 儿童言语知觉能力随年龄的发生与发展过程 (与实验一中成年人结果对比 ) 左边为声调范畴知觉的年龄曲线 ( T1 代表声调连续体的第一个刺激 ) , 右边为 VOT范畴知觉的年龄曲线 (V1 代表 VOT连续体的第一个刺激 )
在声调特征上 , 年龄的主效应显著 , F ( 3, 67 ) = 7. 03, p < 0. 001。进一步的多重比较 ( TUKEY
为了排除年龄的影响 ,在控制了儿童年龄之后 ,进行偏相关的分析 , 相关为 0. 23, 也没有达到显著性水平。同时 ,成人组两个实验任务成绩的相关也只有
0. 11。这似乎说明对声调和嗓音启动时间这两个语
音特征的感知是相互独立的 , 嗓音启动时间和声调有各自不同的发展时间窗口 , 可能因为前者属于快速变化的信息 ,而后者属于慢速变化的信息。最近有关神经机制方面的研究也证明这两种信息存在不同的加工机制 (Luo et al , 2006 ) 。 .
被试信息
声调 L iner 斜率
M SD
年龄
5岁 6岁 7岁
N
16 16 19 20
0. 45 0. 61 0. 66 0. 78
0. 26 0. 11 0. 15 0. 06
0. 57 0. 65 0. 67 0. 68
0. 14 0. 06 0. 03 0. 02
4 综合讨论
本研究通过两个实验 ,考察了汉语 VOT和声调这两个语音特征的范畴性知觉和发展模式。结果发现 : ( 1 )汉语成人被试对 VOT和声调的知觉都是范畴性的 ,证明汉语语音这两个特征的知觉和英语等其它语言语音特征的知觉模式相同 ,都是范畴化的 ; ( 2 ) VOT和声调这两种不同的语音特征具有不同的发展模式。声调的区分较早获得 , 6 岁儿童即具有和成年人类似的加工模式。 VOT 的区分则较为困难 ,需要相当长的发展过程 , 从 5 岁到 7 岁逐渐改善 , 7 岁儿童 VOT 分辨的敏感性显著增加 , 但仍未达到成人水平。下面我们分两个方面进行讨论。
4.

1 汉语 VO T 和声调范畴化知觉的特点
成年人 (实验一 )
这一结果说明 ,在声调特征上 , 6 岁的儿童就已
经获得了和成人类似的范畴性知觉能力 , 这可能是汉语儿童声调范畴性知觉发展的一个关键年龄。而辅音 VOT的范畴性知觉能力、岁儿童也没有完全 7 获得 ,仍然处在进一步的发展中。因此 ,我们认为声调是一个相对容易获得的语音区分特征 , VOT的发展则需要更长的时间。
3. 4. 2 两个语音特征之间的关系为了进一步探
讨 VOT和声调两个语音特征之间的关系 ,我们对所有儿童组被试感知这两个不同语音特征的曲线斜率
进行了相关分析 , 相关系数为 0. 25, 相关不显著。
汉语语音具有自己的特点 , 辅音的强送气性以
7 期
席等 : 汉语语音范畴性知觉及其发展洁
577
及声调的存在是两个最显著的特征。汉语辅音的送气 /不送气主要表现为 VOT的不同 , 而声调主要表现为基频的变化。对西方英语等语音体系的研究发现区分辅音清 /浊特征的 VOT知觉是范畴性的 , 但声调的感知是范畴性的还是连续的 , 结论却并不明确。从时间范围上来说 , VOT 一般只有几十毫秒 , 属于快速变化的信息 , 而声调的时间范围一般都在几百毫秒 , 属于慢速变化的时间信息。因此 , VOT 和声调的知觉机制可能是不同的。我们的研究发现 ,成人被试对于汉语 VOT的知觉是理想的范畴感知 , 同时 , 从由 50%的正确率来定义的范畴边界来看 ,汉语 VOT的范畴边界是较长的正值 , 大约 45m s 左右。这与西方英语、西班牙语、语等研究报告的边界是不同的。 L isker 和法 Abram son ( 1970 )一项跨语言的研究结果表明 , VOT 可以划分为三个区域 ,即负值、稍短的正值和较长的正值。不同语言中因为清 /浊和送气 /不送气的特征对立而存在不同的范畴边界。例如 , 西班牙语中的浊辅音有很大的负值 ( - 80m s 左右 ) , 而英语中辅音清 /浊特征的范畴边界是大约 20m s 左右。 VOT 的范畴性知觉受到语言经验的影响 , 听者对于母语音系中存在的范畴边界敏感 , 而对于非母语的边界则很难辨别。这可以解释我们的实验结果 , 汉语的 VOT是用来区分送气 /不送气特征的 , 对于这种特征的区分 , VOT 的范畴边界一般为 30m s 以上 (W ang, et al , 2004 ) 。 . 对于声调的感知 ,我们的研究发现 ,汉语被试在知觉阴平和阳平的声调刺激的时候是高度范畴化的 ,但 Hally 的结果却并没有得到如此理想的范畴曲线 ( Halle et al , 2004 ) 。他们的研究考察了对多 . 个汉语声调的辨别 , 结果发现声调的区分没有表现出范畴曲线的突变现象 , 他

们因此认为汉语声调的知觉是类似范畴化的。这两个研究结果的差异可能和使用的不同刺激有关 , Hally等的研究主要使用的是没有意义的音节 ,而为了后续的儿童实验 ,我们的研究使用了有意义的音节 , 语音知觉可能因此受到了来自高层次词汇信息的调节作用 , 因此分辨就变得更加敏锐。W ang ( 1976 ) 也曾经报告过跟我们的研究类似的结果。 4. 2 汉语 VO T 和声调范畴性知觉的不同发展模式对不同年龄的汉语儿童 VOT和声调范畴性知觉的发展研究发现 , 汉语儿童对于这两个语音特征的知觉都是类似范畴性的 , 但不同语音特征的知觉
发展模式并不相同 : 声调的范畴性知觉获得较早而 VOT的区分则需要相当长的发展过程。为什么声调和 VOT具有不同的发展模式 ? 我们认为可能有两方面的原因 ,一方面是这两个语音特征自身的差异 ,另一方面是母语环境的影响。从声学特征来看 , VOT 一般只有几十毫秒 , 属于快速变化的信息 ; 而声调是附着在音节 (元音和浊辅音 )上的 ,时间范围一般都在几百毫秒 , 属于慢速变化的信息。因此 , VOT 的知觉要求更高的快速时间加工能力 ,具有更高的难度 ,这种快速时间加工能力需要更长时间的发展才能够完全获得。从母语环境的影响来说 , 声调是汉语语音独特的区分性特征 ,而 VOT 则具有语言普遍性 , 但在不同语言中有一定的差异。在这个方面 , Burnham ( 1986 )提出的语音知觉分辨能力发展的两阶段理论可以提供很好的解释。该理论把语音的区别性特征分为两类 ,一类是较强的音位特征 ,另一类是较弱的音位特征。语音知觉的发展也经历了两个阶段 : 那些较强的音位特征 , 经过短暂的母语环境的熏陶就可以获得 ,一般在儿童 3 岁以前就得到了良好的发展 ,甚至有的音位特征儿童在 6 个月的时候就可以区分 ; 另外一类音位特征需要经过长时间母语环境的训练才能够逐步获得 , 儿童 5 岁到 8 岁之间都在不断发展。根据 B urnham 的观点 , 我们认为 , 汉语声调是一种较强的音位特征 , 在母语环境影响下能够得到快速发展 , 因此儿童可以较早获得良好的范畴性知觉能力 ; 而辅音的嗓音启动时间则是一个相对脆弱的语音特征 , 所以需要较长时间才能够达到和成人相似的范畴性知觉能力。
5 总结
言语的范畴化知觉在西方音系的研究中一直是热点问题 ,但对汉语语音范畴性知觉的研究基本还处于空白。本研究发现 ,成人被试对汉语 VOT和声调的知觉是范畴性的 , 而且汉语儿童对于这两种语音特征的感知也是类似范畴性的 , 但是两种语音特征经历了不同的发展模式 , 6

岁儿童的声调特征已经和成人类似 ,而 VOT特征则在 7 岁时还和成人有显著差异。嗓音启动时间范畴性知觉能力究竟于哪一个年龄段开始发展成熟 , 还需要进一步的研究。我们的研究使用心理物理学的实验范式描述了范畴性言语知觉的行为模式 , 为这一领域的研究提供了一个开端。在今后的研究中 , 可利用多种技术做更精细的研究 ,以考察范畴知觉的深层机制 ,如脑电中
578
心理学报
41 卷
的 MMN (M ismatch negativey) 范式可以考察被试在非注意条件下对听觉言语刺激的被动加工 , 非常适合儿童的发展研究 ( N t nen et al , 1997; Bonte, . Poelm ans, & B lom ert, L. , 2007 ) 。另外 f R I等成 M 像技术也可以为范畴性语音知觉提供精确的脑解剖结构和功能定位 ( B lum stein, M yers, & R issm an,
2005; Dufor, Serniclaes, Dé monet, 2007 ) 。 Sp renger2 Charolles, &
Hazan, V. , & Barrett, S ( 2000 ) . The development of phonem ic . categorization in children aged 6 - 12. Jou rna l of Phonetics, 28 ( 4 ) ,
377 - 396.
Heeren, W. ( 2005 ) . Percep tual Development of the Duration Cue in Dutch /A 2a: /. IN TERS PEECH 2 2005 2Eu rospeech ( pp. 745 - 748 ) . L isbon, Portugal . & D roge, J. ( 1995 ) . Temporal and spectral cue use for initial hearing children and adults European jou rna l of disorders of .
comm un ica tion , 30 ( 4 ) , 417 - 434.
参
A t , H. O.
考文
献
( 1976 ) . The A coustic variation of M andarin Tones.
P honetica, 33 ( 5 ) , 353 - 367.
B lum stein, S E. , Myers, E. B. , & R issman, J. ( 2005 ) . The .
Percep tion of Voice Onset Tim e: An f R I Investigation of Phonetic M Category Structure. Jou rnal of Cognitive N euroscience, 17 ( 9 ) , 1353
- 1366.
Bogliotti, C. ( 2003 ) . Relation between categorical percep tion of
speech and reading acquisition. In Solé M. J. , Recaesens, D. & , Romero, J. ( Eds ) . P roceedings of the 15 th Interna tiona l Cong ress .
of Phonetic S ciences ( pp. 885 - 888 ) . Barcelona, Spain.
Bon te, M. L. , Poe lm an s, H. , & B lom ert, L.
( 2 0 0 7 ) . D evian t
neu rop hysio logical re spon se s to p hono logical regu la ritie s in
sp eech in dyslexic ch ild ren. N eu ropsycholog ia , 4 5 ( 7 ) , 1 4 2 7
- 1 4 3 7.
Burnham , D. K ( 1986 ) . Developmental Loss of Speech Percep tion: . Exposure to and Experience with a First Language. A pplied
Psycholingu istics, 7 ( 3 ) , 207 - 240.
D iehl, R. L. , Lotto, A. J. , & Holt, L. L. ( 2004 ) . Speech percep tion. A nnual R eview of Psychology , 55, 149 - 179.
Dufor, O. , Serniclaes, W. , Sp renger2 Charolles, L. , & D é monet, J. Eim as, P. D. , Siqueland, E. R. , Jusczyk, P. , & V igorito, J. Elliott, L. L. , Longinotti, C. , Meyer, D. , Raz, I , & Zucker, K . . CV syllables The Jou rna l of the A co

ustical S ociety of Am erica , 70, .
669 - 677.
Flege, J. E. , & Eefting, W. ( 1986 ) . L inguistic and developmental effects on the p roduction and percep tion of stop consonants .
Phonetica , 43 ( 4 ) , 155 - 171.
Francis, A. L. , Ciocca, V. , & Ng, B. K C. ( 2003 ) . On the . ( non) categorical percep tion of lexical tones Perception & .
Halle, P. A. , Chang, Y. C. , & B est, C. T.
M andarin Chinese vs F rench listeners J ou rna l of Phonetics, 3 2 . . ( 3 ) , 3 95 - 4 2 1.
F. ( 2007 ) . Top 2down p rocesses during auditory phoneme
- 1707. - 306. Psychophysics, 65 ( 7 ) , 1029 - 1044.
categorization in dyslexia: A PET study N euroim age, 34 ( 4 ) , 1692 .
( 1971 ) . Speech Percep tion in Infants S cience, 171 ( 3968 ) , 303 .
( 1981 ) . Developmental differences in identifying and discrim inating
W alley, A. C. , & Flege, J. E. ( 1999 ) . Effect of lexical status on children ’s and adults’ percep tion of native and non2native vowels . standard Chinese. Chinese Teach ing in the W orld , 3, 54 - 66.
W ang, S Y ( 1976 ) . Language change. A nnals of the N ew York . .
A cadem y of S ciences, 28, 61 - 72.
W ang, Y J. , & Shangguan, X. N. ( 2004 ) . How Japanese learners . of Chinese p rocess the asp irated and unasp irated consonants in
( 20 0 4 ) .
Iden tification and d iscrim ination of M andarin Ch inese tones by
L iberman, A. M. , Cooper, F. S , Shankweiler, D. P. , & Studdert2 .
R eview , 74 ( 6 ) , 431 - 461.
L isker, L. , & Abram son, A. S ( 1970 ) . The voicing dim ension: .
Luo, H. , N i, J. T , L i, Z H. , L i, X. O. , Zhang, D. R. , Zeng, . . F. G , Chen, L. ( 2006 ) . Opposite patterns of hem isphere . dom inance for early auditory p rocessing of lexical tones and
N
N ittrouer, S , & M iller, M. E. ( 1997 ) . Predicting developmental .
Holden 2Pitt, L. D. , Hazan, V. , Revoile, S G , Edward, D. M. , . . Jusczyk, P. W. ( 1997 ) . The D iscovery of S poken L anguage. Cambridge, Massachusetts, USA: The M IT Press Klatt, D. H. . and lexical access Jou rna l of Phonetics, 7 ( 3 ) , 279 - 312. . Klatt, D. H. ( 1980 ) . Software for a cascade /parallel for mant synthesizer The Jou rnal of the A coustical S ociety of Am erica , 67 . ( 3 ) , 971 - 995.
Interna tiona l Cong ress of Phonetic Sciences ( pp. 563 - 567 ) .
U n ited S tates of Am erica , 103 ( 51 ) , 19558 - 19563.
Xu, Y S , Gandour, J. T , & Francis, A. L. ( 2006 ) . Effects of . . .
Simon, C. , & Fourcin, A. J. ( 1978 ) . Cross2language study of
Am erica , 63 ( 3 ) , 925 - 935. Jou rna l of Phonetics, 27 ( 3 ) , 307 - 332.
p losive voicing percep tion by hearing2impaired children and normal2 Prague: Academ ia. consonants P roceed ings of the N a tiona l A cadem y of S ciences of the . Huotilainen, M. , Iivonen, A. , Vainio, M. , & A lku, P. , electric and magnetic brain responses N a tu re, 385, 432 - 434. .
Society of Am eric

a , 101 ( 4 ) , 2253 - 2266.
Kennedy, M. ( 1967 ) . Percep tion of the speech code. Psycholog ica l
Some experim ents in comparative phonetics P roceed ings of the S ixth .
[王韫佳 , 上官雪娜 . ( 2004 ) . 日本学习者对汉语普通话不送气 /送
气辅音的加工 . 世界汉语教学 , 3, 54 - 66 ]
K , ( 1997 ). Language2specific phoneme rep resentations revealed by . shifts in percep tual weighting schemes The Journa l of the A coustica l . speech 2 pattern learning The Jou rna l of the A coustical S ociety of .
( 1979 ) . Speech percep tion: A model of acoustic2 phonetic analysis t nen, R. , Lehtokoski, A. , Lennes, M. , Cheour, M. , Ilmoniem i, R. J. , Luuk, A. , A llik, J. , Sinkkonen, J. , & A lho,
7 期
席等 : 汉语语音范畴性知觉及其发展洁
Am erica , 120 ( 2 ) , 1063 - 1074.
579
language experience and stim ulus comp lexity on the categorical percep tion of p itch direction. Jou rna l of the A coustica l S ociety of
Ca tegor ica l Perception of VO T and L ex ica l Tones in Ch in ese and the D evelopm en ta l Course
X I J ie , J I AN G W ei , ZHAN G L in 2 Jun , SHU H ua
1 1, 2 3 1
( S tate Key L abora tory of Cognitive N eu roscience and L ea rn ing, B eijing N or a l U n iversity, B eijing 100875, Ch ina) m ( A erom ed icine R esearch D epa rtm en t, C ivil A erom ed icine Center of General A dm in istra tion of C ivil A via tion of Ch ina, B eijing, 100025, Ch ina) ( College of Chinese studies, B eijing L anguage and Cu ltu re U n iversity, B eijing 100083, Ch ina)
3 2
1
Abstract
Speech p e rcep tion focuses on the m app ing be tw een p rop erties of the acoustic signals and lingu istic e lem en ts such as p honem es. O ne of the m ost im p o rtan t featu res of sp eech percep tion is the p henom enon know n as ca tego rical pe rcep tion ( C P ) that the con tinuous senso ry inp u ts a re coded categorica lly. C P has an im p o rtan t influence on the deve lopm enta l tim e cou rse of sp eech p e rcep tion. A lthough a la rge am oun t of research on C P has been conducted in Eng lish and o the r languages, C P ( espec ia lly its deve lopm en ta l cou rse ) in C hinese has been bare ly studied. C h inese is a tona l language w ith som e sp ecific phone tic cha racteristics, such as strong asp iration w ith long positive voice onse t tim e ( VO T ) and and lexica l tones in C h inese is catego rica l and how they deve lop w ith age a re still unaddressed. U sing the stim u li of VO T and tone continua c reated by K latt, the p resen t tw o studies investigated C P of VO T and lex ical tones in C hinese and their deve lopm en ta l course. lexical tones cha racterized by sy llab le 2level f0 con tou rs. H ow eve r, the questions such as w he ther the pe rcep tion of VO T lexical tone con tinua and VO T con tinua in adults. typ ica lly catego rica l fo r adu lts; tim e to deve lop.
U sing the classical iden ti

fica tion and d iscrim ination pa rad igm , study 1 investiga ted the pe rcep tion of C hinese
The study w as com p rised of 4 expe rim ents w h ich included identifica tion and d isc rim ination of VO T and tone resp ective ly. S tim u li w e re p resen ted to 20 adu lt sub jects in each expe rim en t The resu lts dem onstrated tha t the p e rcep tions of VO T and lex ica l tones a re both ca tego rical fo r C hinese . adu lts.
S tudy 2 fu rther investigated the deve lopm en ta l course of C hinese p hone tic ca tego rization ac ross lex ica l tone and
VO T con tinua. The exp erim en ta l design of th is study is a 2 ( en tity stim uli: VO T, lexica l tone ) by 4 ( age: 5 ys, 6 ys, one. Resu lts from S tudy 2 revea led that six 2yea r2o ld child ren already acqu ired adu lt2like lexica l tone C P com p e tence, of lex ica l tones is acqu ired ea rlie r than C P of VO T in C h inese.
7 ys, adults ) m ixed exp erim en t design. The form er w as a w ithin 2sub ject fac tor, w hile the latter w as a betw een 2subjec t
p hono log ical charac te ristics show ed tha t they are no t co rrelated w ith each o ther. Thus, it is suggested tha t these tw o p hone tic cha racte ristics a re d istinct and go th rough d iffe ren t developm ental cou rses. C P of lexica l tone seem s to be a p hone tic cha racte ristic that is easie r to acquire than C P of VO T in C hinese. C h inese. A cco rding to the theo ry p rop osed by B u rnham , w e conclude that the C h inese lex ica l tone is a " robust" but even 7 2year2o ld ch ild ren w ere no t as good as adu lts w hen do ing C P of VO T tasks. The refore, it is p roposed that C P Furthe r analysis of the correla tion betw een the 2
In conc lusion, the find ings dem onstrated tha t: ( 1 ) the p e rcep tions of both VO T and lex ical tones in Ch inese are
( 2 ) there are diffe rent developm en tal cou rses fo r C P of lexical tones and VO T in
con trast and is ca tego rically p erce ived in early ch ildhood; in contrast, VO T is a " frag ile" con trast tha t requires m ore
Key words　C a tego ry Pe rcep tion; V o ice O nse t T im e ( VO T ) ; lex ica l tones; deve lopm en ta l cou rse

1