汉语语音范畴性知觉及其发展

本文由wanghuihumer贡献
pdf文档可能在WAP端浏览体验不佳。建议您优先选择TXT,或下载源文件到本机查看。
心理学报 2009, Vol141, No17, 572 - 579
A cta P sych o log ica S in ica
DO I: 10. 3724 / SP. J. 1041. 2009. 00572
汉语语音范畴性知觉及其发展
席 洁 姜 薇
1 1、 2
张林军 舒 华
3
1
( 1认知神经科学与学习国家重点实验室 ,北京师范大学 ,北京 100875)
( 航空医学研究室 ,中国民用航空总局民用航空医学中心 ,北京 , 100025) ( 3汉语学院 ,北京语言大学 ,北京 100083)
2
摘 要 范畴性是言语知觉的一个显著特征 ,长期以来一直受到研究者的普遍关注 。但汉语不同语音特征的范畴 性知觉特点及其发展模式迄今为止还很少有研究涉及 。本研究利用语音合成的方法分别改变辅音的送气 /不送气 特征和声调的基频曲线 ,生成语音刺激连续体 ,采用范畴性知觉的经典研究范式探讨了汉语正常成人被试嗓音启 动时间 (Voice onset tim e, VOT)和声调范畴性知觉的特点及不同年龄儿童的发展模式 。研究结果表明 : ( 1 ) 成人被 试对 VOT和声调的知觉是范畴性的 ; (2)对于汉语声调特征 , 6 岁儿童已经具有类似成人的范畴性知觉能力 ; 而在
VOT这一维度上 ,范畴知觉能力随着年龄发展不断精细化 , 但 7 岁儿童也尚未达到成年人的敏感程度 , 说明汉语 VOT和声调这两个不同的语音特征经历了不同的发展模式 。
关键词 范畴性知觉 ; VOT; 声调 ; 发展模式 分类号 B842
1 前言
1. 1 语音范畴性知觉
语音知觉是一种非连续性的 、 具有离散特点的 范畴性知觉 ( Categorical percep tion, CP ) ( L iberman, Cooper, Shankweiler, & Studdert - Kennedy, 1967 ) , 即语音刺激被知觉为数量有限的范畴 , 人们对同一 范畴内的语音差别难以区分 , 而对范畴间的差异则 非常敏感 。 范畴性是言语知觉的一个显著特点 , 在言语的 感知和表征过程中起着重要作用 ,因此在过去的 50 年中范畴性知觉一直是言语知觉研究的热点问题 。 西方音系的范畴性知觉研究主要集中在两个重要的 辅音特 征 上 , 即 嗓 音 启 动 时 间 ( Voice onset tim e, VOT)和第二共振峰过渡 。嗓音启动时间是指从声 音除阻到声带振动之间的时间间隔 , 这是区分辅音 清 /浊和送气 /不送气的主要特征 。第二共振峰过渡 则是区分塞音发音部位的主要特征 (D iehl, Lotto, & Holt , 2004 ) 。 范畴性知觉在儿童早期语言发展过程中具有重 要作用 ,婴儿语言发展研究表明 ,出生不久的婴儿能
够识别 所 有 的 语 音 区 分 特 征 ( Eim as, Siqueland, Jusczyk, & V igorito 1971; Jusczyk, 1997 ) ,但是这种 辨别是

基于声音的物理特征差异做出的 , 而不是有 组织 的 声 音 归 类 (即 范 畴 化 知 觉 ) ( Sim on, & Fourcin, 1978 ) 。随着语言经验的增多 , 6 个月大的 婴儿开始形成语音范畴的概念 , 但和成人模式存在 明显差异 ,因为儿童要获得和成人一样的语音知觉 能力 ,不仅要学会区分两个不同的语音刺激 ,还要将 这些刺激按照一定的规律组织到各自的音位范畴之 中 。婴幼儿和儿童语音加工能力的发展和精细化过 程可能与其日益提高的其他语言能力有关 。 那么 ,从什么年龄开始儿童具有了和成年人一 样的语音范畴化知觉能力呢 ? 一些研究发现儿童进 入学龄期以后其语音范畴性知觉能力和成人相比仍 有差异 ( Bogliotti, 2003; Elliott, Longinotti, M eyer,
Raz, & Zucker, 1981; Flege & Eefting, 1986; Heeren, 2005; D roge, 1995; N ittrouer, M iller, 1997; W alley & Flege, 1999; Bogliotti, 2003; M eyer, Raz, & Zucker, 1981; Elliott, Longinotti, Flege & Eefting, Holden 2Pitt, Hazan, Revoile, Edward, &
收稿日期 : 2008 - 05 - 26 通讯作者 : 舒华 , E 2 mail: shuh@ bnu. edu. cn
3 长江学者和创新团队发展计划 ( IRT0710) 、 国家自然科学基金项目 ( 60534080) 、 北京市教育委员会共建项目 ( SYS100270661) 资助 。
572
1986; Heeren, 2005; Holden 2Pitt, Hazan, Revoile,
3
7 期
席 等 : 汉语语音范畴性知觉及其发展 洁
573
Edward, & D roge, 1995; N ittrouer, M iller, 1997; W alley & Flege, 1999 ) ,比如 Hazan 和 B arret ( 2000 )
使用 2 项迫选范式 ,对 84 个听力正常的 6 ~12 岁儿 童和 13 个成年人进行了 6 个语音连续体的知觉能 力的考察 ,这 6 个语音连续体是通过改变单独的一 个或联合的几个语音特征形成的 。结果发现 , 识别 函数随年龄的增长斜率逐渐增加 ,但即使是 12 岁的 儿童 ,其识别能力仍与成人显著不同 。 1. 2 汉语语音的范畴性知觉研究 汉语音系具有自己的特点 , 辅音的强送气性以 及声调的存在是两个最显著的特征 。汉语普通话一 共有 22 个辅音 , 其中有 6 对以是否送气相区别 , 而 在英语语音体系以及东亚的日语等语音体系中 , 送 气 /不送气都不是区别性特征 。汉语辅音的送气 /不 送气特征主要靠 VOT来区分 。王韫佳和上官雪娜 ( 2004 )发现 , 和英语等音系中决定清 、 浊音的 VOT 一样 , 汉语母语者对决定汉语送气 /不送气特征的 VOT也有良好的范畴性感知 。 汉语 还是 一种 代表 性的 声调 语言 ( tone lan2 guage ) ,声调是一种能够区分语义的音高模式 ,声学 上主要表现为基频 ( f0 )的变化 ( A t, 1976 ) 。汉语的 四个声调在语音学上可以描述为高平 、 、 高升 降升和 高降 。对于汉语声调的范畴性知觉 , 有限的几项研 究结果并不完全

一致 。王士元 ( 1976 ) 的研究发现 汉语一声 (阴平 )和二声 (阳平 )的感知是范畴性的 ; 而 Halle, Chang和 B est ( 2004 )对台湾语被试声调感 知的研究发现 ,被试在识别任务中表现出良好的范 畴边界 ,但在分辨任务中除一声二声外 ,其余声调连 续体的区分高峰不明显 , 他们因此认为汉语声调的 范畴性知觉可能不如辅音那么明显 。 Francis, Cioc2 ca和 Ng ( 2003 )针对这种不一致的现象使用广东话 声调连续体进行了研究 , 发现刺激从广东话的高低 型声调变换为平调时 ,知觉模式为范畴性知觉 ; 当使 用广东话的两个平调作为刺激时 , 识别任务表现出 良好的范畴边界 ,而分辨任务没有出现明显的区分 高峰 。因此 Francis等人认为声调范畴边界可能由 自然听觉的敏感区域和语言经验共同影响 , 是类范 畴化的 。最近 Xu, Gandour和 Francis ( 2006 )使用普 通话的一声和二声声调连续体进行的研究发现汉语 被试对于一声二声的感知是范畴性的 。 总之 ,对汉语语音范畴性知觉的系统研究还很 少 ,汉语的语音特征与英语有一定的差别 ,汉语语音 特征的知觉是否也象英语语音特征那样是范畴性 的 ,还需要有更多的实验证据 。同时 ,儿童语音发展
研究发现语音范畴性知觉受到语言经验的影响 , 随 着年龄的增长 ,语音范畴性知觉能力不断改善 ,但是 目前还几乎没有来自汉语儿童语音范畴性知觉能力 发展的报告 。那么 , 汉语语 音的 两个 重要 特征 — VOT和声调的知觉模式是怎么样的以及以汉语为 母语的儿童在知觉这两个特征时的发展模式又是怎 样的 ,都需要进一步的研究 。 1. 3 研究目的 参考前人研究 ( Francis et al , 2003; Halle et . al , 2004; Hazan et al , 2000; Xu et al , 2006 ) ,我 . . . 们在实验一中首先采用语音范畴性研究普遍使用的 经典范式 — 识别 ( identification ) 和分辨 ( discrim ina2 tion )任务共同考察汉语成人被试对 VOT和声调这 两种不同语音特征的知觉模式是否为范畴性的 , 然 后在实验二中进一步考察不同年龄儿童 ( 5 ~7 岁 ) 的发展模式 。
2 实验一 : 成人 VOT和声调的范畴性
知觉实验
本实验通过语音范畴的识别实验和分辨实验 ,
分别操纵 VOT和声调形成语音刺激的连续体 ,以成 人为被试考察这两个语音特征是否为范畴性知觉 模式 。 2. 1 被试 本实验被试为 20 名北京师范大学在校学生 ,年 龄 18 ~25 岁 ,平均年龄 22 岁 ,其中女生 15 人 ,男生 5 人 。全部被试以汉语普通话为母语 , 裸视或矫正 视力正常 ,听力正常 。 2. 2 实验材料 语音连续体使用 Klatt合成器 ( 1979, 1980 ) 制 作 ,合成参数参考了中国科学院声学所 80 年代报告 的声学分析数据 (基

于一个成年男性普通话发音测 定 ) ,并参考 Hazan等人 ( 2000 ) 的人工合成方法 , 这 样可以得到比一般共振峰合成的语音刺激更接近自 然语音的刺激 。
VOT连续体包括 10 个人工合成的音节 , 10 个 刺激 VOT的长度从 0m s到 90m s,以 10m s的步长递 增 ,即从 0m s的不送气辅音范畴的极端值逐步线性 变化到 90m s送气辅音范畴的极端值 (如连续体中 第一个刺激 s1 的 VOT 长度为 0m s, 第二个刺激 s2 的 VOT长 度为 10m s 等 ) 。每 个音 节的长 度都 是
290m s,呈现时强度固定在 85dB。刺激被知觉为从 / bá /p á。 /到 /
识别和分辨实验中使用了不完全相同的声调连
574
心 理 学 报
41 卷
续体材料 。识别实验中声调连续体包括 21 个人工 合成的音节 ,每个音节的长度都是 270m s,呈现时强 度固定在 85dB。 21 个刺激声调从一声逐渐变化到 二声 ,声调的变化附着在韵母上 ,因此基频的变化是 从 80m s开始 。起始的基频频率从第 1 个到第 21 个 刺激逐渐从 204. 8Hz变化到 149. 2Hz, 每个刺激大 约以 2. 8Hz的步长降低起始基频频率 , 所有音节结 尾频率都保持 204. 8Hz 不变 。刺激被 知觉 为从 / m ā /到 /m á /。而分辨实验中的声调连续体只包括 o o 10 个音节 , 主要是加大了刺激之间基频频率的变 化 ,每个刺激大约以 6. 2Hz的步长降低起始基频频 率 ,以减少分辨实验的刺激对数目 , 缩短分辨实验 时间 。 2. 3 实验程序 识别实验包括 VOT和声调识别两个子实验 ,在
VOT识别任务中被试听到一个单一的声音刺激 , 然
VOT或声调连续体中所有相邻的刺激 ( 9 对 ) 、 间隔 一个的刺激 ( 8 对 ) 以及间隔两个的刺激 ( 7 对 ) , 每
个刺激对重复 6 次 , VOT和声调连续体分别有 144 对语音刺激 。 每个子实验都包括练习和正式实验 , 练习过程 和正式实验一样 , 以便被试熟悉实验程序 。正式实 验中 ,被试舒服地坐在笔记本电脑前 ,佩戴好专业耳 机 ,语音刺激通过耳机以双通道的方式随机呈现 ,要 求被试尽量准确快速的按键反应 。 使用 DMDX 实验系统呈现实验材料 。 DMDX 软件在一台 Dell笔记本电脑上运行 ,笔记本电脑和 具有掩蔽噪音功能的专业耳机相连 。 2. 4 结果和讨论 2. 4. 1 识别实验结果 1 是 VOT和声调在识别 图 任务中的范畴曲线 。左侧图横坐标代表改变 VOT 获得的语音刺激连续体 ,其中 1 号刺激的 VOT值为 0m s, 10 号刺激的 VOT 值 为 90m s, 每个刺 激之 间 VOT差值为 10m s,纵坐标代表识别为某一个范畴的 识别率 。可以看到 ,在 VOT为 40 ~50m s之间时 ,范 畴曲线的斜率出现了突变 , 表明汉语被试对于送气 辅音的识别率有了显著提高 。观察识别曲线中正

确 率为 50%的刺激序列 ,我们可以推断送气和不送气 辅音的区分边界大约在 45m s左右 。
后判断这个声音是 / bá /还是 /p á 在声调识别任务 /; 中被试则判 断是 /m ā /还是 /m á / ) 。 VOT 连续 体 o o 中的 10 个独立的语音刺激各重复 4 次 , 共 40 个语 音项目 ,声调连续体的 21 个独立的语音刺激也各重 复 4 次 ,共 84 个语音项目 。 分辨实验也包括 VOT和声调分辨两个子实验 , 实验要求被试认真听前后呈现的两个刺激 , 然后判 断这 两 个 刺 激 是 否 相 同 。成 对 呈 现 的 刺 激 包 括
图 1 汉语语音特征识别函数的范畴曲线 (左侧为 VOT特征 ,右侧为声调特征 )
1 右侧横坐标代表改变基频获得的语音刺激 图 连续体 , 第 1 个刺激是标准的一声 , 第 21 个刺激是 标准的二声 ,纵坐标代表识别为某一个范畴的识别 率 。可以看到 ,对汉语声调一声和二声的识别也具 有明显的范畴性 , 从第 10 个刺激开始 , 识别为二声 的比率明显提高 , 第 13 个刺激识别率达到 50%左 右 ,可以认为是两者的边界 。 2. 4. 2 分辨实验结果 2 是 VOT和声调在分辨 图
实验中的结果 (间隔一个刺激 ) 。分辨实验得到了 和识别实验类似的结果 。对 VOT的辨别率做单因 素方差分析 , 结果表明刺激对的主效应显著 , F ( 7, 47 ) = 11. 61, p < 0. 001。进一步多重比较发现 , s2
- s4、 - s5、 - s6、 - s7 几个刺激对的分辨率高 s3 s4 s5 于 s1 - s3、 - 8、 - 9 和 s8 - s10 ( p < 0. 001 ) 。这 s6 s7
说明前一个部分的刺激对跨范畴边界 , 分属不同范 畴 ,因而识别率较高 ; 而后面的这些刺激对来自同一
7期
席 等 : 汉语语音范畴性知觉及其发展 洁
575
个范畴内部 ,所以不易分辨它们之间的差异 。从图 2 来看 ,辨别曲线有明显的峰值 , VOT的范畴边界在 30 ~40m s左右 ,与识别任务的边界值相似 。
范畴性知觉模式的比较 , 进一步考察哪个年龄段的 儿童语音范畴性知觉能力可以达到与成年人相似的 水平 。 3. 1 被试 51 名儿童被试 , 其中来自幼儿园的儿童 32 共 名 ,分为中 、 大班两个年级水平 。 5 岁儿童 16 人 (男 生 7 名 ,平均年龄 5. 3 岁 ) , 6 岁儿童 16 人 (男生 9 名 ,平均年龄 6. 5 岁 ) ,这些儿童没有接受过正规的 读写教育 。来自小学一年级的儿童 19 人 (男生 9 名 ,平均年龄 7. 5 岁 ) 。参加实验儿童的家庭背景 在社会经济地位 、 父母受教育水平等方面基本相同 。 3. 2 实验材料 VOT连续体和成人实验相同 ,只有嗓音启动时 间 (VOT)发生变化 ,表现为从音节 / bá 到音节 /p á / / 逐渐变化 。为减少儿童实验时间 , 声调连续体使用 成人识别实验的 11 个奇数语音刺激 ,只有基频 ( f0 )

发生变化 ,表现为从音节 /m ā /到 /m á /逐渐变化 。 o o 3. 3 实验程序 要求儿童判断单独呈现的每一个刺激是 / bá / 还是 /p á (或 者 是 /m ā /还 是 /m á / ) , 并 根 据 屏 幕 / o o 上呈现的图片进行选择 。儿童实验采用更为形象的 指导语 ,以调动儿童参与的积极性 。并增加学习和 练习的次数 ,确保儿童正确理解实验要求 。而且 ,在 正式实验中增加休息时间和休息次数 , 使儿童保持 注意力集中 。另外 , 使用两张图片表示两个备选答 案 ,实验过程中在屏幕上一直呈现 ,以最大程度地减 小短时记忆的影响 。其余程序同成人实验 。 3. 4 结果和讨论 3. 4. 1 VO T 和声调特征的发展模式 辅音 VOT 和声调范畴知觉的年龄曲线见图 3, 其中横坐标是 线性变化的刺激序列 , 纵坐标代表被试把语音刺激 识别为 /p á /或者 /m á /的识别率 。四条曲线分别是 o 3 个不同年龄组和成人 (实验一中成人结果 )的平均 识别率 ,每个点是所有被试对横坐标相应刺激四次 反应的总平均 。 可以看到 , 5 岁儿童对于汉语辅音 VOT和声调 的知觉都已经表现出了明显的范畴性 , 为了更好地 反映范畴性知觉能力的年龄差异 , 我们首先利用线 形回归的方法将每个刺激系列点的平均数生成一个 斜率值 ,以此作为个人语音范畴性知觉能力的指标 (表 1 ) , 然 后 对 斜 率 值 做 单 因 素 方 差 分 析 , 结 果 发现 : VOT特征上 , 年龄的主效应显著 , F ( 3, 67 ) 在 = 7. 77, p < 0. 001。进一步的多重比较 ( TUKEY检
图 2 两个声音连续体二阶刺激对分辨分数与刺激 对之间的关系 ( s1 代表连续体的第一个刺激 )
对声调的辨别率做单因素方差分析 , 结果表明 刺激对的主效应显著 , F ( 7, 147 ) = 22. 94, p <
01001。进一步的多重比较发现 , s2 - s4、 - s5、 s3 和 s4 - s6 几个刺激对的分辨率高于 s6 - s9、 - s8 和 s7 s8 - s10 几个刺激对 ( p < 0. 001 ) ,这是因为这些刺
激分别属于同一或者不同的声调范畴 。从辨别曲线 的峰值 ,我们可以近似地推论 ,一声和二声两个声调 的范畴边界在 s3 - s5 之间 ,这与识别范式得到的范 畴边界值非常相似 。 汉语作为一种有声调的音节语言 , 与西方的重
音语言在语音特征上存在很大差异 , 而对汉语语音 范畴性知觉的系统研究还很少 。实验一发现汉语成 人被试对嗓音启动时间和一声 、 二声的声调感知具 有明显的范畴性 。那么这种范畴性感知的能力是如 何发展的 ,汉语儿童何时能够获得和成人类似的语 音范畴区分能力 ,这种范畴性感知能力的发展是否 存在一个关键年龄 ? 在实验二中 , 我们将进一步考 察这种言语知觉能力的发展模式 。
3 实 验 二 :

汉 语 语 音 范 畴 性 知 觉 的
发展
由于在实验一中 , 分辨范式和识别范式得到的
结果基本一致 ,因此实验二中儿童只进行记忆负荷 较小的识别范式实验以缩短实验时间 。本实验考察 5 岁到 7 岁的汉语儿童嗓音启动时间 (VOT) 和声调 两个语音特征知觉的发展模式 , 并通过儿童和成人
576
心 理 学 报
41 卷
验 )分析结果表明 , 成年组与三个儿童组之间的差 异 都 是 显 著 的 ( p < 0. 001, p = 0. 001, p = 01021 ) ,而三个儿童组之间 , 5 岁组与 6 岁 、 岁组存 7 检验 ) 分析结果表明 , 5 岁组与 6 岁组 、 岁组的差 7 异显著 ( p = 0. 012, p = 0. 001 ) ,而 6 岁组 、 岁组 7 和成年人之间的差异都不显著 ( p > 0. 05 ) 。
表 1 VOT和声调知觉的斜率
VOT L iner 斜率
M SD
在显著差异 ( p = 0. 006, p < 0. 001 ) , 6 岁组与 7 岁组差异不显著 ( p > 0. 05 ) 。
图 3 儿童言语知觉能力随年龄的发生与发展过程 (与实验一中成年人结果对比 ) 左边为声调范畴知觉的年龄曲线 ( T1 代表声调连续体的第一个刺激 ) , 右边为 VOT范畴知觉的年龄曲线 (V1 代表 VOT连续体的第一个刺激 )
在声调特征上 , 年龄的主效应显著 , F ( 3, 67 ) = 7. 03, p < 0. 001。进一步的多重比较 ( TUKEY
为了排除年龄的影响 ,在控制了儿童年龄之后 ,进行 偏相关的分析 , 相关为 0. 23, 也没有达到显著性水 平 。同时 ,成人组两个实验任务成绩的相关也只有
0. 11。这似乎说明对声调和嗓音启动时间这两个语
音特征的感知是相互独立的 , 嗓音启动时间和声调 有各自不同的发展时间窗口 , 可能因为前者属于快 速变化的信息 ,而后者属于慢速变化的信息 。最近 有关神经机制方面的研究也证明这两种信息存在不 同的加工机制 (Luo et al , 2006 ) 。 .
被试信息
声调 L iner 斜率
M SD
年龄
5岁 6岁 7岁
N
16 16 19 20
0. 45 0. 61 0. 66 0. 78
0. 26 0. 11 0. 15 0. 06
0. 57 0. 65 0. 67 0. 68
0. 14 0. 06 0. 03 0. 02
4 综合讨论
本研究通过两个实验 ,考察了汉语 VOT和声调 这两个语音特征的范畴性知觉和发展模式 。结果发 现 : ( 1 )汉语成人被试对 VOT和声调的知觉都是范 畴性的 ,证明汉语语音这两个特征的知觉和英语等 其它语言语音特征的知觉模式相同 ,都是范畴化的 ; ( 2 ) VOT和声调这两种不同的语音特征具有不同的 发展模式 。声调的区分较早获得 , 6 岁儿童即具有 和成年人类似的加工模式 。 VOT 的区分则较为困 难 ,需要相当长的发展过程 , 从 5 岁到 7 岁逐渐改 善 , 7 岁儿童 VOT 分辨的敏感性显著增加 , 但仍未 达到成人水平 。下面我们分两个方面进行讨论 。
4.

1 汉语 VO T 和声调范畴化知觉的特点
成年人 (实验一 )
这一结果说明 ,在声调特征上 , 6 岁的儿童就已
经获得了和成人类似的范畴性知觉能力 , 这可能是 汉语儿童声调范畴性知觉发展的一个关键年龄 。而 辅音 VOT的范畴性知觉能力 、 岁儿童也没有完全 7 获得 ,仍然处在进一步的发展中 。因此 ,我们认为声 调是一个相对容易获得的语音区分特征 , VOT的发 展则需要更长的时间 。
3. 4. 2 两个语音特征之间的关系 为了进一步探
讨 VOT和声调两个语音特征之间的关系 ,我们对所 有儿童组被试感知这两个不同语音特征的曲线斜率
进行了相关分析 , 相关系数为 0. 25, 相关不显著 。
汉语语音具有自己的特点 , 辅音的强送气性以
7 期
席 等 : 汉语语音范畴性知觉及其发展 洁
577
及声调的存在是两个最显著的特征 。汉语辅音的送 气 /不送气主要表现为 VOT的不同 , 而声调主要表 现为基频的变化 。对西方英语等语音体系的研究发 现区分辅音清 /浊特征的 VOT知觉是范畴性的 , 但 声调的感知是范畴性的还是连续的 , 结论却并不明 确 。从时间范围上来说 , VOT 一般只有几十毫秒 , 属于快速变化的信息 , 而声调的时间范围一般都在 几百毫秒 , 属于慢速变化的时间信息 。因此 , VOT 和声调的知觉机制可能是不同的 。 我们的研究发现 ,成人被试对于汉语 VOT的知 觉是理想的范畴感知 , 同时 , 从由 50%的正确率来 定义的范畴边界来看 ,汉语 VOT的范畴边界是较长 的正值 , 大约 45m s 左右 。这与 西方 英语 、 西班 牙 语 、 语 等 研 究 报 告 的 边 界 是 不 同 的 。 L isker 和 法 Abram son ( 1970 )一项跨语言的研究结果表明 , VOT 可以划分为三个区域 ,即负值 、 稍短的正值和较长的 正值 。不同语言中因为清 /浊和送气 /不送气的特征 对立而存在不同的范畴边界 。例如 , 西班牙语中的 浊辅音有很大的负值 ( - 80m s 左右 ) , 而英语中辅 音清 /浊特征的范畴边界是大约 20m s 左右 。 VOT 的范畴性知觉受到语言经验的影响 , 听者对于母语 音系中存在的范畴边界敏感 , 而对于非母语的边界 则很难辨别 。这可以解释我们的实验结果 , 汉语的 VOT是用来区分送气 /不送气特征的 , 对于这种特 征的 区 分 , VOT 的 范 畴 边 界 一 般 为 30m s 以 上 (W ang, et al , 2004 ) 。 . 对于声调的感知 ,我们的研究发现 ,汉语被试在 知觉阴平和阳平的声调刺激的时候是高度范畴化 的 ,但 Hally 的结果却并没有得到如此理想的范畴 曲线 ( Halle et al , 2004 ) 。他们的研究考察了对多 . 个汉语声调的辨别 , 结果发现声调的区分没有表现 出范畴曲线的突变现象 , 他

们因此认为汉语声调的 知觉是类似范畴化的 。这两个研究结果的差异可能 和使用的不同刺激有关 , Hally等的研究主要使用的 是没有意义的音节 ,而为了后续的儿童实验 ,我们的 研究使用了有意义的音节 , 语音知觉可能因此受到 了来自高层次词汇信息的调节作用 , 因此分辨就变 得更加敏锐 。W ang ( 1976 ) 也曾经报告过跟我们的 研究类似的结果 。 4. 2 汉 语 VO T 和 声调 范畴 性知 觉 的 不 同 发 展 模式 对不同年龄的汉语儿童 VOT和声调范畴性知 觉的发展研究发现 , 汉语儿童对于这两个语音特征 的知觉都是类似范畴性的 , 但不同语音特征的知觉
发展模式并不相同 : 声调的范畴性知觉获得较早而 VOT的区分则需要相当长的发展过程 。为什么声 调和 VOT具有不同的发展模式 ? 我们认为可能有 两方面的原因 ,一方面是这两个语音特征自身的差 异 ,另一方面是母语环境的影响 。 从声学特征来看 , VOT 一般只有几十毫秒 , 属 于快速变化的信息 ; 而声调是附着在音节 (元音和 浊辅音 )上的 ,时间范围一般都在几百毫秒 , 属于慢 速变化的信息 。因此 , VOT 的知觉要求更高的快速 时间加工能力 ,具有更高的难度 ,这种快速时间加工 能力需要更长时间的发展才能够完全获得 。 从母语环境的影响来说 , 声调是汉语语音独特 的区分性特征 ,而 VOT 则具有语言普遍性 , 但在不 同语言 中 有 一 定 的 差 异 。在 这 个 方 面 , Burnham ( 1986 )提出的语音知觉分辨能力发展的两阶段理 论可以提供很好的解释 。该理论把语音的区别性特 征分为两类 ,一类是较强的音位特征 ,另一类是较弱 的音位特征 。语音知觉的发展也经历了两个阶段 : 那些较强的音位特征 , 经过短暂的母语环境的熏陶 就可以获得 ,一般在儿童 3 岁以前就得到了良好的 发展 ,甚至有的音位特征儿童在 6 个月的时候就可 以区分 ; 另外一类音位特征需要经过长时间母语环 境的训练才能够逐步获得 , 儿童 5 岁到 8 岁之间都 在不断发展 。根据 B urnham 的观点 , 我们认为 , 汉 语声调是一种较强的音位特征 , 在母语环境影响下 能够得到快速发展 , 因此儿童可以较早获得良好的 范畴性知觉能力 ; 而辅音的嗓音启动时间则是一个 相对脆弱的语音特征 , 所以需要较长时间才能够达 到和成人相似的范畴性知觉能力 。
5 总结
言语的范畴化知觉在西方音系的研究中一直是 热点问题 ,但对汉语语音范畴性知觉的研究基本还 处于空白 。本研究发现 ,成人被试对汉语 VOT和声 调的知觉是范畴性的 , 而且汉语儿童对于这两种语 音特征的感知也是类似范畴性的 , 但是两种语音特 征经历了不同的发展模式 , 6

岁儿童的声调特征已 经和成人类似 ,而 VOT特征则在 7 岁时还和成人有 显著差异 。嗓音启动时间范畴性知觉能力究竟于哪 一个年龄段开始发展成熟 , 还需要进一步的研究 。 我们的研究使用心理物理学的实验范式描述了范畴 性言语知觉的行为模式 , 为这一领域的研究提供了 一个开端 。在今后的研究中 , 可利用多种技术做更 精细的研究 ,以考察范畴知觉的深层机制 ,如脑电中
578
心 理 学 报
41 卷
的 MMN (M ismatch negativey) 范式可以考察被试在 非注意条件下对听觉言语刺激的被动加工 , 非常适 合儿童的发展研究 ( N t nen et al , 1997; Bonte, . Poelm ans, & B lom ert, L. , 2007 ) 。另外 f R I等成 M 像技术也可以为范畴性语音知觉提供精确的脑解剖 结构和 功能 定位 ( B lum stein, M yers, & R issm an,
2005; Dufor, Serniclaes, Dé monet, 2007 ) 。 Sp renger2 Charolles, &
Hazan, V. , & Barrett, S ( 2000 ) . The development of phonem ic . categorization in children aged 6 - 12. Jou rna l of Phonetics, 28 ( 4 ) ,
377 - 396.
Heeren, W. ( 2005 ) . Percep tual Development of the Duration Cue in Dutch /A 2a: /. IN TERS PEECH 2 2005 2Eu rospeech ( pp. 745 - 748 ) . L isbon, Portugal . & D roge, J. ( 1995 ) . Temporal and spectral cue use for initial hearing children and adults European jou rna l of disorders of .
comm un ica tion , 30 ( 4 ) , 417 - 434.

A t , H. O.
考 文

( 1976 ) . The A coustic variation of M andarin Tones.
P honetica, 33 ( 5 ) , 353 - 367.
B lum stein, S E. , Myers, E. B. , & R issman, J. ( 2005 ) . The .
Percep tion of Voice Onset Tim e: An f R I Investigation of Phonetic M Category Structure. Jou rnal of Cognitive N euroscience, 17 ( 9 ) , 1353
- 1366.
Bogliotti, C. ( 2003 ) . Relation between categorical percep tion of
speech and reading acquisition. In Solé M. J. , Recaesens, D. & , Romero, J. ( Eds ) . P roceedings of the 15 th Interna tiona l Cong ress .
of Phonetic S ciences ( pp. 885 - 888 ) . Barcelona, Spain.
Bon te, M. L. , Poe lm an s, H. , & B lom ert, L.
( 2 0 0 7 ) . D evian t
neu rop hysio logical re spon se s to p hono logical regu la ritie s in
sp eech in dyslexic ch ild ren. N eu ropsycholog ia , 4 5 ( 7 ) , 1 4 2 7
- 1 4 3 7.
Burnham , D. K ( 1986 ) . Developmental Loss of Speech Percep tion: . Exposure to and Experience with a First Language. A pplied
Psycholingu istics, 7 ( 3 ) , 207 - 240.
D iehl, R. L. , Lotto, A. J. , & Holt, L. L. ( 2004 ) . Speech percep tion. A nnual R eview of Psychology , 55, 149 - 179.
Dufor, O. , Serniclaes, W. , Sp renger2 Charolles, L. , & D é monet, J. Eim as, P. D. , Siqueland, E. R. , Jusczyk, P. , & V igorito, J. Elliott, L. L. , Longinotti, C. , Meyer, D. , Raz, I , & Zucker, K . . CV syllables The Jou rna l of the A co

ustical S ociety of Am erica , 70, .
669 - 677.
Flege, J. E. , & Eefting, W. ( 1986 ) . L inguistic and developmental effects on the p roduction and percep tion of stop consonants .
Phonetica , 43 ( 4 ) , 155 - 171.
Francis, A. L. , Ciocca, V. , & Ng, B. K C. ( 2003 ) . On the . ( non) categorical percep tion of lexical tones Perception & .
Halle, P. A. , Chang, Y. C. , & B est, C. T.
M andarin Chinese vs F rench listeners J ou rna l of Phonetics, 3 2 . . ( 3 ) , 3 95 - 4 2 1.
F. ( 2007 ) . Top 2down p rocesses during auditory phoneme
- 1707. - 306. Psychophysics, 65 ( 7 ) , 1029 - 1044.
categorization in dyslexia: A PET study N euroim age, 34 ( 4 ) , 1692 .
( 1971 ) . Speech Percep tion in Infants S cience, 171 ( 3968 ) , 303 .
( 1981 ) . Developmental differences in identifying and discrim inating
W alley, A. C. , & Flege, J. E. ( 1999 ) . Effect of lexical status on children ’s and adults’ percep tion of native and non2native vowels . standard Chinese. Chinese Teach ing in the W orld , 3, 54 - 66.
W ang, S Y ( 1976 ) . Language change. A nnals of the N ew York . .
A cadem y of S ciences, 28, 61 - 72.
W ang, Y J. , & Shangguan, X. N. ( 2004 ) . How Japanese learners . of Chinese p rocess the asp irated and unasp irated consonants in
( 20 0 4 ) .
Iden tification and d iscrim ination of M andarin Ch inese tones by
L iberman, A. M. , Cooper, F. S , Shankweiler, D. P. , & Studdert2 .
R eview , 74 ( 6 ) , 431 - 461.
L isker, L. , & Abram son, A. S ( 1970 ) . The voicing dim ension: .
Luo, H. , N i, J. T , L i, Z H. , L i, X. O. , Zhang, D. R. , Zeng, . . F. G , Chen, L. ( 2006 ) . Opposite patterns of hem isphere . dom inance for early auditory p rocessing of lexical tones and
N
N ittrouer, S , & M iller, M. E. ( 1997 ) . Predicting developmental .
Holden 2Pitt, L. D. , Hazan, V. , Revoile, S G , Edward, D. M. , . . Jusczyk, P. W. ( 1997 ) . The D iscovery of S poken L anguage. Cambridge, Massachusetts, USA: The M IT Press Klatt, D. H. . and lexical access Jou rna l of Phonetics, 7 ( 3 ) , 279 - 312. . Klatt, D. H. ( 1980 ) . Software for a cascade /parallel for mant synthesizer The Jou rnal of the A coustical S ociety of Am erica , 67 . ( 3 ) , 971 - 995.
Interna tiona l Cong ress of Phonetic Sciences ( pp. 563 - 567 ) .
U n ited S tates of Am erica , 103 ( 51 ) , 19558 - 19563.
Xu, Y S , Gandour, J. T , & Francis, A. L. ( 2006 ) . Effects of . . .
Simon, C. , & Fourcin, A. J. ( 1978 ) . Cross2language study of
Am erica , 63 ( 3 ) , 925 - 935. Jou rna l of Phonetics, 27 ( 3 ) , 307 - 332.
p losive voicing percep tion by hearing2impaired children and normal2 Prague: Academ ia. consonants P roceed ings of the N a tiona l A cadem y of S ciences of the . Huotilainen, M. , Iivonen, A. , Vainio, M. , & A lku, P. , electric and magnetic brain responses N a tu re, 385, 432 - 434. .
Society of Am eric

a , 101 ( 4 ) , 2253 - 2266.
Kennedy, M. ( 1967 ) . Percep tion of the speech code. Psycholog ica l
Some experim ents in comparative phonetics P roceed ings of the S ixth .
[王韫佳 , 上官雪娜 . ( 2004 ) . 日本学习者对汉语普通话不送气 /送
气辅音的加工 . 世界汉语教学 , 3, 54 - 66 ]
K , ( 1997 ). Language2specific phoneme rep resentations revealed by . shifts in percep tual weighting schemes The Journa l of the A coustica l . speech 2 pattern learning The Jou rna l of the A coustical S ociety of .
( 1979 ) . Speech percep tion: A model of acoustic2 phonetic analysis t nen, R. , Lehtokoski, A. , Lennes, M. , Cheour, M. , Ilmoniem i, R. J. , Luuk, A. , A llik, J. , Sinkkonen, J. , & A lho,
7 期
席 等 : 汉语语音范畴性知觉及其发展 洁
Am erica , 120 ( 2 ) , 1063 - 1074.
579
language experience and stim ulus comp lexity on the categorical percep tion of p itch direction. Jou rna l of the A coustica l S ociety of
Ca tegor ica l Perception of VO T and L ex ica l Tones in Ch in ese and the D evelopm en ta l Course
X I J ie , J I AN G W ei , ZHAN G L in 2 Jun , SHU H ua
1 1, 2 3 1
( S tate Key L abora tory of Cognitive N eu roscience and L ea rn ing, B eijing N or a l U n iversity, B eijing 100875, Ch ina) m ( A erom ed icine R esearch D epa rtm en t, C ivil A erom ed icine Center of General A dm in istra tion of C ivil A via tion of Ch ina, B eijing, 100025, Ch ina) ( College of Chinese studies, B eijing L anguage and Cu ltu re U n iversity, B eijing 100083, Ch ina)
3 2
1
Abstract
Speech p e rcep tion focuses on the m app ing be tw een p rop erties of the acoustic signals and lingu istic e lem en ts such as p honem es. O ne of the m ost im p o rtan t featu res of sp eech percep tion is the p henom enon know n as ca tego rical pe rcep tion ( C P ) that the con tinuous senso ry inp u ts a re coded categorica lly. C P has an im p o rtan t influence on the deve lopm enta l tim e cou rse of sp eech p e rcep tion. A lthough a la rge am oun t of research on C P has been conducted in Eng lish and o the r languages, C P ( espec ia lly its deve lopm en ta l cou rse ) in C hinese has been bare ly studied. C h inese is a tona l language w ith som e sp ecific phone tic cha racteristics, such as strong asp iration w ith long positive voice onse t tim e ( VO T ) and and lexica l tones in C h inese is catego rica l and how they deve lop w ith age a re still unaddressed. U sing the stim u li of VO T and tone continua c reated by K latt, the p resen t tw o studies investigated C P of VO T and lex ical tones in C hinese and their deve lopm en ta l course. lexical tones cha racterized by sy llab le 2level f0 con tou rs. H ow eve r, the questions such as w he ther the pe rcep tion of VO T lexical tone con tinua and VO T con tinua in adults. typ ica lly catego rica l fo r adu lts; tim e to deve lop.
U sing the classical iden ti

fica tion and d iscrim ination pa rad igm , study 1 investiga ted the pe rcep tion of C hinese
The study w as com p rised of 4 expe rim ents w h ich included identifica tion and d isc rim ination of VO T and tone resp ective ly. S tim u li w e re p resen ted to 20 adu lt sub jects in each expe rim en t The resu lts dem onstrated tha t the p e rcep tions of VO T and lex ica l tones a re both ca tego rical fo r C hinese . adu lts.
S tudy 2 fu rther investigated the deve lopm en ta l course of C hinese p hone tic ca tego rization ac ross lex ica l tone and
VO T con tinua. The exp erim en ta l design of th is study is a 2 ( en tity stim uli: VO T, lexica l tone ) by 4 ( age: 5 ys, 6 ys, one. Resu lts from S tudy 2 revea led that six 2yea r2o ld child ren already acqu ired adu lt2like lexica l tone C P com p e tence, of lex ica l tones is acqu ired ea rlie r than C P of VO T in C h inese.
7 ys, adults ) m ixed exp erim en t design. The form er w as a w ithin 2sub ject fac tor, w hile the latter w as a betw een 2subjec t
p hono log ical charac te ristics show ed tha t they are no t co rrelated w ith each o ther. Thus, it is suggested tha t these tw o p hone tic cha racte ristics a re d istinct and go th rough d iffe ren t developm ental cou rses. C P of lexica l tone seem s to be a p hone tic cha racte ristic that is easie r to acquire than C P of VO T in C hinese. C h inese. A cco rding to the theo ry p rop osed by B u rnham , w e conclude that the C h inese lex ica l tone is a " robust" but even 7 2year2o ld ch ild ren w ere no t as good as adu lts w hen do ing C P of VO T tasks. The refore, it is p roposed that C P Furthe r analysis of the correla tion betw een the 2
In conc lusion, the find ings dem onstrated tha t: ( 1 ) the p e rcep tions of both VO T and lex ical tones in Ch inese are
( 2 ) there are diffe rent developm en tal cou rses fo r C P of lexical tones and VO T in
con trast and is ca tego rically p erce ived in early ch ildhood; in contrast, VO T is a " frag ile" con trast tha t requires m ore
Key words C a tego ry Pe rcep tion; V o ice O nse t T im e ( VO T ) ; lex ica l tones; deve lopm en ta l cou rse

1

相关文档
最新文档