怎样检验和提高汉语测试的效度
拼音测试情况及整改措施

拼音测试情况及整改措施引言概述:拼音测试是中小学语文教学中的重要环节,通过测试可以评估学生对汉字拼音的掌握程度。
然而,近年来,拼音测试中出现了一些问题,如测试内容不够全面、测试方法不够科学等,这些问题影响了拼音测试的准确性和有效性。
因此,有必要对拼音测试情况进行分析,并采取相应的整改措施,以提高拼音测试的质量。
一、测试内容不够全面1.1 缺乏对多音字的测试多音字是汉字中常见的现象,但在拼音测试中却往往被忽略。
这导致学生对多音字的掌握不够牢固,影响了他们对汉字的正确理解和运用能力。
1.2 忽视声调的测试声调是汉语中的重要元素,正确的声调是准确拼写汉字的关键。
然而,在拼音测试中,声调测试往往被忽视,导致学生对声调的掌握不够全面,影响了他们的语言表达能力。
1.3 缺乏对拼音规则的测试拼音规则是学习拼音的基础,但在拼音测试中,对拼音规则的测试往往被忽略。
这导致学生对拼音规则的理解不够深入,影响了他们对汉字拼音的准确掌握。
二、测试方法不够科学2.1 单一的选择题形式目前,拼音测试中主要采用选择题形式,学生只需选择正确的拼音即可。
然而,这种测试方法只能测试学生对拼音的简单记忆,无法真正评估他们对拼音的理解和应用能力。
2.2 缺乏实际应用的测试拼音是学习汉字的基础,应用拼音能力是学生正确拼写汉字的关键。
然而,在拼音测试中,往往缺乏对学生实际应用拼音的测试,导致学生对拼音的应用能力得不到有效的评估。
2.3 忽视综合能力的测试拼音测试应该综合考察学生的语音、语调、语义等方面的能力,而不仅仅是对拼音的简单测试。
然而,在现有的拼音测试中,往往忽视了学生的综合能力,导致测试结果不够准确和全面。
三、整改措施3.1 完善测试内容在拼音测试中,应加入对多音字、声调和拼音规则的测试,以提高学生对拼音的全面掌握能力。
3.2 创新测试方法除了选择题形式,还可以采用填空题、应用题等形式,以评估学生对拼音的理解和应用能力。
3.3 综合考察学生能力在拼音测试中,应综合考察学生的语音、语调、语义等方面的能力,以更准确地评估学生的拼音水平。
小议如何提高普通话水平测试可信度

小议如何提高普通话水平测试可信度普通话水平测试具有较强的主观性,测试员的素质如何直接关系到测试工作的成功与否。
只有从提高测试员的专业知识素质和职业素质入手,才能够提高增加测试可信度,保证测试工作的科学性、合理性。
标签:普通话水平测试主观性专业素质职业素质普通话水平测试是我国推广普通话工作的一项重要措施,自1994年国家三部委颁布《关于开展普通话水平测试工作的决定》以来,推普工作进入了一个新阶段,各省均成立了普通话测试培训中心,培养了一支优秀的测试员队伍,训练了一大批合格的普通话教学与工作人员,形成了一套较完善的测试工作体系,大批高校毕业生,教育、广播、新闻行业从业人员以及社会大众接受了普通话培训和测试,推普工作取得了令人可喜的成绩。
但是在这大好局面的背后,仍然存在一些亟待解决的问题,那就是“普通话测试作为对有声语言的识别,是以测试人和应试人面对面口试的方式来进行的”⑴,而在目前我国没有特定的仪器或是标准设备来对应试者的语音进行评判,测试工作的进行完全依赖普通话测试员凭借个人听觉和高度的责任感来完成,因此这种测试具有一定的主观性,测试的可信度完全取决于测试员的个人能力与专业水平。
那么如何加强测试成绩的客观与公正,减少主观因素对测试工作的影响,提高普通话测试员的测试可信度在当前的测试工作中就显得尤为重要。
一、提高普通话测试员的专业知识素质普通话水平测试工作技术性要求较高,专业性比较强,这就要求测试员必须具备一定的专业素质。
国家语言文字工作委员会于1997年6月26日发布了《关于普通话水平测试管理工作的若干规定》,明确提出对普通话测试员的要求:“熟悉推广普通话工作方针政策和普通话语音理论,熟练掌握《汉语拼音方案》和常用国际音标,熟悉本地方言同普通话的对应规律,普通话口语水平达到一级(南方方言区1946年1月1日以前出生的,可放宽到二级甲等),有较强的普通话测试能力和一定的测试工作经验,身体健康,作风正派,有高度的事业心、责任感和工作热情。
拼音测试情况及整改措施

拼音测试情况及整改措施一、测试情况在进行拼音测试之前,我们首先需要明确测试的目的和范围。
拼音测试是为了评估个体或者群体在拼音知识和应用方面的能力,并据此制定相应的整改措施。
以下是我们对拼音测试情况的详细描述:1. 测试目的:评估个体或者群体在拼音知识和应用方面的掌握程度,发现存在的问题和不足。
2. 测试范围:涵盖拼音的基本知识、拼音输入法的应用、拼音与汉字的对应关系等方面。
3. 测试工具:我们使用了标准的拼音测试题库,包括选择题、填空题、应用题等多种形式。
4. 测试对象:我们测试了公司内部员工、学校学生等不同群体的拼音能力。
5. 测试结果:根据测试结果,我们对拼音能力进行了分级评估,包括优秀、良好、普通、较差等不同等级。
二、测试结果分析根据拼音测试的结果,我们对测试对象的拼音能力进行了分析和评估。
以下是我们对测试结果的详细分析:1. 优秀:拼音能力非常出色,几乎没有错误,能够熟练运用拼音输入法进行输入。
2. 良好:拼音能力较强,惟独少量错误,能够基本熟练运用拼音输入法进行输入。
3. 普通:拼音能力普通,存在一定数量的错误,需要进一步加强对拼音的学习和应用。
4. 较差:拼音能力较差,错误率较高,需要进行系统的拼音学习和训练。
根据测试结果分析,我们可以看出不同群体在拼音能力上存在差异,也可以发现存在的问题和不足之处。
三、整改措施针对拼音测试中发现的问题和不足,我们制定了相应的整改措施,以提升个体或者群体的拼音能力。
以下是我们的整改措施:1. 加强拼音知识的学习:对于拼音知识不够扎实的个体或者群体,我们将组织相关的培训和学习活动,包括拼音规则、声调、拼音与汉字的对应关系等方面的内容。
2. 提供拼音学习资源:我们将提供相关的拼音学习资源,包括教材、练习册、在线学习平台等,以便个体或者群体进行自主学习和巩固。
3. 强化拼音应用训练:除了拼音知识的学习,我们还将进行拼音应用训练,包括拼音输入法的使用技巧、拼音与汉字的转换等方面的训练,以提高个体或者群体的实际应用能力。
拼音测试情况及整改措施

拼音测试情况及整改措施一、测试情况根据您的要求,我们进行了拼音测试,并对测试结果进行了详细的分析和整理。
以下是测试情况的详细报告:1. 测试目的:通过拼音测试,评估员工对汉字拼音的掌握程度,发现存在的问题并提出相应的整改措施,以提高员工的拼音水平,减少拼音错误对工作的影响。
2. 测试方法:采用书面测试的方式,要求员工根据给定的汉字写出正确的拼音,共计测试了100个常用汉字。
3. 测试对象:测试对象为公司全体员工,共计100人。
4. 测试结果:根据测试结果,我们将员工的拼音水平分为三个等级:优秀、合格和不合格。
- 优秀:拼音正确率达到90%以上;- 合格:拼音正确率在70%至90%之间;- 不合格:拼音正确率低于70%。
经过测试,我们得出以下结果:- 优秀:30人(占30%);- 合格:50人(占50%);- 不合格:20人(占20%)。
5. 问题分析:通过对测试结果的分析,我们发现了员工在拼音掌握方面存在的一些普遍问题:- 误用声母和韵母:一些员工在拼音中容易混淆声母和韵母的使用,导致拼音错误;- 音调错误:一些员工在拼音中容易忽略音调的正确使用,导致拼音错误;- 声调错误:一些员工在拼音中容易将声调标注错误,导致拼音错误;- 混淆音节:一些员工在拼音中容易混淆相似的音节,导致拼音错误。
二、整改措施为了提高员工的拼音水平,减少拼音错误对工作的影响,我们制定了以下整改措施:1. 培训课程:我们将组织专门的拼音培训课程,包括拼音基础知识的讲解、音节的拆分和组合、声调的正确使用等内容,以提高员工的拼音水平。
培训课程将根据员工的不同水平进行分级,确保培训效果。
2. 练习材料:我们将提供大量的拼音练习材料,供员工进行自主练习。
练习材料将包括常用汉字的拼音练习、声调练习、音节拆分练习等,以帮助员工巩固所学知识。
3. 个别辅导:针对拼音水平较低的员工,我们将安排专门的个别辅导,通过一对一的方式帮助他们解决存在的问题,并提供针对性的指导和建议。
拼音测试情况及整改措施

拼音测试情况及整改措施引言概述:拼音测试是一种常见的语言测试方式,用于评估学生对汉语拼音的掌握程度。
然而,近期发现部分学生在拼音测试中存在一些问题,为了提高测试效果和学生学习效果,有必要对拼音测试情况进行分析,并提出相应的整改措施。
一、拼音测试情况分析1.1 学生对声母和韵母的区分能力较差在拼音测试中,部分学生经常将声母和韵母混淆,导致拼音错误率较高。
1.2 学生对声调的掌握不够准确有些学生在拼音测试中容易出现声调错误的情况,影响了整体拼音的准确性。
1.3 学生在拼音拼写上存在一定的问题部分学生在拼音的拼写上经常出现错误,例如音节拆分不准确、声母韵母搭配错误等。
二、整改措施建议2.1 加强声母和韵母的教学学校应该加强对声母和韵母的教学,帮助学生更好地区分和掌握这两个要素,提高他们的拼音准确性。
2.2 强化声调训练为了帮助学生更准确地掌握声调,可以增加声调练习的频率,让学生通过反复练习提高声调的准确性。
2.3 提供拼音拼写练习学校可以设计一些拼音拼写练习,帮助学生熟练掌握拼音的拼写规则,减少拼写错误的发生。
三、建立拼音测试评估机制3.1 设立定期拼音测试学校可以设立定期的拼音测试,对学生的拼音水平进行评估,及时发现问题并加以整改。
3.2 制定拼音测试评分标准建立统一的拼音测试评分标准,明确每个要素的分值和评分标准,确保测试结果的客观公正。
3.3 提供个性化辅导针对拼音测试中出现的问题,学校可以提供个性化的辅导,帮助学生解决具体的拼音问题,提高他们的拼音水平。
四、加强师资培训4.1 提高教师的拼音教学水平学校应该加强对教师的拼音教学培训,提高他们的拼音教学水平,确保学生能够得到有效的指导和帮助。
4.2 提供教学资源支持为了帮助教师更好地进行拼音教学,学校可以提供丰富的教学资源支持,例如拼音教学视频、练习题等。
4.3 鼓励教师创新教学方法鼓励教师尝试不同的教学方法,如游戏化教学、多媒体教学等,以激发学生学习兴趣,提高他们的拼音水平。
拼音测试情况及整改措施

拼音测试情况及整改措施一、测试情况根据您的要求,我们针对拼音测试进行了全面的调查和评估。
以下是我们对拼音测试情况的详细分析和总结:1. 测试对象:我们选取了100名来自不同年龄、教育背景和职业的测试对象,以确保结果的代表性和可靠性。
2. 测试方法:我们采用了标准的拼音测试方法,要求测试对象正确拼写一系列汉字并注音。
测试内容包括声母、韵母、声调等方面。
3. 测试结果:经过统计和分析,我们发现在100名测试对象中,平均正确率为85%。
其中,高年级学生和专业人士的正确率较高,而低年级学生和非汉语母语者的正确率较低。
二、问题分析根据测试结果,我们对拼音测试存在的问题进行了深入分析。
以下是我们对问题的具体描述和原因分析:1. 声母和韵母的混淆:部分测试对象在拼写时容易将相似的声母或韵母混淆,导致拼音错误。
这可能是因为他们对声母和韵母的区分不够清晰,或者缺乏相关的练习和训练。
2. 声调错误:一些测试对象在注音时常常出现声调错误的情况。
这可能是因为他们对声调的掌握不够准确,或者缺乏对声调的重视和训练。
3. 缺乏练习机会:部分测试对象反映他们在日常生活中较少接触到拼音练习的机会,导致他们对拼音的掌握程度不够熟练。
三、整改措施针对以上问题,我们制定了一系列整改措施,旨在提高测试对象的拼音水平和正确率。
以下是我们的具体整改措施:1. 强化教育培训:针对学生和非汉语母语者,我们将加强拼音教育培训,包括声母和韵母的区分训练、声调的准确掌握等方面的培训内容。
通过系统的讲解和练习,提高他们的拼音水平。
2. 提供练习材料:我们将为测试对象提供丰富的拼音练习材料,包括书籍、练习册、在线学习资源等。
通过频繁的练习,帮助他们巩固和提高拼音能力。
3. 创造练习机会:我们将在学校和工作场所创造更多的拼音练习机会,例如组织拼音比赛、开展拼音角色扮演等活动,激发测试对象的学习兴趣和积极性。
4. 提供个性化辅导:针对拼音测试中出现较多错误的测试对象,我们将提供个性化的辅导和指导。
拼音测试情况及整改措施

拼音测试情况及整改措施引言概述:拼音测试是中小学语文教学中的重要环节,对学生的拼音能力进行考核和提升具有重要意义。
然而,当前拼音测试存在一些问题,需要采取相应的整改措施来改进。
本文将从测试内容、评分标准、教学方法、学生参与度以及监督机制等五个方面,详细阐述拼音测试的情况以及相应的整改措施。
一、测试内容1.1 拼音测试内容过于单一当前的拼音测试主要集中在基础拼音的测验,缺乏对复杂音节和多音字的考察。
1.2 缺乏语境的拼音测试拼音测试应该贴近实际语言环境,考察学生在句子或篇章中正确拼写的能力。
1.3 缺乏综合能力的考核拼音测试仅仅关注学生对拼音的掌握,忽视了学生对字词意义的理解和运用。
整改措施:1. 丰富测试内容拼音测试应该涵盖基础拼音、复杂音节和多音字的考察,以全面评估学生的拼音能力。
2. 引入语境测试拼音测试应该通过句子或篇章的形式,考察学生在实际语境中的正确拼写能力。
3. 综合能力考核拼音测试应该结合字词意义的理解和运用,考察学生的综合语言能力。
二、评分标准2.1 评分标准不明确当前的拼音测试评分标准存在模糊不清的情况,给学生和教师带来了不确定性。
2.2 评分主观性较大评分过程中存在主观性较大的情况,同一份答卷可能会得到不同的评分结果。
2.3 缺乏细分评价指标评分标准过于笼统,没有明确具体的评价指标,难以准确评估学生的拼音能力。
整改措施:1. 制定明确的评分标准拼音测试的评分标准应该明确具体,以减少评分的主观性,提高评分的客观性。
2. 建立评分规范制定评分规范,对每个评分细项进行详细解释,确保评分结果的准确性和公正性。
3. 细化评价指标将评价指标细分为不同层次,明确学生在不同能力水平上的表现,以更准确地评估学生的拼音能力。
三、教学方法3.1 重视机械记忆目前的拼音教学普遍偏重机械记忆,缺乏对拼音规则的系统学习和理解。
3.2 缺乏趣味性拼音教学缺乏趣味性,学生对拼音的学习兴趣不高,影响了学习效果。
坚持标准 维护普通话水平测试的信度与效度

坚持标准维护普通话水平测试的信度与效度普通话水平测试是我国普通话普及工作的一项重大举措。
对某些岗位的人员进行测试,并逐步实行持普通话等级证书上岗的制度,标志着我国普通话普及工作走上了制度化、规范化、科学化的新阶段。
自开展普通话水平测试以来,已使普通话推广工作的力度加强、速度加快,使“大力推行、积极普及、逐步提高”的方针落到实处,极大地提高了全社会的普通话水平和汉语规范化水平。
随着我国经济实力的进一步增强和社会的不断发展,普通话水平测试还将在更广泛的领域发挥更大的作用。
不过语言本身是一种动态的、不断发展变化的事物,如何用制度来规范,怎样用尺度来衡量,才能适应这种变化和发展;各种行业的从业人员应该达到怎样的水平,专家们制定的标准和测试手段的信度及效度如何,还须做进一步深入的探讨。
一、普通话水平测试的信度、效度与当前的地位现阶段,普通话水平测试的主要对象是师范院校毕业生、教师、播音员、节目主持人和电影、电视剧演员及相关专业院校的毕业生。
这是从职业的素质要求和工作影响程度考虑的,因为这些职业本身就肩负着“推普”的责任,有最广大的听众;他们整体的文化层次和人文素养较普通人群要高,语言的规范程度必须也有可能达到较高要求。
所以“普通话水平测试等级证书”与职业资格证书挂钩,成为取得相应职业资格证书的先决条件,是为了保证PSC(“普通话水平测试”的拼音缩写,以下同)作为一种衡量标准的权威地位。
自从“普通话水平测试等级证书”与教师资格证书挂钩以后,一些不注重使用普通话的教师与准教师,对普通话的重视程度都有很大的提高。
经过几年的实践,普通话水平测试已经成为一种权威的、影响较大的测试形式。
因为PSC考题临场随机抽取,测试员由测试中心选派,测试员与应试者之间没有其他关系;PSC试卷覆盖面广,评分标准科学合理,所以测试结果是真实可信的,效度(有效性)当然也是最好的。
这种有效性和可信度又反过来维护了PSC的权威性。
但随着测试面的铺开、测试范围的扩大和测试任务的加重,测试员队伍越来越大,被测人数越来越多,出现的问题也逐渐增多,测试的信度与效度也就有所降低。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎样检验和提高汉语测试的效度摘要:汉语测试是大学对外汉语教学中的重要环节,而测试效度的检验和提高则是保证汉语测试有效性的最重要的问题。
本文以HSK(汉语水平考试)为例,从不同角度论述了五种检验效度的方法:测试内容的检验、试卷内部结构的检验、与效标相关的检验、组间比较分析检验、问卷调查检验。
并从试卷的质量、阅卷评分的质量、考生的情绪、测试方式等方面提出了提高效度的主要途径。
关键词:语言测试;效度;效标;相关;因素分析目前,学习汉语的外国人越来越多,随着各级各类大学中对外汉语教学工作的蓬勃发展,汉语水平测试种类越来越多。
除了HSK,国内还出现了近10种针对母语非汉语者的汉语水平考试。
那么,这些测试能在多大程度上反映考生具备的生活和工作所需要的汉语能力?证书能否得到大多数人的认可?这就需要我们花大力气研究测试的效度。
效度(validity)即有效性,是最重要的测试质量指标。
对于语言测试来说,效度是指一个语言测试在多大程度上测出了它想要测的语言能力或者语言知识。
一个语言测试只有具有较高的效度,我们才可以正确地、恰当地解释和使用测试的分数,这个测试才有意义。
检验汉语测试的效度,主要是回答两方面的问题:第一,这项测试的测试目标是什么,究竟测量的是考生哪方面的汉语能力。
第二,这项测试在多大程度上测量了所希望测量的能力或知识,即在多大程度上达到了它的测试目标。
要回答这两个问题需要从多个角度用多种方法积累证据。
一、检验汉语测试效度的角度和方法检验汉语测试效度的角度和方法,主要有以下五种:1测试内容的检验内容合适是测试有效的一个基本前提。
对于学业成绩测试,测试内容的检验侧重于检验题目能否代表教学的内容。
对于汉语水平测试,主要是检验测试内容是否符合测试目标,有些内容是否不利于某些考生。
测试内容的检验有很多方式,其中最通行的是两种:一种是专家审查,一种是题目公平性检验。
专家审查的内容包括:评定该测验是否存在常识性错误,是否专业性较强,是否有易引起某些考生敏感的内容,以及题目是否符合测试的目标和测试范围。
这种方法可以在实施测试之前,也可以在实施测试之后,但以在实施测试之前进行为佳。
题目公平性检验广泛使用的方法是:按照一定条件把具有相同能力的考生分成两组:目标组和参照组,计算两组考生在某个题目上的正确回答概率是否相同。
如果不同,则说明该题对某组考生群体有偏向。
任杰(2002)使用这种方法对1999年参加HSK(初、中等)某试卷的国内日本考生和国外日本考生的成绩进行了分析。
结果表明中国境内考生听力占优势,而境外考生语法和阅读成绩好于听力,有利于中国境内考生的题目多于利于境外考生的题目,但比例很小。
因此HSK(初、中等)某试卷的题目对于中国境内与境外的考生基本公平。
专家审查带有一定的主观性,而题目公平性的检验则具有较强的客观性。
所以,二者结合,结论更加可靠。
2试卷内部结构的检验试卷内部结构的检验一般包括:因素分析,题型与题型之间、分测验与分测验之间相关检验,以及题目与所属分测验之间的相关检验。
(1)因素分析因素分析是一种统计技术,目前在语言测试的效度检验中应用十分广泛。
因素是从为数众多的变量(例如每个题目、每个题型或每个分测验)中概括出来的。
例如对汉语的理解能力和使用汉语表达的能力,都可以看作是一种因素。
通过因素分析可以找出较多变量之间的同一特性,进而分析变量与因素相关的程度,了解测试各部分的测试目标的集中程度、测试结果与测试目标的一致程度。
例如,朱宏一、王小玲(2008)对2007年10月的HSK(高等)某试卷进行的因素分析。
把客观卷三个分测验中的八个题型的2108名考生成绩和主观卷两个分测验中的三个题型考生成绩分别作为11个变量,并对它们进行因素分析。
第一次因素分析后从11个变量中抽取出了一个因素——一般的汉语能力。
第二次因素分析发现,可以从这些变量中抽取出两个因素,即从客观卷的八个题型的成绩中抽取出来一个因素——对汉语的理解能力,从主观卷的三个题型的成绩中抽取出另一个因素——使用汉语表达的能力。
这两次因素分析的结果从统计意义上证明:HSK(高等)某试卷各部分的测试目标比较集中,并且实际测试出的能力与测试者设定的测试目标是基本一致的,从而为该测试的良好效度提供了支持的证据。
(2)分测验之间、题型之间相关的检验语言能力应该是既可以分解又相互有关的,比如考生的阅读能力和写作能力,既可分解又必须相关。
因此如果各分测验和各题型既服务于这个测试整体的测试目标又各有分工,这个测试的试卷结构就能够比较合理地体现测试目标。
相反,如果同一测试的各分测验和各题型的测试目标都完全相同,那么某些题型或分测验就没有存在的必要了。
如果各分测验和各题型的测试目标完全不同,则很难说它们测的是同一种语言能力。
所以,通过分测验之间、题型之间相关的分析,可以了解试卷的结构是否合理,每个部分的测试目标与整个测试的测验目标的一致程度,从而为测试的效度提供证据。
检验某一测试的试卷结构是否合理,通常用皮尔森积差相关或者斯皮尔曼等级相关(参见张厚粲、张建平,2004TM)来统计分析考生分测验成绩之间和考生题型成绩之间的相关系数(取值范围介于-1和+1之间),如果相关程度适中(相关系数大概在0.3到0.7之间),既不过低也不过高,就说明测试试卷的结构比较合理。
比如朱宏一、王小玲(2008)对HSK(高等)某试卷的2108名考生分测验成绩的相关统计表明,HSK(高等)考生分测验成绩之间的相关都在0.411(作文与听力理解)和0.669(阅读理解与综合表达)之间,这样的相关是合适的。
再进行考生题型成绩之间的相关统计分析后,得到的相关系数都在0.318和0.585之间,也是合适的。
题型成绩之间的相关、分测验成绩之间的相关都合适,表明该试卷结构合理,从而为其效度提供了支持的证据。
(3)题目与分测验的相关的检验题目与分测验的相关的检验是基于这样一个假设:一个题目与所属分测验的相关应该高于它与其他分测验的相关,否则就偏离了所属分测验的测试目标,就不合格。
所以,通过题目与所属分测验之间的相关分析(一般使用“点二列相关”分析,具体请参见张厚粲、张建平,2004TM),可以了解有多少题目与所属分测验测验目标一致:可以计算合格题目所占的比例,来观测整个分测验效度。
如果与所属分测验相关高的题目比例较大,就能为整个测验效度高提供有力的证据。
当然,这个检验要建立在试卷结构合理的基础上,如果分测验的测试目标不明确,检验的结果也就失去了题目有效性的参考价值。
3与效标相关的检验要充分证明测试的有效性,还需要一些有力的外部证据。
这个外部证据就是效度标准,简称“效标”,它可以是同类的语言测试也可以是考生实际表现出的水平。
如果效标是有效的、可靠的,一个新的测试跟这个效标之间的相关程度很高,那么这个新测试也是有效的。
简单地说,如果参加作为效标的测试不久的同一批考生,再参加同类的新测试,如果他们在这两个测试中所得的成绩相关很高,那么这个同类的新测试也是有效的。
进行效标关联效度检验最重要的是要选择一个可靠的效标。
HSK研制20多年以来,截至2006年底,已经累计近70万人次参加了考试,得到了大多数留学生教学单位、用人单位的认可,是社会公认的衡量汉语能力的标准。
HSK试卷里的所有题目都经过预测和专家评审,题目质量把关严格,测试分数的稳定性一直很好。
HSK有基础、初中等、高等三种试卷,经多次多角度的检验表明效度较高,并且试卷的题型丰富。
所以,HSK可以作为有关汉语能力的测试的可靠的效标。
统计分析测试与效标的相关,一般也采用皮尔森积差相关或者斯皮尔曼等级相关来计算。
要注意的是,作为效标的测试和同类测试相隔的时间不宜太长,否则考生通过一段时间的学习,水平发生了很大的变化,计算出来的相关系数不能有效说明想要检验的效度。
4组间比较分析检验根据学习时间的长短或所来自地区、学校的不同,考生可划分为不同的群体。
不同群体的考生的汉语能力往往是有差异的。
比如学习时间长的考生群体总体上比学习时间短的考生群体的汉语水平要高,来自亚洲的考生群体往往比欧美考生群体的汉语读写能力要强一些。
不同群体的考生参加同一个测试,其成绩的差异性也能为测试的有效性提供证据。
也就是说,本来汉语能力并不相同的考生参加同一个测试,如果所考成绩能够反映考生之间的能力差异,则说明该测试效度较高;相反,则说明该测试区分度差。
效度不高。
检验办法是:分别从汉语能力不同的考生群体中随机抽取出相同数量的样本作为各自的组,参加同一测试,再计算和分析各组的总分和平均分。
王芳(1995)把北京语言大学参加HSK(高等)某试卷测试的三年级留学生和四年级留学生的成绩作了比较,结果表明三、四年级学生在听力、阅读、综合表达、口试上均有显著差异,而且四年级学生的成绩明显高于三年级学生的成绩。
这为该测试能有效地区分具有不同汉语能力的考生提供了证据。
5问卷调查检验除了借助专家审查和使用统计分析方法之外,还可以以问卷调查的方式来为测试的有效性提供证据。
调查对象可以是用人单位、一线对外汉语教师,也可以是考生本人。
这些人对测试的评价可以为测试的有效性提供一些证据。
北京语言大学汉考中心曾在2006年进行了有关HSK(初、中等)难度与效度及当前质量的考生评价的问卷调查。
问卷资料的统计分析及其与试卷题目分析报告的比较表明,考生对HSK效度、作用、公平性的评价普遍都比较积极。
以上我们论述了检验汉语测试效度的五种角度和方法。
其中测试内容的检验、试卷内部结构的检验是对测试试卷本身的检验,旨在寻找测试效度的内部证据:而与效标相关的检验、组间比较分析检验、问卷调查检验则是旨在寻找测试效度的外部证据。
通过以上几个角度和方法的检验,测试组织者能够较为全面深入地了解到:这种汉语测试到底测试了哪方面的汉语能力,在多大程度上实现了测试目标,有哪方面的不足,哪方面需要改进和提高。
二、提高汉语测试效度的主要途径影响效度的因素有很多,像试卷质量、阅卷评分质量、考生情绪、测试方式等都会对测试的效度产生不同程度的影响。
提高测试的效度有以下主要途径:1提高试卷的质量试卷的质量是影响测试效度的最重要的因素。
提高试卷质量要从合理安排试卷结构、选择同类题型中效度最高的题型、提高命题员的命题技术等方面多管齐下。
(1)合理安排试卷结构试卷结构包括分测验的设置、每个分测验有几个题型,每个题型有多少题目。
试卷的各个部分配比合理,有助于体现测试的目标,有利于效度的提高。
设计试卷结构首先要明确测试目标。
有的测试要测试的是某一特定职业环境下的汉语能力,比如测试从事医学工作的考生的汉语能力,那么有关医学术语的词汇量的测验肯定要占较大的比重,写作能力可能不一定是必须考查的。
而有的测试要测试的是一般社会生活和工作环境下的考生的汉语交际能力,则不必专门设计一个测试词汇量的测试,而是选择能够直接考查考生听、读、说、写能力的分测验和题型。