信度和效度
信度与效度

一、信度1.定义信度主要是指测量结果的可靠性或一致性。
信度只受随机误差的影响,随机误差越大,信度越低。
因此,信度可以视为测试结果受随机误差影响的程度。
系统误差产生恒定效应,不影响信度。
每一个测试的实得分数(X)总是由真实分数(T)和误差(E)两部分构成的,用公式表示如下:X=T+E如果我们讨论一组测验分数的特性时,可用方差代表具体分数,得到公式:S^2(x)=S^2(t)+S^2(e)公式中,S^2(x)是实得分数的方差,S^2(t)是真分数的方差,S^2(e)是误差的方差在测量理论中,信度被定义为:一组测量分数的真分数方差与中方差(实得方差)的比率。
即:r(xx)=S^2(t)/S^2(x)2.信度的指标大部分情况下,信度是以信度系数为指标,它是一种相关系数。
常常是同一被试样本所得到的两组资料的相关,理论上说就是真分数方差与实得分数方差的比值,公式为:r(xx)=r^2(xt)=S^2(t)/S^2(x)3.信度信度评估的方法(见具体例子)(一)重测信度,又称为稳定性系数,它的计量方法是采用重测法:用同一测验,在不同时间对同一群体施测两次,这两次测量分数的相关系数即为重测系数。
重测信度所考察的误差来源是时间的变化所带来的随机影响。
在评估重测信度时,必须注意重测间隔的时间。
对于人格测验,重测间隔在两周到6个月之间比较合适。
在进行重测信度的评估时,还应注意以下两个重要问题:⑴重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化。
⑵不同的行为受随机误差影响不同。
(二)复本信度,是以两个测验复本来测量同一群体,然后求得应试者在这两个测验上得分的相关系数。
复本信度的高低反映了这两个测验复本在内容上的等值性程度。
两个等值的测验互为复本。
计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。
复本信度也考虑两个复本实施的时间间隔。
复本信度的主要优点在于:⑴能够避免重测信度的一些问题,如记忆效果、练习效应等;⑵适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响;⑶减少了辅导或作弊的可能性。
信度和效度分析范文

信度和效度分析范文信度分析:信度是指测量工具在不同时间、不同测量者或不同测量内容下的稳定性和一致性。
如果测量工具具有高信度,那么它将能够产生相似或一致的结果。
以下是几种常见的信度分析方法:1.重测信度方法:重测信度方法是通过对同一组被试者进行两次以上的测量来评估测量工具的信度。
可以使用相关系数(如皮尔森相关系数、斯皮尔曼相关系数)来计算两次测试结果之间的相关性。
如果相关系数接近于1,则表明测量工具具有较高的重测信度。
2.分裂半信度方法:分裂半信度方法通过将测量工具分为两部分或多部分,然后计算这些部分得分之间的相关性来评估信度。
常见的方法包括将问卷的奇数题目和偶数题目分开计分,然后计算这两个得分之间的相关系数。
如果相关系数接近于1,则说明测量工具具有较高的分裂半信度。
3.内部一致性信度方法:内部一致性信度方法通过统计测量工具各个项目之间的相似性来评估信度。
最常见的方法是计算Cronbach's Alpha系数。
Cronbach's Alpha 系数越接近1,说明测量工具的内部一致性越高。
效度分析:效度是指测量工具能否准确地度量所要研究的概念或变量。
以下是几种常见的效度分析方法:1.内容效度:内容效度评估测量工具中各个项目是否能够充分覆盖研究的内容领域。
一般通过专家评审的方式来进行评估,专家将判断每个项目是否与所要研究的概念相关。
通常采用一致性指数来衡量内容效度,如简单一致性指数。
2.结构效度:结构效度评估测量工具所测量的概念结构的一致性。
可以使用因子分析或验证性因子分析来进行评估。
如果因子载荷值较高且具有合理的因子结构,那么测量工具就具有较高的结构效度。
3.判据效度:判据效度评估测量工具与其他已经被接受为有效的判据测量工具之间的相关性。
例如,对于一个测试学生的数学能力的测量工具,可以与学生成绩进行相关性分析。
如果相关系数较高,则说明测量工具具有较高的判据效度。
综上所述,信度和效度分析是量化研究中评估测量工具的关键步骤。
效度和信度名词解释

效度和信度名词解释
嘿,你知道啥是效度吗?就好比你要量一个人的身高,那尺子得是
准确的吧,能真正反映出这个人的实际身高,这就是效度啊!比如说,你用一把刻度都不准的尺子去量,那能得到准确的身高数据吗?肯定
不行啊!效度就是衡量我们所使用的测量工具或者方法,是不是真的
能够准确地测量到我们想要测量的东西。
那信度又是啥呢?想象一下,你每天早上都称体重,结果一会儿重
一斤,一会儿又轻两斤,你能相信这个称吗?这就和信度有关啦!信
度就是说,同一个测量工具或者方法,在不同的时间、不同的情况下,测量的结果得是稳定的、可靠的呀!如果一会儿一个样,那怎么能让
人相信呢?
咱就说,效度和信度那可太重要啦!就像盖房子,效度是根基得牢固,信度是建筑得稳定,缺了哪个房子都盖不起来呀!你想想,如果
考试的试卷效度不高,那能考出学生的真实水平吗?不能吧!如果一
个心理测试的信度不行,那结果能靠谱吗?肯定不靠谱呀!
再打个比方,效度就像是射箭要射中靶心,得瞄得准才行;信度就
像是箭要直直地飞过去,不能歪七扭八的。
没有效度,就像射箭射偏了;没有信度,就像箭飞着飞着就不知道去哪儿了。
所以啊,在各种研究、测量中,效度和信度那绝对是不能忽视的呀!它们是保证我们得到准确、可靠结果的关键呢!我的观点就是,一定
要重视效度和信度,不然一切都白搭!。
信度系数与效度系数的关系

信度系数与效度系数的关系1. 引言说到信度和效度,很多朋友可能会觉得这两个词听起来有些高深,其实它们在我们生活中的应用可真是无处不在。
比如说,咱们在考试时,总是希望自己的分数能反映出真实的水平,对吧?这就跟信度和效度有关系。
简单来说,信度就是测量的一致性,效度则是测量的准确性。
今天咱们就来聊聊这两者之间的关系,顺便也轻松一下。
2. 信度系数2.1 什么是信度系数信度系数,听起来像个数学公式,但其实它的意思很简单。
你可以把它想象成一把尺子,如果这把尺子每次量出来的结果都差不多,那么它的信度就高。
比如你每次量身高,结果都是175厘米,那这把尺子信度就高;如果有时候是170,有时候是180,那就得打个问号了。
信度系数的范围一般在0到1之间,越接近1,就说明这把尺子越靠谱。
2.2 信度系数的影响因素信度系数受很多因素的影响。
比如说,测试的题目质量、测量方法以及测试对象的状态都可能影响信度。
如果你考试的时候刚好生病了,或者心情不好,测出来的分数可能就不太准确。
因此,做好测试的设计和实施,可以提高信度,让你测量的结果更可靠。
3. 效度系数3.1 什么是效度系数好啦,咱们接着聊效度系数。
效度系数就像是在检查这把尺子是否真的能量到你想要的东西。
举个例子,如果你用这把尺子量的是身高,但它实际上测的是体重,那这显然就不靠谱了。
效度主要看的是你的测试是否能真实反映出你想测的内容。
就算这把尺子量得再准,如果它根本量错了对象,那也是白搭,对吧?3.2 效度系数的类型效度又可以分为几种类型,最常见的就是内容效度、标准效度和构念效度。
内容效度就是看测试的内容是否覆盖了你想测的范围;标准效度则是用你的测试结果跟一个公认的标准进行对比;而构念效度则是检查你测量的东西是否符合理论预期。
这些效度的类型就像是不同的检查方式,确保你的测量工具是真正有效的。
4. 信度与效度的关系4.1 两者的互动好,接下来我们聊聊信度和效度之间的关系。
可以说,信度是效度的基础,没信度,效度就无从谈起。
信度与效度

信度的评估
信度的评估一般用考试结果的相关系数来表示。相关系数
等于1表示该卷完全可靠,相关系数等于0则说明该试卷完
全不可靠。在实践中,人们往往根据具体情况对试卷的信 度提出不同的要求。通常是客观题的信度高于主观题。客 观题的信度系数一般定在0.99以上。如果一份试卷既有客 观题又有主观题,信度系数最好不低于0.80。在英语测试 中,一份好的试卷,其词汇、结构和阅读部分的信度系数 一般应在0.80-0.89之间,口试的信度系数一般在0.70-0.79
什么是信度?
信度也称可靠性,即当被测试对象本身发生变化,用同样 的“尺子”去重复测试时,总是获得类似的结果。因此, 信度也被称为一致性(consistency)。 如果说一个测试的信
度高,便是指一个考生的成绩序列经反复测试都大致相同。
如果说某次测试完全可靠,那便是指这次测试排除了一切 误差、绝对的准确。即一个考生的成绩经反复测试后完全 保持一致,一组考生经反复测试后,其成绩序列完全相同。 其实,绝对的准确是不可能的,因为人的因素是不稳定的。
部有效或全部无效。除非给有效与无效规定效度系数的界
限。这主要是因为个人或群体的语言能力特征,只能通过 其行为样本间接推测,而不是绝对有效。从这个意义上讲, 效度也可以说是一个程度上的概念,它反映根据考试分数 作出推论或预测的准确程度。
效度的评估
一般地说,效度可以从以下几个方面评估。 (1)内容效度(Content Validity)是指考试的内容是否 具有代表性和综合性,或者说是否考了应考的内容。一 份试卷不可能包括所有要考的内容,所以,选择内容的 方法非常关键。 (2)预测效度度(Predictive Validity)是指考试的结果 和预言是否有效。例如:把学生高考的英语成绩和大学 一年级末的英语成绩作比较,观察其相关性,就可以了 解高考英语试卷的预测效度。 (3)结构效度(Construct Validity) 指一个考试所测量 的能力是否符合语言、语言学习和语言行为理论中所假 设的能力
效度和信度

TOP JOURNAL上的效度
• 如果是新的测量方法或者是简版的测量方 法需要测量其聚合效度。
TOP JOURNAL上的效度
一般使用CFA来测量区分效度,具体方法是:采用竞争模型比较,一个模型中各 变量由估计,另几个模型中根据实际情况把各变量组合成若干个新变量,比较几 个模型的模型配适度。
TOP JOURNAL上的效度
• 我们用测量分数和效标之间的相关系数来估计效 标关联效度。用SPSS的操作:
分析——相关——双变量
构念效度
• 构念效度:指一个测量实际测到所要测量 的理论结构和特质的程度,或者说测量能 够说明测量的理论结构或特质的程度。( 构念是理论上的、抽象的、无形的。)
构念效度的测量
• 没有一个单一的证据足以完成这样的测量,我们需要进行 大量的实证研究才能找到测量工具的构念效度实证研究的 具体方法如下:
效度的概念和组成
• 效度:指测试能够测量到我们想要测量的概念 的程度。
• 效度的组成: 1、内容效度(Content Validity) 2、效标关联效度(Criterion-related Validity) 3、构念效度(Construct Validity)
有关表面效度(Face Validity)
1、考察测量工具的条目或者分量表是否具有同质性,测量的是否是一个 单一的构念。 2、考察随着个体的发展变化,检验分数是否与这个构念的理论预期相吻 合。 3、考察不同群体之间测验分数的差异,是否与理论相吻合。 4、分析对测量分数进行干预的效果,是否与理论预期相吻合。 5、将测验的分数与相关概念和不相关概念的测量进行相关分析。 6、对测量进行因素分析,看构念的构成是否符合理论。 7、分析测量的得分是否可以用来正确区分受测者。
统计学中的信度与效度
统计学中的信度与效度在统计学中,信度与效度是涉及测量工具的两个重要却又常常相互关联的概念。
它们分别从不同的侧面来评估测量工具的质量和可靠性。
在科学研究、心理测量以及社会调查等领域,理解和掌握信度与效度的概念,对于研究结果的解释和应用至关重要。
本文将深入探讨信度与效度的定义、类型、影响因素及其在实际研究中的应用。
一、信度信度指的是测量工具在多次测量中所获得结果的一致性或稳定性。
换句话说,如果我们使用同样的测量工具对同一对象多次进行测量,理论上应该得到相似或相同的结果。
如果测量结果的一致性较高,则说明该测量工具具有良好的信度。
1. 信度的类型信度可以分为以下几种主要类型:重测信度重测信度是通过对同一组受试者在不同时间点使用同一测量工具进行测试,以评估其一致性。
若两次测量结果高度相关,说明该工具具有较高的重测信度。
内部一致性内部一致性评估的是测量工具内各个项目之间的一致性。
例如,在问卷调查中,针对某一特定特质的多个问题,若回答之间存在高度相关,说明问卷具有良好的内部一致性。
常用的评估方法是计算克朗巴赫α系数。
评分者间信度评分者间信度用于比较不同评分者对同一现象或对象进行评价时所给出的结果一致性。
当多个评分者对同一个被试进行评分时,如果他们的评分高度一致,则表明该测量工具具备良好的评分者间信度。
2. 信度的重要性信度在统计学研究中的重要性不可低估。
首先,高信度意味着研究结果稳定可靠,能够有效反映所要研究的对象特征。
同时,低信度可能导致统计分析结果的不准确,使得结论失去可信性。
因此,在设计研究时,确保所使用的测量工具具备较高的信度,是任何研究者必须关注的重要环节。
二、效度效度则是指测量工具是否能够准确地测量其所声称要测量的内容或特质。
简单来说,一个具备效度的测试应该能够区分出不同被试之间真实存在的差异,而不仅仅是能重复地得到相同结果。
1. 效度的类型效度一般可分为以下几种类型:内容效度内容效度指的是测量工具所包含内容是否全面代表了待测特质。
信度与效度的名词解释
信度与效度的名词解释在社会科学研究中,信度和效度是两个重要的概念,用于评估研究工具的质量和可靠性。
信度指的是测量工具的稳定性和一致性,即无论是在不同时间还是不同场合下,该工具测量的结果是否具有一致性。
效度则是指测量工具所测量的内容是否与实际情况相符,即是否能够正确地反映出所要测量的概念或变量。
信度主要关注的是测试工具的稳定性和准确性。
如果一个测量工具具有较高的信度,那么无论是在不同的时间还是不同的场合下,使用该工具测量同一个对象所得到的结果应该是一致的。
一个具有高信度的测量工具可以减少测量误差,使得研究结果更加可靠。
常用的衡量信度的方法包括重测信度、等价形式信度和内部一致性信度。
重测信度是一种常见的信度测量方法,它通过对同一组受试者在不同时间或条件下进行两次测量,然后计算两次测量结果之间的相关系数来评估工具的信度。
如果两次测量之间的相关系数较高,说明该工具具有较好的信度。
等价形式信度是一种通过将原测量工具分为两个等价的部分,然后对同一组受试者分别使用两个部分进行测量,最后计算两个部分测量结果之间的相关系数来评估工具的信度。
如果两个部分测量结果之间的相关系数较高,说明该工具具有较好的信度。
内部一致性信度是一种通过对测量工具中的一组项目进行统计分析,例如计算Cronbach's alpha系数,来评估工具的信度。
Cronbach's alpha系数表示了测量工具中各个项目之间的内部一致性。
如果Cronbach's alpha系数较高,说明该工具具有较好的信度。
效度主要关注的是测量工具的准确性和有效性。
一个具有高效度的测量工具应该能够准确地测量所要研究的概念或变量,而不是测量其他无关的内容。
常用的衡量效度的方法包括内容效度、构效度和判别效度。
内容效度是一种通过专家评估测量工具中所包含项目与所要测量的概念之间的关联程度来评估工具的效度。
如果专家评估认为测量工具中的项目与所要测量的概念之间的关联程度较高,那么该测量工具具有较好的内容效度。
测量的信度与效度
信度的评估方法
1 2
重测信度法
通过在不同时间对同一对象进行重复测量,计算 两次测量结果的相关系数,以评估信度。
复本信度法
使用多个测量工具对同一对象进行测量,计算各 测量工具之间的相关系数,以评估信度。
3
内部一致性信度法
通过分析测量工具内部各部分之间的相关性,计 算内部一致性系数(如Cronbach's Alpha系 数),以评估信度。
04 测量误差
随机误差
定义
随机误差是由于一些随机因素引起的测量结果的 不确定性。
特点
随机误差的大小和符号都是随机的,无法预测和 控制。
示例
测量时环境的微小变化、测量仪器的微小波动等 都可能产生随机误差。
系统误差
定义
系统误差是由于测量系统本身存在的误差或测量条件不满足要求 而引起的测量结果偏差。
数据分析方法
数据分析方法的选择和运用,也会对效度产 生影响。
03 信度与效度的关系
信度是效度的必要条件
信度是指测量的一致性,即多次测量结果之间的相符程度。 如果一个测量工具缺乏信度,那么它的测量结果会不稳定, 无法为决策提供可靠依据。因此,信度是效度的必要条件, 没有信度就无法保证效度。
信度的评估方法包括重测信度法、复本信度法、Cronbach's Alpha系数法等,通过这些方法可以评估测量工具的一致性 和稳定性。
效度是信度的充分条件
效度是指测量的准确性和有效性,即测量结果是否真实反映所需测量的内容。如果一个测量工具具有 效度,那么它的测量结果是准确的、有意义的,能够为决策提供可靠依据。因此,效度是信度的充分 条件,有了效度可以进一步确认信度。
效度的评估方法包括内容效度法、结构效度法、验证效度法等,通过这些方法可以评估测量工具的准 确性和有效性。
信度和效度的名词解释
信度和效度的名词解释一、信度( reliability)信度是指测量结果与预定标准之间的一致性程度。
它是指在一定条件下,多次测量同一量时所得结果的变异程度,或者说一组测量值分散到另一组测量值中所引起的变异程度。
信度分为内部信度和外部信度,两者又合称为可靠度。
1、内部信度信度是指测量结果与预定标准之间的一致性程度。
它是指在一定条件下,多次测量同一量时所得结果的变异程度,或者说一组测量值分散到另一组测量值中所引起的变异程度。
内部信度与效度是密切相关的。
只要有可能影响测量结果的不确定性,就会影响到测量的信度;反过来,如果对这些不确定性进行修正,又会改善测量的效度。
而且某一项目的实验本身可能就具有很好的内部信度,只是缺乏适当的统计学上的显著性水平而已。
如何才能获得较高的信度呢?首先,要对被测量进行严格的定义和仔细的选择,其次,应当考虑到测量结果的正态分布性质,以保证试验条件的稳定,减少各种不可控因素的干扰。
一般来说,系统误差小,分布集中,测量误差小的仪器和方法,信度较高。
否则,测量信度低。
在实际工作中,通常认为下列三个因素对信度有重大影响:( 1)测量方法本身的随机性( 2)观察或调查对象的变异性( 3)被测量的数据范围( 4)观察或调查人员的主观判断与偏见2、外部信度是指测量结果与处理前标准之间的一致性程度。
对一个实验室来说,其处理前的原始数据有重复性的一组数据作为样本,使用标准差来衡量信度的高低。
数据的重复性越大,其外部信度也就越高。
二、效度( validity)效度指的是测量结果与被测量之间的一致性程度。
用预先规定的效度标准来评价测量结果的有效性。
如一组数据若不同于参照组的数据则该组数据无效。
有效性也叫可靠性,即一个特定的测量方法或测量工具,所给出的测量结果在真值附近的可靠程度。
信度与效度都有助于提高试验资料的精确程度。
例如:医师在诊断病情时,应根据病情做出正确的诊断,然后选择最佳的治疗措施。
但是对一位病人进行体温测量并不能给出很好的诊断,因为病人体温受多种因素影响,包括环境温度、衣着、食物等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 使用分半信度时要注意两个问题: • 一是问卷题目所测的应是同一种特 质; • 二是两半题目应是等值的。对问卷 题目进行分半会造成了对整个问卷信 度的低估,为此需要对分半信度进行 校正。
(4)库得─理查森信度 (Kuder ─ Richardson)
• 库德-理查森信度适用于计算‚对或错‛的是 非题的同质性信度,其是计算所有可能的分半 信度的平均数。 • 最有代表性的计算公式是库德-理查森公式:
•
缺点: • 如复本编制不容易,易出现顺序 效应,受练习的影响; • 复本信度只能反应问卷内容所造 成的误差,无法反应答卷者本身所造 成的误差等。
(3)分半信度(split-half reliability)
• 当测验没有复本且测验不可避免地受到 时间的影响,只适合用于一次测验时,可 用分半信度。 • 分半的方法很多,一般是将奇数题和偶 数题各作为一半,而非前后分半,目的是 避免顺序效应。分半信度也叫折半信度, 其计算方法是将问卷的题目分成对等的两 半,分别求出两半题目的总分,再计算两 部分总分的相关系数。
5.提高信度的方法
• 问卷的信度越高,受到人、时、 地、物的干扰就越低,其所能反应 事实或让人相信的程度越高,因此 在问卷实施前如何有效提高信度是 问卷测验成败的关键。通常提高问 卷信度的方法为:
(1)适当延长问卷的长度
• 问卷题目较多,其在一定程度上排除了偶 然因素的影响,从而提高了问卷的信度。 • 但是问卷长度的增加与问卷的信度 的增加并不总是成正比的,当信度系数较 小时,延长问卷长度,问卷的信度系数增 加较大;而当信度系数较大时,延长问卷 长度对信度系数的影响就较小。
rKR20
S
2 X`
n (1 n 1
pq
i 1
n
i i
S
2 X
)
为问卷测验总得分的方差,pi表示答对该 题的人数占总答卷人数的比例,pi可视为该题的 难度,qi=1-pi 。式中n为问卷包含的题目数.
(5)克隆巴赫信度系数 (Cronbach’sronbach 于1951年创立的,用于评价问卷的内 部一致性。α系数取值在0到1之间, α系数越高,信度越高,问卷的内部 一致性越好。Cronbach’s α系数不 仅适用于两级记分的问卷,还适用于 多级计分的问卷。
Guttman)
• 库德-理查森系数 • 克隆巴赫α系数 • 评分者信度*
• (1)重测信度(test-retest reliability) • 假定短时间内一批对象的状况并 没有改变,对每个对象用同一个问卷 先后测验两次,两次测验得分的相关 系数就称为重测信度。重测信度是用 皮尔逊积差相关系数r公式计算的。
measurement Error reliability system Error validity
2.信度的定义
信度是用估计测量误差大小的尺度,来说明 问卷测验结果中测量误差所占的比率。 信度可定义为真实分数(true score)的方差与 测验实得分数(observed score) 的方差之比, 当实得分数变异可以全部由真实分数的变异解释 时,测验误差就是0,这时问卷测验的信度为1。
其计算公式为: n
n (1 i 1 2 ) n 1 SX 式中n为问卷包含的题目数,
S
2 i
S S
2 i` 为答卷者在第 题得分的方差, 2 X ` 为答卷者问卷测验总得分的方差。
i
• α系数有以下性质: • (1)α系数是所有可能的分半信度的平均 值; • (2)α系数是估计信度的最低限度; • (3)当问卷计分为二分名义变量时,即答 案为0或1,α系数与KR20值相同,即库德理查森信度公式是克隆巴赫的α系数的一个 特例。
• 若用表示问卷测验的信度,理论 应有 2 SE 2 S • r T 或 rXX 1 2
XX 2 SX
SX
• 式中 S 表示真实分数的方差; • 表示实得分数的方差; 2 • S X 表示误差的方差。
S
2 E
2 T
信度系数类型 : • 重测信度 • 复本信度 • 分半信度(Spearman — Brown;
(4)测验的时间要充分
• 一份问卷应保证绝大多数答卷者 在规定的时间内能完成测验。当答卷 者不能从容地回答所有题目时,问卷 的得分就不能反映答卷者的真实情况。
(5)测验的程序要统一
• 问卷题目要统一,指导语、回 答问题的方式、分收试卷的方法和 问卷测验的时间等都要统一,这些 是问卷有较高信度的基本保证。
what's reliability?
信度?
一、背景准备
1、误差公理 误差(error)是指对事物某一特征的度量值偏离 真实值的部分,即测定值与真实值之差,样本统计量与总 体参数之差。 误差公理:实验结果都会有误差,误差自始至终 存在于一切科学实验的过程之中 2、误差的种类: 1)随机误差包括随机测量误差和抽样误差 随机测量误差:没有固定的倾向,可使多次观测结果有 大有小。 抽样误差:由于抽样造成的样本指标与总体指标之间的 差别。
2)系统误差:是由于偏倚(使研究结果按照一个 方向偏离总体, bias)产生的错误结果,可校正 和消除。 3)过失误差(gross error)是由于科研设计错误, 或实验者的主观片面、粗心大意引起的误差。
• 问卷测验中测量误差通常来源于两个方面: 一是产生于问卷测验过程中的误差,称为测 量误差(measurement Error),也称为随 机误差(random error) 二是由问卷的结构质量造成的误差,称为系 统误差(system Error)
(2)问卷的难度适中
• 当问卷题目难度太大时,问卷得 分普遍过低;当问卷题目难度太小时, 问卷得分普遍较高。问卷题目太难或 太易都会使问卷得分差异减小,使实 得分数方差减小,从而降低了问卷的 信度。
(3)问卷的内容尽量同质
• 内容同质的问卷,要求答卷者具 有相同的能力、知识和技能。因而为 了提高问卷的信度,问卷的内容应尽 量保持同质。
• 低信度:α<0.35, 中信度: 0.35<α<0.70,高信度: 0.70<α • 一般地,问卷的α系数在0.8以 上该问卷才具有使用价值。 –Cronbach‘s α值皆达0.85以 上,表明问卷信度良好。
(6)评分者信度(inter-scorer reliability)*
• 考察评分者信度的方法为,随机抽取相当 份数的问卷,由两位评分者按记分规则分 别给分;然后根据每份问卷的分数计算相 关系数,就得到评分者信度。评分者信度 也可以是一位评分者两次评分的相关系数。 如果是多个评分者或一位评分者两次以上 的评分,可采用肯德尔和谐系数和Kappa系 数。肯德尔和谐系数用于等级资料,Kappa 系数用于定性资料。
重测信度也存在着局限性:
•
•
间隔时间长,环境影响; 如果间隔时间短,记忆影响。
(2)复本信度(alternate form reliability)
• 复本通常是根据相同的设计说明分别独立 编制的两个平行问卷,即题目不同但是内 容相似的两份问卷。复本信度也叫等值性 系数(coefficient of equivalence)。 两个复本间隔一定时间或同时施于同一答 卷者所得分数的相关系数就是复本信度