第九章 信度分析
第九章 信度分析

(二)复本信度
·根据一组被试在两个平行(等值)测验上的得分计算 根据一组被试在两个平行(等值) 根据一组被试在两个平行 的相关数。 的相关数。因为它反映的是两个测验之间的等值程 因此又叫等值性系数。 度,因此又叫等值性系数。 ·采用此法一定要注意: 采用此法一定要注意: 采用此法一定要注意 两个测验必须在项目的内容、形式、数量、难易、 ①两个测验必须在项目的内容、形式、数量、难易、 时限、 时限、指导语等方面相同或相似 ②两次测验的时间间隔要适当 ·复本信度的局限: 复本信度的局限: 复本信度的局限 ①复本法只能减少而不能完全排除练习和记忆的影响 对于许多测验来说, ②对于许多测验来说,建立复本是相对困难的
(四)同质性信度
·同质性也称内部一致性,指的是测验内部所有 同质性也称内部一致性, 同质性也称内部一致性 题目间的一致性。 题目间的一致性。 1、测量同质性的基本公式 库德—理查逊公式 估计测验的信度, 理查逊公式: 2、库德 理查逊公式:估计测验的信度,估 计同质性信度 ·适用于答对一题得分,答错无分 适用于答对一题得分, 适用于答对一题得分 3、克伦巴赫系数 ·适用于项目多重记分的测验 适用于项目多重记分的测验
三、信度系数的应用
(一)评价测验 ·信度系数是衡量测验好坏的一个重要技术指标 信度系数是衡量测验好坏的一个重要技术指标 ·一般能力与成就测验的信度系数常在0.90以上 一般能力与成就测验的信度系数常在0.90 一般能力与成就测验的信度系数常在0.90以上 ·性格、兴趣、态度等人格测验的信度系数通常在0.80性格、 0.80性格 兴趣、态度等人格测验的信度系数通常在0.80 0.85之间 0.85之间 (二)解释分数 1、个人测验分数的误差 ·个人在两次测验中分数的差异就是测量误差,据此可得 个人在两次测验中分数的差异就是测量误差, 个人在两次测验中分数的差异就是测量误差 出一个误差分数的分布, 出一个误差分数的分布,这个分布的标准差就是测量的 标准差,它是测量误差大小的指标。 标准差,它是测量误差大小的指标。 2、两种测验分数的比较 ·来自不同测验的原始分数是无法直接比较的,只有参照 来自不同测验的原始分数是无法直接比较的, 来自不同测验的原始分数是无法直接比较的 同一团体的平均分数, 同一团体的平均分数,将它们转换成相同尺度的标准分 才能进行比较。 数,才能进行比较。
信度分析

若分量表的内部一致性系数在0.60以下 或者总量表的信度系数在0.80以下,应 考虑重新修订量表或增删题项。
效度分析:
效度是反映调查问卷设计者的意图能否 让被调查者理解,即问卷能否有效地测 量各项变量(如达到鉴别,评价,预测的 目的),各问题与实际要研究的问题中的 概念相符合的程度。 效度主要包括表面效度、区分效度、结 构效度。
பைடு நூலகம்
信度可分为:
内在信度,对一组问题是否测量同一个 概念,同时组成量表题项的内在一致性 程度如何;常用的检测方法是 Cronbach’s alpha系数。 外在信度,对相同的测试者在不同时间 测得的结果是否一致,再测信度是外在 信度最常用的检验法
由于客观条件的限制,无法重复实施两次 调查,所以无法进行重测信度和复本信 度的测定,因而信度主要是采用内部一 致性信度。信度系数越大,其内部一致 性就越高,测得的分数就越可靠,反之 则不可靠。具体的分析方法是采用克朗 巴赫a系数法或折半信度法。
克朗巴赫a系数(coefficient alpha of L.J.Cronbach) 克朗巴赫a系数是评价内 部一致性信度的首选,它也是目前最常 用的信度系数,克朗巴赫a系数表明量表 中每一条目得分间的一致性。
信度指标:
用信度系数来表示信度的大小。信度系 数越大,表明测量的可信程度越大。
0.60~0.65(最好不要);0.65~0.70 (最小可接受值);0.70~0.80(相当 好);0.80~0.90(非常好)。 ——DeVellis(1991)
信度分析
信度的基本概念:
信度是指根据测验工具所得到的结果的一致性 或稳定性,反映被测特征真实程度的指标。 信度值是指在某一特定类型下的一致性,非泛 指一般的一致性,信度系数会因不同时间、不 同受试者或不同评分者而出现不同的结果; 信度是效度的必要条件,非充分条件。信度低 效度一定低,但信度高未必表示效度也高,信 度检验完全依赖于统计方法。
信度和效度分析

信度和效度分析信度分析信度分析是一种测度综合评价体系是否具有一定稳定性和可靠性的有效分析方法。
信度是根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。
信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。
信度分析的方法主要有四种:重测信度法、复本信度法、折半信度法、克朗巴哈(Cronbach)α系数信度法。
在实证研究中,学术界普遍使用克朗巴哈(Cronbach)α系数信度法。
一般来说,信度的判别标准如下表:信度?0.30不可信0.30<信度?0.40初步的研究,勉强可信0.40<信度?0.50稍微可信0.50<信度?0.70可信(最常见的信度范围)0.70<信度?0.90很可信(次常见的信度范围)0.90<信度十分可信本文采用克朗巴哈(Cronbach)α系数信度法测量,根据量表中的5个维度分别计算各个维度的Cronbachα值,对各个维度的内部一致性信度进行分析,结果如下:变量Cronbach α值价格0.796质量0.735分销渠道0.777广告宣传0.611工作人员0.799品牌影响力0.696从上述Cronbach α值分析结果中,我们发现,所有的计量尺度的内部一致性系数都在0.6到0.8之间,均可以接受。
因此,研究结果表明各个计量尺度都较为可靠。
效度分析低效度的问卷往往无法达到测量目的,因此对效度的评价非常重要。
一般可以侧重两个个角度进行判断:一是观察问卷内容切合主题的程度;二是从实证角度分析其结构效度。
内容效度内容效度主要是用来反映量表内容切合主题的程度。
若测量内容涵盖所有研究计划所要探讨的构架及内容,就说明是具有优良的内容效度。
检验的方法需要采用专家判断法,由相关专家和专业人士就题项恰当与否进行评价。
构建效度构建效度也称结构效度,主要是用来检验量表是否可以真正度两处所要度量的变量。
信度分析

可靠性是指通过相同方法重复测量同一物体而获得的结果的一致性。
可靠性指标主要由相关系数表示,可以大致分为三类:稳定性系数(跨时间一致性),等效系数(跨表单一致性)和内部一致性系数(跨项目一致性)。
可靠性分析有四种方法:重测可靠性方法,重复可靠性方法,半可靠性方法和阿尔法可靠性系数方法。
重测可靠性方法在这种方法中,使用相同的调查表以一定间隔对同一组受试者进行测试,并计算两次测试结果的相关系数。
显然,重测可靠性属于稳定性系数。
重测信度方法特别适用于事实调查表,例如性别,出生日期等。
两次测验之间应该没有差异,大多数受访者的兴趣,爱好和习惯在短期内不会明显改变。
一段的时间。
如果受访者的态度和意见没有突然变化,则此方法也适用于态度和意见调查表。
由于重测可靠性方法需要对同一样本进行两次测试,因此受访者很容易受到各种事件,活动等的影响,并且时间间隔也受到限制,因此难以实施。
复制可靠性方法重复可靠性方法是要求同一组受访者一次填写并回答两份问卷,并计算两份问卷的相关系数。
副本的可靠性属于等效系数。
除了表达方式不同外,两个副本的内容,格式,难度和相应问题的方向也应完全一致。
但是,在实际调查中,很难使问卷满足这一要求,因此使用这种方法的人很少。
分半可靠性半信度方法是将调查项目分为两部分,计算两个半分的相关系数,然后估计整个量表的信度。
半信度属于内部一致性系数,它测量两个半项得分之间的一致性。
此方法通常不适用于基于事实的调查表(例如无法比较年龄和性别),但通常用于分析态度和意见调查表的可靠性。
在问卷调查中,态度测量的最常见形式是5级李克特量表。
在半可靠性分析中,如果量表包含反义项,则应对项的分数进行相反处理,以确保每个项的分数方向一致。
然后,应根据奇偶校验或前后将所有项目尽可能地分为两部分,并计算相关系数(rHH,即半量表的可靠性系数)。
最后,使用斯皮尔曼·布朗(Spearman Brown))公式:计算了整个秤的可靠性系数(RU)。
信度分析

信度分析信度分析是指对某一信息或内容进行评估,以确定其可靠性和真实性的过程。
在信息时代,我们面临着大量的信息和内容,其中包括真实的信息和虚假的信息。
因此,进行信度分析对于我们判断信息的真实性非常重要。
信度分析的方法有很多,下面我将介绍几种常见的信度分析方法。
第一种是来源可信度分析。
我们可以通过考察信息的来源,了解其可信度。
信源的可信度与其背景、专业性、信誉等有关。
例如,一篇由权威学术机构或权威媒体发表的研究论文具有较高的来源可信度。
第二种是内容真实性分析。
我们需要仔细研究信息的内容,通过对内容的合理性、逻辑性和事实性进行评估,判断其真实性。
例如,如果一篇新闻中出现了大量遗漏、重复或矛盾的情况,那么这篇新闻的真实性可能存在问题。
第三种是与其他信息的协调性分析。
我们可以将信息与其他相关信息进行对比和验证,判断其是否与其他信息相吻合。
如果一篇信息与其他相关信息存在较大出入,那么其可信度可能较低。
第四种是时间准确性分析。
我们需要注意信息的发布时间和我们收到信息的时间之间的差距。
如果一条信息在较长时间内没有得到证实或辟谣,那么其可信度可能较低。
除了以上几种常见的信度分析方法,我们还可以借助一些工具和平台来帮助我们进行信度分析。
例如,我们可以通过搜索引擎查找相关背景信息、查阅专业资料或权威机构的发布,以获取更多的信息和线索。
总而言之,信度分析是我们在信息时代中必备的技能之一。
通过对信息的来源、内容、协调性和时间准确性进行评估,我们可以更好地辨别真实的信息,并做出明智的判断和决策。
对于那些无法确定信度的信息,我们应保持怀疑态度,并进一步获取更多的信息,以避免被误导和影响判断。
这样,我们才能更好地从海量的信息中获取有价值的内容,并保持对信息的审慎态度。
信度分析

15 信度分析在调查研究中,对调查问卷的结果进行统计分析之前必须先对其信度(reliability )和效度(validity )进行分析,只有信度和效度在可以接受的研究范围之内时,调查问卷的统计分析结果才是可靠和准确的。
在SPSS 中选择菜单Analyze →Scale (量表)→Reliability Analysis (信度分析)来完成信度分析。
15.1 信度分析介绍收集数据时,经常出现三种测量误差。
一是系统误差。
例如缺斤短两的秤,使测量结果产生了误差(小于真实值),这种误差称为系统误差,它在多次测量中是比较稳定的。
二是随机误差,它是在实际相同条件下,多次测量同一量时,误差的绝对值和符号的变化,时大时小,时正时负,没有确定的规律,也不可以预知,但具有抵偿性的误差。
由于随机误差在测量中的单个无规律性,导致了它们的数值和有正负相消的机会,随着测量次数的增加,误差的均值趋于零,因此多次测量的平均值的随机误差比单个测量值的随机误差小,这种性质通常称为抵偿性。
三是叫粗差,粗心大意带来的错误。
如,明显歪曲测量结果的误差。
这些测量值一般称为坏值或异常值,可作误差分析,将其剔除。
但是,处理异常值时要小心,也许某些异常值具有重要信息。
如:生物医学中,某些异常值可能就是研究的新发现。
由于在测量中存在误差,使得各次测量结果并不完全一致,于是就产生了两类问题: 1.测量结果的一致性程度问题,它包括:在各种不同条件下所得数据的关系如何?测量数据与真实数据的接近程度如何?2.造成测量数据变异的原因问题,它包括:是什么因素造成了数据的不一致性?各种因素产生效应的相对比例如何?目前研究比较多的是前一类问题,即对测量的一致性进行精确估计的方法,也就是如何估计精确度:反映随机误差大小的程度的问题。
这个问题是用“信度”的概念描述的。
所谓信度是一个测量工具可靠性的指标,它是对测量一致性程度的估计。
一个测量工具是可靠的,表示测量多次,测量结果是一致的和稳定的。
第九章 质性研究的可信度

第一节 概述
有关质性研究可信度的争议
质性研究效度的威胁
• 研究者偏差:研究者本身的观点可能对研究结论的 效度产生威胁。 • 被研究者偏差:被研究者不愿给予资料,或用说谎 来保护个人隐私,或避开一些事实。或者因为想对 研究“有帮助”而给予研究者想要的答案。
第一节 概述
可信度的定义
研究的可信度(Guba )
第二节 常用评价指标
可依靠性
定义
• 资料在不同时间不同地点的稳定性 提高可依靠性的方法 • 逐步重复 • 调查审核
• 逐字解说与低推论描述
第二节 常用评价指标
可确认性
定义
• 资料的客观性或中立性,指相互独立的人对资料的关系 或意义的意见一致程度。 提高可确认性的方法 • 调查审核:可以做一个审查踪迹,采用开放的态度,并 用文件系统地说明收集资料与分析资料的每一个步骤, 不同时间的各种活动,以便其他审核者能够使用这些线 索,根据资料来复制和验证研究结果,得到结论。
• 真实性 • 应用性 • 一致性 • 中立性
第一节 概述
可信度的定义
量性研究的可信度
• 内部效度 • 外部效度 • 信度 • 客观性
第一节 概述
可信度的定义
对质性研究的可信度
• 可信性 • 可转换性 • 可依靠性 • 可确认性
第一节 概述
可信度的定义
可信度也就是质性研究的信度和效度,是指研究结果 的呈现应尽可能接近被研究者的经验。
目录
一、有关质性研究可信度的争议 二、可信度的定义
第一节 概述
有关质性研究可信度的争议
信度、效度的概念是否适用于质性研究
如何评价质性研究的质量 质性研究效度的威胁
信度分析

信度分析信度分析又称可靠性分析,是检验测量工具的可靠性和稳定性的主要方法;信度问题要回答的问题是:用这个测量工具在同一条件下对同一人进行测试,每次测试的结果是否相同的问题。
在社会科学中如果使用的测量工具无论对谁施测,也无论使用什么形式,只要产生相似的结果,那么可以认为此测量工具是可信的。
信度问题其实测的是一致性的问题,所谓信度是衡量没有误差的程度。
一致性分为内部一致性和外部一致性。
效度问题要回答的是:此测量工能够测量我想要测得的东西吗?不能混淆信度与效度。
信度的测量1.克伦巴赫α系数。
测度内部一致性的一个指标;及测量表内的所有项目测量的都是同一样东西吗?α与皮尔逊r 系数都是一样的范围在0—1 之间,如果为负值则表明表中某些项目的内容是其他一些项目的反面;α越接近于1,则量表中项目的内部一致性越是高。
α 的计算式非常简单,根据量表中的项目数K 和各项之间的相关系数r 计算而来1(1)krk rα=+-当量表中项目K 增加时,α值也会增大;同时,项目之间的相关系数r 较高时,α也会比较大。
这里的r 是指各项与其他各项之和计算相关系数的平均值。
2、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。
显然,重测信度属于稳定系数。
重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。
如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。
由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。
3、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。
复本信度属于等值系数。
复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)复本信度
·根据一组被试在两个平行(等值)测验上的得分计算 根据一组被试在两个平行(等值) 根据一组被试在两个平行 的相关数。 的相关数。因为它反映的是两个测验之间的等值程 因此又叫等值性系数。 度,因此又叫等值性系数。 ·采用此法一定要注意: 采用此法一定要注意: 采用此法一定要注意 两个测验必须在项目的内容、形式、数量、难易、 ①两个测验必须在项目的内容、形式、数量、难易、 时限、 时限、指导语等方面相同或相似 ②两次测验的时间间隔要适当 ·复本信度的局限: 复本信度的局限: 复本信度的局限 ①复本法只能减少而不能完全排除练习和记忆的影响 对于许多测验来说, ②对于许多测验来说,建立复本是相对困难的
·采用此法时应注意以下几个问题: 采用此法时应注意以下几个问题: 采用此法时应注意以下几个问题 ①两次测验的时间间隔要恰当 ②再测法适用于速度测验或人格测验,而 再测法适用于速度测验或人格测验, 不适用于难度测验 ③应注意提高被试的积极性 ·用再测法估计信度的优点:能提供测验结 用再测法估计信度的优点: 用再测法估计信度的优点 果是否随时间而变化的资料, 果是否随时间而变化的资料,可作为预 测被试将来行为的依据。 测被试将来行为的依据。 ·缺点是:易受练习和记忆的影响。 缺点是: 缺点是
三、信度系数的应用
(一)评价测验 ·信度系数是衡量测验好坏的一个重要技术指标 信度系数是衡量测验好坏的一个重要技术指标 ·一般能力与成就测验的信度系数常在0.90以上 一般能力与成就测验的信度系数常在0.90 一般能力与成就测验的信度系数常在0.90以上 ·性格、兴趣、态度等人格测验的信度系数通常在0.80性格、 0.80性格 兴趣、态度等人格测验的信度系数通常在0.80 0.85之间 0.85之间 (二)解释分数 1、个人测验分数的误差 ·个人在两次测验中分数的差异就是测量误差,据此可得 个人在两次测验中分数的差异就是测量误差, 个人在两次测验中分数的差异就是测量误差 出一个误差分数的分布, 出一个误差分数的分布,这个分布的标准差就是测量的 标准差,它是测量误差大小的指标。 标准差,它是测量误差大小的指标。 2、两种测验分数的比较 ·来自不同测验的原始分数是无法直接比较的,只有参照 来自不同测验的原始分数是无法直接比较的, 来自不同测验的原始分数是无法直接比较的 同一团体的平均分数, 同一团体的平均分数,将它们转换成相同尺度的标准分 才能进行比较。 数,才能进行比较。
(三)分半信度
实施测验, 按正常的程序 实施测验,然后将全部项目分成 相等的两半, 相等的两半,根据各人在这两半测验的分数计 算其相关系数 斯皮尔曼—布朗校正公式 布朗校正公式, 斯皮尔曼 布朗校正公式,弗朗那根估计信度 公式。 公式。 使用奇偶分半法一定要注意两个问题: 使用奇偶分半法一定要注意两个问题: ①如遇到有牵连的项目或一组解决同一问题的项 目时,这些项目应放在同一半,否则将会高估 目时,这些项目应放在同一半, 信度的值 ②当试卷中存在任选题或试卷为速度测试时不宜 采用分半法
重测信度或再测信度: 重测信度或再测信度: 直接求前后两次问卷回收回来的对应的 相同题项的相关系数,要求: 相同题项的相关系数,要求:显著相关 (p<=0.05)且系数>=0.5, 且系数>=0.5 (p<=0.05)且系数>=0.5,勉强可接受 (p<=0.05)系数>=0.3。 系数>=0.3 (p<=0.05)系数>=0.3。
利用SPSS进行信度分析 利用SPSS进行信度分析 SPSS
SPSS中 在SPSS中,专门用来进行测验信度分析的模块为 Scale下的 下的Reliability Analysis。 Scale下的Reliability Analysis。 Cronbach Alpha,Analyze-->Scale-->Reliability Alpha,Analyze-->Scale-->Reliability -->Scale-analysis,statistics选 for下 analysis,statistics选descriptives for下Scale deleted。出结果中,如果Cronbach if item deleted。出结果中,如果Cronbach Alpha>=0.8那么不用删掉任何题项 结果足够好。 那么不用删掉任何题项, Alpha>=0.8那么不用删掉任何题项,结果足够好。如 Alpha<0.8,看指标Alpha 果Cronbach Alpha<0.8,看指标Alpha if item deleted(指如果把对应的题项杀掉,Alpha可提高或 deleted(指如果把对应的题项杀掉,Alpha可提高或 降低为此值),把题项杀掉, Alpha>=0.8, ),把题项杀掉 降低为此值),把题项杀掉,使Alpha>=0.8,便不用 再杀。Alpha值的最低要求>=0.7。 Alpha<0, 值的最低要求>=0.7 再杀。Alpha值的最低要求>=0.7。若Alpha<0,说明 该反转的题项没反转,检查题项,将其反转。 该反转的题项没反转,检查题项,将其反转。
(五)评分者信度
·评分者之间的变异是产生误差的重要原因之一 评分者之间的变异是产生误差的重要原因之一 ·考察评分者信度的方法是随机抽取部分试卷, 考察评分者信度的方法是随机抽取部分试卷, 考察评分者信度的方法是随机抽取部分试卷 由两个或多个评分者独立按评分标准打分, 由两个或多个评分者独立按评分标准打分,然 后求其间的相关。如果是两个评分者, 后求其间的相关。如果是两个评分者,则采用 积差相关或等级相关的方法, 积差相关或等级相关的方法,一般认为结果训 练的成对评分者之间的一致性达到0.90以上, 0.90以上 练的成对评分者之间的一致性达到0.90以上, 评分才是客观的。 评分才是客观的。如果是多个评分者则采用和 谐系数来估计信度。 谐系数来估计信度。
四、影响信度的因素
(一)被试的样本 ·团体的异质程度与分类的分布有关,一个团体越 团体的异质程度与分类的分布有关, 团体的异质程度与分类的分布有关 是异质,其分数分布的范围也就越大, 是异质,其分数分布的范围也就越大,信度系数 就越高。 就越高。 ·信度系数不仅受样本团体的异质程度的影响,也 信度系数不仅受样本团体的异质程度的影响, 信度系数不仅受样本团体的异质程度的影响 受样本团体平均水平的影响。 受样本团体平均水平的影响。因为对于不同水平 的团体,项目具有不同的难度,每个项目在难度 的团体,项目具有不同的难度, 上的变化累积起来便会影响信度。 上的变化累积起来便会影响信度。这种影响不能 用统计公式来推估,只能从经验中发现。 用统计公式来推估,只能从经验中发现。
(四)同质性信度
·同质性也称内部一致性,指的是测验内部所有 同质性也称内部一致性, 同质性也称内部一致性 题目间的一致性。 题目间的一致性。 1、测量同质性的基本公式 库德—理查逊公式 估计测验的信度, 理查逊公式: 2、库德 理查逊公式:估计测验的信度,估 计同质性信度 ·适用于答对一题得分,答错无分 适用于答对一题得分, 适用于答对一题得分 3、克伦巴赫系数 ·适用于项目多重记分的测验 适用于项目多重记分的测验
第九章
信度分析
一、什么是信度
通常把测量结果的可靠性称之 为信度, 为信度,即测量结果的一致性或 可信性程度,在测量学中, 可信性程度,在测量学中,信度 被定义为, 被定义为,一组测量分数的真变 异数与总变异数(实得变异数) 异数与总变异数(实得变异数) 的比率。 的比率。
二、估计信度的方法
(一)再测信度 ·用同一个测验,对同一组被试前后两次施测, 用同一个测验, 用同一个测验 对同一组被试前后两次施测, 两次测验分数所得的相关系数为再测信度 ·因为它能反映两次测验结果有无变动,也就是 因为它能反映两次测验结果有无变动, 因为它能反映两次测验结果有无变动 测验分数的稳定程度, 测验分数的稳定程度,故又称稳定性系数 ·计算再测信度应满足一下几个假设: 计算再测信度应满足一下几个假设: 计算再测信度应满足一下几个假设 ①所测量的特质必须是稳定的 ②遗忘与练习的效果相同 ③两次施测期间被试的学习效果没有差别
五、度指标
用信度系数来表示信度的大小。信度系数越大, 用信度系数来表示信度的大小。信度系数越大,表 明测量的可信程度越大。 明测量的可信程度越大。究竟信度系数要多少才算 有高的信度。学者DeVellis(1991)认为,0.60~ DeVellis(1991)认为 有高的信度。学者DeVellis(1991)认为,0.60~ 0.65(最好不要);0.65~0.70(最小可接受值); );0.65 0.65(最好不要);0.65~0.70(最小可接受值); 0.70~0.80(相当好);0.80~0.90(非常好)。 );0.80 0.70~0.80(相当好);0.80~0.90(非常好)。 由此,一份信度系数好的量表或问卷,最好在0.80 由此,一份信度系数好的量表或问卷,最好在0.80 以上,0.70至0.80之间还算是可以接受的范围 之间还算是可以接受的范围; 以上,0.70至0.80之间还算是可以接受的范围;分 量表最好在0.70以上,0.60至0.70之间可以接受 0.70以上 之间可以接受。 量表最好在0.70以上,0.60至0.70之间可以接受。 若分量表的内部一致性系数在0.60 0.60以下或者总量表 若分量表的内部一致性系数在0.60以下或者总量表 的信度系数在0.80以下, 0.80以下 的信度系数在0.80以下,应考虑重新修订量表或增 删题项。 删题项。
(二)测验的长度 ·一般来说,测验越长,信度值越高。因为: 一般来说, 一般来说 测验越长,信度值越高。因为: 测验加长,可能改进项目取样的代表性, ①测验加长,可能改进项目取样的代表性,从而能更 好地反映受测者的真实水平 测验的项目越多, ②测验的项目越多,在每个项目上的随机误差就可以 互相抵消 (三)测验的难度 ·测验的难度与信度没有直接对应关系,但当测验太难 测验的难度与信度没有直接对应关系, 测验的难度与信度没有直接对应关系 或太易时,则分数的范围就会缩小,从而降低信度。 或太易时,则分数的范围就会缩小,从而降低信度。 显然只有当测验难度水平可以使测验分数的分布分 为最大时,测验的信度才会最高, 为最大时,测验的信度才会最高,通常这个难度水 平为0.50 0.50。 平为0.50。 ·当题目过难时,被试可能凭猜测作答,从而也会降低 当题目过难时, 当题目过难时 被试可能凭猜测作答, 信度。 信度。