内容效度指数
中文版护士职业认同量表的信效度分析

中文版护士职业认同量表的信效度分析邓芳丽;张健;李宣霖;骆宁;胡凤君;王诚丽【摘要】目的:编制中文版护士职业认同量表,并检验其在中国护士中的信度和效度。
方法按照翻译程序将日文版护士职业认同量表编译成中文,对385名临床护士进行测试,评价量表的信度和效度。
结果量表全体一致内容效度指数为0.809,平均内容效度指数为0.923。
探索性因子分析提取5个公因子,累积方差贡献率为64.544%,所有条目的因子负荷均大于0.4;5个因子之间的相关系数在0.374~0.780,均有统计学意义(P<0.01);集合效度0.451~0.803,区分效度0.048~0.285。
总量表的Cronbach’sα系数为0.902、分半信度为0.858、重测信度为0.899。
结论中文版护士职业认同量表具有较好的信度和效度,对评价我国护士职业认同状况具有一定的应用价值。
%Objective To test the reliability and validity of the Chinese version of Nurse ’s Career Identity Scale (NCIS). Methods NCIS was translated from Japanese into Chinese. A totalof 385 clinical nurses completed the scale, then the reliability and validityof the Chinese version of NCIS were tested. Results Content validity indexof the scale was 0.809, the average content validity index was 0.923. Five factors were extracted from the revised Chinese scale, and the cumulative contribution rate was 64.544%. The loading factor of all items was exceeded 0.4. The correlation coefficient between the five factors in the0.374~0.780, were statistically significant (P<0.01). Convergent validity was 0.451~0.803, and discriminant validity was 0.048~0.285. Cronbach ’s α coefficient of questionnaire was 0.902, the split-half reliability was 0.858, and retest reliability was 0.899. Conclusion The Chinese version ofNurse’s Career Identity Scale had good reliability and validity, suitable to assess the situation of nurse ’s career identity in China.【期刊名称】《护理学报》【年(卷),期】2016(023)017【总页数】4页(P47-50)【关键词】护士;职业认同;信度;效度【作者】邓芳丽;张健;李宣霖;骆宁;胡凤君;王诚丽【作者单位】郴州市第一人民医院,湖南郴州 423000;郴州市第一人民医院,湖南郴州 423000;郴州市第一人民医院,湖南郴州 423000;郴州市第一人民医院,湖南郴州 423000;郴州市第一人民医院,湖南郴州 423000;郴州市第一人民医院,湖南郴州 423000【正文语种】中文【中图分类】R192.6认同感是社会调查中的一个重要结构,认同感与其行为有一定的联系,这就提示了职业认同感与未来职业计划或选择有一定的联系。
效度分析

效度分析效度分析是一种统计方法,用于确定测量工具(例如调查问卷)是否有效地定位了研究者想要评估的现象或变量。
在社会科学中,效度是评估测量工具准确性和信度之后的第三个主要考虑因素。
效度是指测量工具是否能够准确地测量所需的概念或变量。
因此,测量工具的效度对于获取真实正面或负面的结果至关重要。
下面将详细介绍效度分析的类型、计算方法和解释结果的方式。
效度分析类型常见的效度分析类型包括以下几种:1. 内容效度(Content validity)内容效度是用于检验测量工具的所有项目是否完全涵盖其要测试的现象(又称为构造)。
这种方法通常需要专家小组对测量工具进行审核并提供反馈以确保所有相关内容都得到了涵盖。
例如,在教育研究中,专家可能会提供它们认为值得教授的语法知识列表,并观察这些知识是否出现在题目中。
2. 构造效度(Construct validity)构造效度强调了测量工具是否有效地测量其试图测量的概念本身。
这种方法通常通过测量工具与其他已经被证明有效的测量工具进行比较来进行。
例如,在心理学研究中,研究者可以使用问卷调查来评估一个人的思考方式,并将其与已知有效的智力测验或注意力检测工具进行比较。
3. 相关效度(Criterion-related validity)相关效度用于比较测量工具结果与特定标准或结果的一致性,因此这种方法需要一个明确的基准点。
例如,在医学研究中,一个新的药物可能会被诊断为有效,如果它在治愈特定疾病方面的效果显著且优于其他已知治疗方案。
效度分析计算方法常见的效度分析计算方法包括以下几种:1. 内容效度指标(Content Validity Index, CVI)内容效度指数通过测量工具中被认为正确反映概念含义的项目数量来衡量测量工具的一致性程度。
例如,如果一个问题在专家审核中被认为与概念完全一致,则该项目的CVI得分为1;如果该问题只有部分符合期望,则得分介于0和1之间。
最终,所有项的CVI总和的平均值将是测量工具的内容效度得分。
变量效度检验(内容、建构、判别、收敛)_管理学_高等教育_教育专区

变量效度检验(内容、建构、收敛、判别)一、内容效度内容效度(Content validity)是指测量内容的适当性,判断测量内容是否符合目,一般是定性的判定。
如果研究用于测量自变量、因变量以及调节变量的量表均是国内外学者的现有文献中使用过的测量量表,每个测量量表都具有可靠的数量指标,这些测量量表都有可靠的理论来源,具有较好的内容效度。
二、建构效度建构效度反映了测量工具能够正确无误地测出潜在特质的程度,一般采用验证性因子分析(Confirmatory Factor Analysis,CFA)来检验构建效度。
通常,我们可以用LISREL8.7软件检验外源变量(即自变量)和内源变量(即因变量)的量表建构效度,从而检验变量的CFA的整体模型拟合指数。
拟合指数的指标判定选取绝对拟合、相对拟合和简约拟合等三类指数。
(1)外源变量CFA分析因子载荷的判断:外源变量的各因子载荷(每个维度的语句)分别为均要求满足大于0.50的要求值,且没有大于或接近于1的数。
表5-5外源变量的CFA分析拟合指数拟合指数分析用来判断模型的拟合度,一般通过以下一个指标判断。
其中2/df χ,RMSEA 根据上图可直接观察到。
如果绝对拟合指数、相对拟合指数,简约拟合指数都基本符合所要求的接受值,表明测量模型具有良好的建构效度。
三、收敛效度收敛效度是指量表与同一构念的其他指标相互关联的程度,一般通过CFA 检验。
各指标检验标准:因子载荷(λ)判断测量变量的收敛效度,要求λ值大于0.5,且t 值大于1.97;平均变异萃取量(A VE )解释潜变量的程度,要求A VE 值大于0.5;组合信度反映每个潜变量中所有测量题项是否一致的解释该潜变量,CR 值要满足大于 0.7,各潜变量的AVE 值都大于0.5,满足以上所有条件,通常认为收敛效度较高。
利用“建构信度的计算”填写各变量值,计算出CR 值和AVE 值。
例如:变量的维度A 有3个语句,则输入观察变量的数目:3;X1,X2,X3分别填入各自的因子载荷值,点击“计算”,就得出平均变异抽取量(A VE )和组合信度(CR )的值。
护理工作量标准化指标的测定与评价

制,为乡镇卫生院发展提供了良好的外部环境,促进了卫生 院内部经营运行机构的变革,一体化管理、双向转诊消除了 卫生院与卫生室之间的不正当竞争和矛盾,形成了技术普 及、互惠互利、相互促进、协调发展的良性发展机制,卫生院 的综合服务功能和竞争能力逐渐增强,业务收入和社会声誉 明显提高,“枢纽”作用也得到巩固发展。 2.5提升了政府形象,改善了医患关系 基层医疗卫生工
均工时数测定,作为评估、预测护理工作量的一种新的尝试。
1资料和方法 1.1护理工作量指标的筛选和标化
1.1.1
护理操作项目范畴的初步界定。根据《广东省临床
护理操作规范》中的项目,由总护士长、各科护士长及责任组 长共同提供本科室所有护理操作项目,共223项.去除操作 次数稀少的项目(执行科室少于三分之一)后,保留主要护理 操作项目作为测量工作量测试指标。 1.1.2测量指标的筛选和内容效度的评定。测量表格项目 的内容效度由1名主任护师、3名副主任护师以及4名科室 主任依Waltz,Striekland,&Lenz(1991)建议的专家鉴定法 来评定,就测量项目与测量总表结构的归属关系是否合理、 项目名称与操作内涵的吻合程度是否合理、用词是否合理及 项目和评分细则有无重复、遗漏,分别评定为合适/不合适,
照达标一个验收一个、成熟一个定点一个的原则,目前滨州
市拥有规范化的农村新农合定点村级医疗机构800余处,全 部与新农合经办机构实现了计算机联网,实施网络化、自动 化监督和管理,参合农民看病就医现场既可得到补偿。 3几点体会 3.1农村医疗机构建设与改造和新农合政策有机结合新 农合制度的全面覆盖,有利地促进了乡村卫生一体化管理工
准化,取平均值作为该科室该项目的操作时间输入HIS系
统。 1.2测量效标关联效度评价
德尔菲专家咨询法与内容效度的差别Delphi法

德尔菲专家咨询法与内容效度的差别Delphi法小编在看以往硕士论文的时候,发现作者在进行量表制作研究时,会将德尔菲专家咨询法与内容效度弄混。
小编在帮助老师进行科研设计的时候,发现有些护士老师对这两块也具有疑惑。
其实这两块具有很大差异,根本不是同一个东西,分析方法也不一样。
今天小编就将这两块的异同向大家讲解一下。
1. 概念:异德尔菲专家咨询法是专家会议法的一种。
其核心是通过函询专家背对背的方式征询专家意见,由课题组对收集的意见进行汇总整理、统计分析,再以匿名的方式反馈给各位专家,供专家进行分析判断,提出新意见与建议,如此反复轮回,使意见逐渐趋向一致,得到一份认可率高且可靠性大的方案。
内容效度是效度分析的一种,是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。
2. 研究方法:同二者均采用问卷调查的形式进行研究,制定好问卷后,通过现场面对面,电子邮件等方式将问卷给予研究对象,也就是专家组成员进行填写。
3. 研究轮次:同二者专家轮次均以不再出现新的意见与建议。
一般德尔菲专家咨询法需要进行2-3轮。
内容效度一般仅进行一轮,原因是因为,一般在进行内容效度之前,已经进行过德尔菲专家咨询法,专家在进行指标重要性评价的同时,也对指标的相关性评价,所以,一般不会出现不相关的指标。
如果出现了不相关的指标,还是需要进行二轮内容效度分析的。
4. 研究对象:异这里的研究对象,其实就是专家组成员。
德尔菲专家咨询法专家组成员应满足权威性,全面性,代表性等原则,人数应大于15个。
只有人数大于15个,才能使误差降低合适范围内。
内容效度专家可以不满足上述原则与人数,可以在德尔菲专家咨询法专家组成员中选择,一般专家人数不少于5人。
5. 研究工具:异研究工具是指调查表。
德尔菲专家咨询表一般包括3-4部分:填表说明,重要性赋值表,专家一般情况调查表(专家权威程度调查表)。
而内容效度一般包括2-3部分:填表说明,相关性赋值表(专家一般情况调查表)。
扩展版布罗塞特暴力风险评估量表的效度和信度

扩展版布罗塞特暴力风险评估量表的效度和信度目的:对布罗塞特暴力风险评估量表(Br?set Violence Checklist,BVC)进行扩展,提高其灵敏度,使其更加符合我国的国情和社会文化背景,从而更好的应用于我国的精神科临床实践,为精神科工作人员提供一个有效的暴力风险评估工具。
方法:本研究共分为两个阶段。
第一阶段:通过查阅文献、小组讨论确定待扩展条目池,采用德尔菲法研制扩展版布罗塞特暴力风险评估量表(Br?set Violence Checklist-Extended,BVC-E)。
选择临床精神医学、精神科临床护理、精神科护理管理领域的专家36名,采取特快专递和电子邮件相结合的方法进行两轮专家咨询,根据专家咨询的结果筛选出待扩展条目,形成BVC-E。
第二阶段:对BVC-E的效度和信度进行测评。
邀请从事精神科工作30年以上的6名专家对BVC-E的内容效度进行评定;24名经过培训合格的护士独立评估10个相同的病例,评价其评定者间信度;选取679例河北省第六人民医院的新住院精神障碍患者,应用BVC-E每8小时评估一次,根据暴力发生的真实情况检验BVC-E的预测效度;应用Cronbach’α系数评价其内部一致性信度。
结果:第一阶段:通过两轮专家咨询,确定2个待扩展条目,分别为暴力攻击行为史和非自愿住院。
BVC-E含有8个条目,包括混乱、易激惹、喧闹、口头威胁、躯体威胁、毁物行为、暴力攻击行为史、非自愿住院。
两轮专家咨询的专家积极系数均为100%,问卷有效率分别为100%和97.22%;专家权威系数分别为0.876和0.883;专家意见的协调系数分别为0.472和0.523。
第二阶段:完成病例评估691例,其中3例基本信息不全,9例脱落,有效病例为679例,9个班次内共收集有效评估表6111份。
总体评定时间为1~6(2.27±1.05)分钟。
1.效度:(1)内容效度:BVC-E各条目水平的内容效度指数(I-CVI)为混乱(0.83)、易激惹(1.00)、喧闹(0.83)、口头威胁(1.00)、躯体威胁(1.00)、毁物行为(1.00)、暴力攻击行为史(1.00)、非自愿住院(0.83);量表水平的内容效度指数(S-CVI)为0.94。
护理存在量表的汉化及信效度检验

护理存在量表的汉化及信效度检验1. 研究背景及意义随着医疗模式的转变和患者权益的日益重视,护理质量成为医疗机构评价的重要指标之一。
为了更科学、准确地评估护理质量,护理存在量表(Nursing Quality Indicators, NQI)应运而生。
该量表通过一系列与患者安全和护理效果密切相关的指标,为护理管理者提供了一个全面、系统的质量评价工具。
目前国内对于护理存在量表的研究尚处于起步阶段,缺乏中文版的相关研究。
本研究旨在对护理存在量表进行汉化,并对其信效度进行检验,以期为国内护理质量的评估提供有力支持。
汉化护理存在量表不仅有助于提高护理质量评价的准确性和可靠性,还能为护理管理者提供一个本土化的评价标准。
通过信效度检验,可以确保量表在临床实践中的有效性和可行性,为护理质量的持续改进提供科学依据。
1.1 护理存在量表的发展历程护理存在量表(Nursing Presence Scale,NPS)是一种用于评估护士在护理实践中的存在感和影响力的工具。
它最早由美国心理学家Sternberg于1965年开发,用于评估临床实习生的护理能力。
随着时间的推移,NPS逐渐被广泛应用于护理实践和研究中,成为评估护士护理质量的重要指标。
在20世纪70年代,NPS开始被翻译成多种语言,包括英语、西班牙语、德语等。
由于不同文化背景下护理实践的特点和需求存在差异,翻译后的NPS在信效度方面可能会受到一定影响。
为了解决这一问题,一些学者开始对NPS进行汉化研究,以期提高其在中国护理实践中的应用效果。
随着我国护理事业的快速发展,护理存在量表的汉化研究取得了显著成果。
经过多次修订和验证,目前已有多个版本的汉化护理存在量表可供临床使用。
这些汉化版本在信效度方面与原版NPS相当,为我国护理实践提供了有力的测量工具。
为了验证汉化护理存在量表的信效度,研究者通常采用多种统计方法对原始数据进行分析。
这些方法包括相关系数、卡方检验、因子分析等。
citc值和总体信度系数

citc值和总体信度系数摘要:1.引言:简要介绍CITC值和总体信度系数的概念及重要性2.CITC值的概念和计算方法2.1 内容效度指数(CITC)的含义2.2 计算CITC值的方法和步骤3.总体信度系数的计算方法3.1 总体信度系数的定义和意义3.2 计算总体信度系数的方法4.CITC值与总体信度系数的关系4.1 二者之间的联系4.2 如何在实际应用中结合使用5.提高CITC值和总体信度系数的方法5.1 优化问卷设计5.2 提高数据收集质量5.3 合理分析和解释数据6.总结:CITC值和总体信度系数在研究中的应用及价值正文:作为一名职业写手,今天我们将探讨CITC值(内容效度指数)和总体信度系数在研究中的重要作用。
这两个概念在量化研究中具有重要意义,帮助研究者评估问卷或测量的质量。
接下来,我们将详细了解这两个概念的含义、计算方法以及它们在研究中的应用。
首先,让我们了解一下CITC值。
CITC值,即内容效度指数,是用于评估问卷或测量内容效度的一种指标。
在研究中,内容效度是指测量工具所涵盖的主题是否具有代表性,以及所包含的项目是否能够充分反映该主题。
CITC值可以通过以下步骤计算:1.专家评估:邀请一组专家对问卷或测量项目进行评估,给出每个项目的评分。
2.计算平均分:将所有专家的评分相加,除以专家数量,得到每个项目的平均分。
3.计算标准差:计算每个项目得分的标准差。
4.计算CITC值:将平均分除以标准差,得到CITC值。
接下来,我们来探讨总体信度系数。
总体信度系数是用于衡量测量工具整体可靠性的指标。
在研究过程中,总体信度系数可以帮助研究者确定测量结果是否可靠和有效。
计算总体信度系数的方法如下:1.同一测量工具的多次施测:在不同时间或不同条件下,对同一测量工具进行多次施测,收集多组数据。
2.计算各组数据的内部一致性:使用Cronbach"s Alpha系数或其他内部一致性指标,评估各组数据的一致性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
pc
K’
评价
由以上结果可见,该量表中的11个条目I-CVI 大于0.78,K‘大于0.74,提示这些条目内容效度优秀。 条目10只得到了6位专家中4位的认可,I-CVI为 0.67,对随机一致性进行校正后K’为0.56,提示内 容效度一般,应考虑进行修改或删除。
量表中被所有专家均评为3或4分的条目共9条, 因此S-CVI/UA为0.75,低于0.8。对各I-CVI计算 均数可得s.CVI/Ave为0.944,大于0.90。综合考虑, 该量表的内容效度指数尚可,对条目10进行修订 或删除后,s.CVI可得到进一步改良。
万方数据
量表编制中内容效度指数的应用史静净,等
3.2注意事项 有学者建议在计算CVI之前应先算出评价者
间一致性水平(interrater agreement,IR),即专家 评分都为l或2的条目数与专家评分都为3或4 的条目数之和除以条目总数[Ill。IR不低于0.7或 0.8提示评价者间一致性较好【l 0l,可进一步计算 CVI。如果IR值较低,研究者应通过与专家面谈 或其他方式确认咨询问卷中测量概念和内容维度 的定义是否确切,问卷所设计的评分等级是否恰 当等。除非在第l轮内容效度评估的专家咨询后 只需作很小的修改,通常量表编制过程中要进行2 轮专家咨询。第l轮专家咨询一般邀请专家8~12 人(不少于3人),可由I-CVI和对量表全面性问 题的回答为条目的修改、删除或增补提供信息。 通常,I-CVI低于0.78提示条目需进行修改,I-CVI 很低,提示条目可考虑删除。在对量表进行修改 后的第2轮专家咨询,专家人数可以减少为3—5人, 其信息可用于计算量表最终的I-CVI和S-CVI。
3内容效度指数的应用
3.1应用实例 某研究者编制了含12个条目的乙型病毒性肝
炎相关歧视态度量表,请A,B……F共6位专家 对其内容效度评价,结果见表2。
表2某研究内容效度专家评分及内容效度指数的计算
!垒垒!竺兰旦!竺里堡!!竺三£竺!堕竺塑翌竺璺型!竺塑竺竺竺!兰!望
条目
A
B
专家评分
c
D
E
F
评分为3或4的 专家人数
The characteristics and qualifications of the expertsJ process and main results of content validity
evaluation should be reported in scale.related manuscript.
K=一I.CVI.Pc 。
1.pc
表1中第4列和第5列分别给出了各情况下 的pc和K‘取值。K’的评价标准是:0.40。0.59为 一般,0.60~0.74为良好,大于0.74为优秀[210表 1中第6列是按照K’取值得到的评价结果,表中 略去了I-CVI接近或低于O.5的可能情况,因为这 些情况通常提示内容效度较差。该方法将CVI与 校正了相关的K’联系在一起,通常专家间意见一 致性越高,即I-CVI越大,K’值也越高。在对随机 一致性进行校正后,I-CVI大于或等于0.78,提示 内容效度较优。
,臻聋翥麓;1;惹弱2眦Ⅳ(2)嘶.//~啪ea.ors.h叫悱x,,s一
量表编制中内容效度指数的应用
史静垮,莫显昆,孙振球
(中南大学公共卫生学院流行病与卫生统计学系,长沙410078)
f摘要】内容效度是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。量表内容效度的定量评 价中应用最广泛的指标是内容效度指数。内容效度指数分为条目水平的内容效度指数(I-CVI)和量表水平的内 容效度指数(S-CVI)两类。结合I-CVI,对随机一致性进行校正可计算调整后的kappa值(记为K.)。按计算方法不同, S-CVl分为全体一致S-cvi(s.CVI/UA)和平均S-cvI(s.CVI/Ave)。量表I-CVI不低于0.78,S-CVI/UA和S-CVl/Ave 分别不低于0.8和0.9提示内容效度较好。在撰写相关论文时,应包含内容效度评价的过程和主要结果。
【关键词】量表;内容效度;内容效度指数;随机一致性
DOI:10.3969/j.issn.1672.7347.2012.02.007
Content validity index in scale development
SHIJingcheng,MO Xiankun,SUN Zhenqiu (Department ofEpidemiology and Statistics,School oJPublic Health,Central South University,Changsha 41 0078,China)
评价的信息【2】。然而,在实际工作中研究者常常过 度强调结构效度和实证效度等统计学指标,而忽 视条目内容在量表编制中所扮演的重要角色。内 容效度是指一个量表实际测到的内容与所要测量 的内容之间的吻合程度。估计一个量表的内容效 度就是确定其在多大程度上代表了所要测量的行 为领域lI】。量表编制中内容效度的确立主要通过两
index,CVll。
1内容效度指数的计算及判断标准
内容效度指数分为两类:条目水平的内容 效度指数(item.1evel CVI,I-CVI),对各个条目 的内容效度作出评价;量表水平的内容效度指数 (scale—level CVI,s.CVI),对整个量表的内容效 度进行评估。
1.1 I—CVI
在内容效度评价的专家咨询问卷中要求专家 就每一条目与相应内容维度的关联性(或代表性) 作出选择。通常,可选项是4等级评分:1=不相 关,2=弱相关,3=较强相关,4=非常相关。这 样,就每一条目。给出评分为3或4的专家人数 除以参评的专家总数即为相应的I-CVI,表l第3 列给出了常见情况下I-CVI的取值。按此定义,计 算I-CVI以及后续的S-CVI时,实际上是把4个等 级的评分归纳成了两类:1或2分,表示条目与 相应的内容维度不相关,条目对测量概念的代表 性不好;3或4分,表示条目与相应的内容维度 相关,条目代表性好。Lynn【91给出了I-CVI的判 断标准:当专家人数少于或等于5人时,I-CVI应 为1.00,即全部专家均认为该条目与所要测量的 概念内容有较好的关联性,才认为这个条目的内 容效度较好;当专家人数是6人或更多时,标准 可以降低,但要求I-CVI不低于0.78。例如:当6 位专家对某条目进行评价,有1位专家给出l或2 的评分(I.CVI--0.83)时,该条目仍可接受;当有 9位专家评分,接受最多有2位给出l或2的评分 (I—CVI=0.78)。
竺璺鲨!竺!坐!!
菩耋评笆蝥2的I…删1
人数
专家人数
PⅥ。
c “
ห้องสมุดไป่ตู้
评”… 价
(1)
(2)
(3)
(4)
(5)
(6)
2内容效度指数的特点
CVI区别于其他许多内容效度评价指标的一个 明显特征是它只涉及评价者间均认为条目与相应内 容维度相关的一致性,而不是常用的评价者问全部 (包括相关和不相关)一致性,这正是内容效度评 价所关心的部分;因此CVI得以最广泛的应用。其 次,I-CVI和S-CVI可以分别提供条目诊断和量表 效度信息。I-CVI不仅可以用于内容效度的评价, 在量表编制的前期还可以为条目的修改或删除提供 信息。此外,CVI还具有计算简单,易于理解和交流, 可对随机一致性进行校正等优点。
scale;content validity;content validity index;chance agreement
效度(validitv)是指一个量表或测验实际能测 出其所要测的心理特质的程度,其常见的解释角度 有3种:用测量的内容来说明目的(内容效度)、用 心理学上某种理论结构来说明目的(结构效度)和 用工作实效来说明目的(实证效度)illo内容效度 (content validity)是量表质量的重要体现,某些杂 志已要求有关量表编制的论文必须含有内容效度
I-CVI for chance agreement.S-CVI/UA and S-CVI/Ave are both scale level CVl with different formulas.Researchers recommend that a scale with excellent content validity should be composed of I—CVIs of 0.78 or higher and S-CVI/UA and S-CVI/Ave of 0.8 and 0.9 or higher,respectively.
然而,两个或多个专家对条目与相应维度的 关联性评价一致的意见还可能是由于他们对选项
153
的随机选择(即不代表专家的意见)造成的,分 析此类数据时,应当对这种随机一致性(chance agreement)进行校正。Polit等【21给出了对随机一 致性进行校正,计算调整后的kappa值(记为K’) 的方法:
个阶段实现:1)量表的制定阶段:包括维度定义、 条目产生和量表构建;2)内容效度的评价阶段: 其工作思路是请有关专家对量表条目与原定内容 范围的吻合程度(相关性)作出判断。第一阶段在 很多测量学的文献中已有详述,本文主要讨论第 二阶段。
在内容效度的定量评价过程中,通过专家咨 询,量表条目对所要测量的内容维度的代表性信 息收回后,可以计算一系列的指标来评价内容效 度的优劣。这些指标包括:0t系数【3】、kappa系 数‘41、r+ⅣG值例和内容效度比㈣等。目前,在这 类指标中应用最广泛的是由Hambleton和Martuza 等17墙】提出和推广的内容效度指数(content validity
1)随机一致性概率(Pc)的估计:记n为参评 专家人数,A为给予3或4分即认为条目与相应的 内容维度相关的专家人数。对某一条目,假设每 位专家随机选择相关或不相关,概率均为0.5,按 照二项分布的原理,在n名专家中A人均认为相