内容效度指数

合集下载

中文版护士职业认同量表的信效度分析

中文版护士职业认同量表的信效度分析邓芳丽;张健;李宣霖;骆宁;胡凤君;王诚丽【摘要】目的：编制中文版护士职业认同量表，并检验其在中国护士中的信度和效度。

方法按照翻译程序将日文版护士职业认同量表编译成中文，对385名临床护士进行测试，评价量表的信度和效度。

结果量表全体一致内容效度指数为0.809，平均内容效度指数为0.923。

探索性因子分析提取5个公因子，累积方差贡献率为64.544%，所有条目的因子负荷均大于0.4；5个因子之间的相关系数在0.374～0.780，均有统计学意义（P＜0.01）；集合效度0.451～0.803，区分效度0.048～0.285。

总量表的Cronbach’sα系数为0.902、分半信度为0.858、重测信度为0.899。

结论中文版护士职业认同量表具有较好的信度和效度，对评价我国护士职业认同状况具有一定的应用价值。

%Objective To test the reliability and validity of the Chinese version of Nurse ’s Career Identity Scale (NCIS). Methods NCIS was translated from Japanese into Chinese. A totalof 385 clinical nurses completed the scale, then the reliability and validityof the Chinese version of NCIS were tested. Results Content validity indexof the scale was 0.809, the average content validity index was 0.923. Five factors were extracted from the revised Chinese scale, and the cumulative contribution rate was 64.544%. The loading factor of all items was exceeded 0.4. The correlation coefficient between the five factors in the0.374~0.780, were statistically significant (P<0.01). Convergent validity was 0.451~0.803, and discriminant validity was 0.048~0.285. Cronbach ’s α coefficient of questionnaire was 0.902, the split-half reliability was 0.858, and retest reliability was 0.899. Conclusion The Chinese version ofNurse’s Career Identity Scale had good reliability and validity, suitable to assess the situation of nurse ’s career identity in China.【期刊名称】《护理学报》【年(卷),期】2016(023)017【总页数】4页(P47-50)【关键词】护士;职业认同;信度;效度【作者】邓芳丽;张健;李宣霖;骆宁;胡凤君;王诚丽【作者单位】郴州市第一人民医院，湖南郴州 423000;郴州市第一人民医院，湖南郴州 423000;郴州市第一人民医院，湖南郴州 423000;郴州市第一人民医院，湖南郴州 423000;郴州市第一人民医院，湖南郴州 423000;郴州市第一人民医院，湖南郴州 423000【正文语种】中文【中图分类】R192.6认同感是社会调查中的一个重要结构，认同感与其行为有一定的联系，这就提示了职业认同感与未来职业计划或选择有一定的联系。

效度分析

效度分析效度分析是一种统计方法，用于确定测量工具（例如调查问卷）是否有效地定位了研究者想要评估的现象或变量。

在社会科学中，效度是评估测量工具准确性和信度之后的第三个主要考虑因素。

效度是指测量工具是否能够准确地测量所需的概念或变量。

因此，测量工具的效度对于获取真实正面或负面的结果至关重要。

下面将详细介绍效度分析的类型、计算方法和解释结果的方式。

效度分析类型常见的效度分析类型包括以下几种：1. 内容效度(Content validity)内容效度是用于检验测量工具的所有项目是否完全涵盖其要测试的现象（又称为构造）。

这种方法通常需要专家小组对测量工具进行审核并提供反馈以确保所有相关内容都得到了涵盖。

例如，在教育研究中，专家可能会提供它们认为值得教授的语法知识列表，并观察这些知识是否出现在题目中。

2. 构造效度(Construct validity)构造效度强调了测量工具是否有效地测量其试图测量的概念本身。

这种方法通常通过测量工具与其他已经被证明有效的测量工具进行比较来进行。

例如，在心理学研究中，研究者可以使用问卷调查来评估一个人的思考方式，并将其与已知有效的智力测验或注意力检测工具进行比较。

3. 相关效度（Criterion-related validity）相关效度用于比较测量工具结果与特定标准或结果的一致性，因此这种方法需要一个明确的基准点。

例如，在医学研究中，一个新的药物可能会被诊断为有效，如果它在治愈特定疾病方面的效果显著且优于其他已知治疗方案。

效度分析计算方法常见的效度分析计算方法包括以下几种：1. 内容效度指标(Content Validity Index, CVI)内容效度指数通过测量工具中被认为正确反映概念含义的项目数量来衡量测量工具的一致性程度。

例如，如果一个问题在专家审核中被认为与概念完全一致，则该项目的CVI得分为1；如果该问题只有部分符合期望，则得分介于0和1之间。

最终，所有项的CVI总和的平均值将是测量工具的内容效度得分。

变量效度检验（内容、建构、判别、收敛）_管理学_高等教育_教育专区

变量效度检验（内容、建构、收敛、判别）一、内容效度内容效度（Content validity）是指测量内容的适当性，判断测量内容是否符合目，一般是定性的判定。

如果研究用于测量自变量、因变量以及调节变量的量表均是国内外学者的现有文献中使用过的测量量表，每个测量量表都具有可靠的数量指标，这些测量量表都有可靠的理论来源，具有较好的内容效度。

二、建构效度建构效度反映了测量工具能够正确无误地测出潜在特质的程度，一般采用验证性因子分析（Confirmatory Factor Analysis，CFA）来检验构建效度。

通常，我们可以用LISREL8.7软件检验外源变量（即自变量）和内源变量（即因变量）的量表建构效度，从而检验变量的CFA的整体模型拟合指数。

拟合指数的指标判定选取绝对拟合、相对拟合和简约拟合等三类指数。

（1）外源变量CFA分析因子载荷的判断：外源变量的各因子载荷（每个维度的语句）分别为均要求满足大于0.50的要求值，且没有大于或接近于1的数。

表5-5外源变量的CFA分析拟合指数拟合指数分析用来判断模型的拟合度，一般通过以下一个指标判断。

其中2/df χ，RMSEA 根据上图可直接观察到。

如果绝对拟合指数、相对拟合指数，简约拟合指数都基本符合所要求的接受值，表明测量模型具有良好的建构效度。

三、收敛效度收敛效度是指量表与同一构念的其他指标相互关联的程度，一般通过CFA 检验。

各指标检验标准：因子载荷（λ）判断测量变量的收敛效度，要求λ值大于0.5，且t 值大于1.97；平均变异萃取量（A VE ）解释潜变量的程度，要求A VE 值大于0.5；组合信度反映每个潜变量中所有测量题项是否一致的解释该潜变量，CR 值要满足大于 0.7，各潜变量的AVE 值都大于0.5，满足以上所有条件，通常认为收敛效度较高。

利用“建构信度的计算”填写各变量值，计算出CR 值和AVE 值。

例如：变量的维度A 有3个语句，则输入观察变量的数目：3；X1,X2,X3分别填入各自的因子载荷值，点击“计算”，就得出平均变异抽取量（A VE ）和组合信度（CR ）的值。

护理工作量标准化指标的测定与评价

制，为乡镇卫生院发展提供了良好的外部环境，促进了卫生院内部经营运行机构的变革，一体化管理、双向转诊消除了卫生院与卫生室之间的不正当竞争和矛盾，形成了技术普及、互惠互利、相互促进、协调发展的良性发展机制，卫生院的综合服务功能和竞争能力逐渐增强，业务收入和社会声誉明显提高，“枢纽”作用也得到巩固发展。２．５提升了政府形象，改善了医患关系基层医疗卫生工
均工时数测定，作为评估、预测护理工作量的一种新的尝试。
１资料和方法１．１护理工作量指标的筛选和标化
１．１．１
护理操作项目范畴的初步界定。根据《广东省临床
护理操作规范》中的项目，由总护士长、各科护士长及责任组长共同提供本科室所有护理操作项目，共２２３项．去除操作次数稀少的项目（执行科室少于三分之一）后，保留主要护理操作项目作为测量工作量测试指标。１．１．２测量指标的筛选和内容效度的评定。测量表格项目的内容效度由１名主任护师、３名副主任护师以及４名科室主任依Ｗａｌｔｚ，Ｓｔｒｉｅｋｌａｎｄ，＆Ｌｅｎｚ（１９９１）建议的专家鉴定法来评定，就测量项目与测量总表结构的归属关系是否合理、项目名称与操作内涵的吻合程度是否合理、用词是否合理及项目和评分细则有无重复、遗漏，分别评定为合适／不合适，
照达标一个验收一个、成熟一个定点一个的原则，目前滨州
市拥有规范化的农村新农合定点村级医疗机构８００余处，全部与新农合经办机构实现了计算机联网，实施网络化、自动化监督和管理，参合农民看病就医现场既可得到补偿。３几点体会３．１农村医疗机构建设与改造和新农合政策有机结合新农合制度的全面覆盖，有利地促进了乡村卫生一体化管理工
准化，取平均值作为该科室该项目的操作时间输入ＨＩＳ系
统。１．２测量效标关联效度评价

德尔菲专家咨询法与内容效度的差别Delphi法

德尔菲专家咨询法与内容效度的差别Delphi法小编在看以往硕士论文的时候，发现作者在进行量表制作研究时，会将德尔菲专家咨询法与内容效度弄混。

小编在帮助老师进行科研设计的时候，发现有些护士老师对这两块也具有疑惑。

其实这两块具有很大差异，根本不是同一个东西，分析方法也不一样。

今天小编就将这两块的异同向大家讲解一下。

1. 概念：异德尔菲专家咨询法是专家会议法的一种。

其核心是通过函询专家背对背的方式征询专家意见，由课题组对收集的意见进行汇总整理、统计分析，再以匿名的方式反馈给各位专家，供专家进行分析判断，提出新意见与建议，如此反复轮回，使意见逐渐趋向一致，得到一份认可率高且可靠性大的方案。

内容效度是效度分析的一种，是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。

2. 研究方法：同二者均采用问卷调查的形式进行研究，制定好问卷后，通过现场面对面，电子邮件等方式将问卷给予研究对象，也就是专家组成员进行填写。

3. 研究轮次：同二者专家轮次均以不再出现新的意见与建议。

一般德尔菲专家咨询法需要进行2-3轮。

内容效度一般仅进行一轮，原因是因为，一般在进行内容效度之前，已经进行过德尔菲专家咨询法，专家在进行指标重要性评价的同时，也对指标的相关性评价，所以，一般不会出现不相关的指标。

如果出现了不相关的指标，还是需要进行二轮内容效度分析的。

4. 研究对象：异这里的研究对象，其实就是专家组成员。

德尔菲专家咨询法专家组成员应满足权威性，全面性，代表性等原则，人数应大于15个。

只有人数大于15个，才能使误差降低合适范围内。

内容效度专家可以不满足上述原则与人数，可以在德尔菲专家咨询法专家组成员中选择，一般专家人数不少于5人。

5. 研究工具：异研究工具是指调查表。

德尔菲专家咨询表一般包括3-4部分：填表说明，重要性赋值表，专家一般情况调查表（专家权威程度调查表）。

而内容效度一般包括2-3部分：填表说明，相关性赋值表（专家一般情况调查表）。

扩展版布罗塞特暴力风险评估量表的效度和信度

扩展版布罗塞特暴力风险评估量表的效度和信度目的:对布罗塞特暴力风险评估量表(Br?set Violence Checklist,BVC)进行扩展,提高其灵敏度,使其更加符合我国的国情和社会文化背景,从而更好的应用于我国的精神科临床实践,为精神科工作人员提供一个有效的暴力风险评估工具。

方法:本研究共分为两个阶段。

第一阶段:通过查阅文献、小组讨论确定待扩展条目池,采用德尔菲法研制扩展版布罗塞特暴力风险评估量表(Br?set Violence Checklist-Extended,BVC-E)。

选择临床精神医学、精神科临床护理、精神科护理管理领域的专家36名,采取特快专递和电子邮件相结合的方法进行两轮专家咨询,根据专家咨询的结果筛选出待扩展条目,形成BVC-E。

第二阶段:对BVC-E的效度和信度进行测评。

邀请从事精神科工作30年以上的6名专家对BVC-E的内容效度进行评定;24名经过培训合格的护士独立评估10个相同的病例,评价其评定者间信度;选取679例河北省第六人民医院的新住院精神障碍患者,应用BVC-E每8小时评估一次,根据暴力发生的真实情况检验BVC-E的预测效度;应用Cronbach’α系数评价其内部一致性信度。

结果:第一阶段:通过两轮专家咨询,确定2个待扩展条目,分别为暴力攻击行为史和非自愿住院。

BVC-E含有8个条目,包括混乱、易激惹、喧闹、口头威胁、躯体威胁、毁物行为、暴力攻击行为史、非自愿住院。

两轮专家咨询的专家积极系数均为100%,问卷有效率分别为100%和97.22%;专家权威系数分别为0.876和0.883;专家意见的协调系数分别为0.472和0.523。

第二阶段:完成病例评估691例,其中3例基本信息不全,9例脱落,有效病例为679例,9个班次内共收集有效评估表6111份。

总体评定时间为1~6(2.27±1.05)分钟。

1.效度:(1)内容效度:BVC-E各条目水平的内容效度指数(I-CVI)为混乱(0.83)、易激惹(1.00)、喧闹(0.83)、口头威胁(1.00)、躯体威胁(1.00)、毁物行为(1.00)、暴力攻击行为史(1.00)、非自愿住院(0.83);量表水平的内容效度指数(S-CVI)为0.94。

护理存在量表的汉化及信效度检验

护理存在量表的汉化及信效度检验1. 研究背景及意义随着医疗模式的转变和患者权益的日益重视，护理质量成为医疗机构评价的重要指标之一。

为了更科学、准确地评估护理质量，护理存在量表（Nursing Quality Indicators, NQI）应运而生。

该量表通过一系列与患者安全和护理效果密切相关的指标，为护理管理者提供了一个全面、系统的质量评价工具。

目前国内对于护理存在量表的研究尚处于起步阶段，缺乏中文版的相关研究。

本研究旨在对护理存在量表进行汉化，并对其信效度进行检验，以期为国内护理质量的评估提供有力支持。

汉化护理存在量表不仅有助于提高护理质量评价的准确性和可靠性，还能为护理管理者提供一个本土化的评价标准。

通过信效度检验，可以确保量表在临床实践中的有效性和可行性，为护理质量的持续改进提供科学依据。

1.1 护理存在量表的发展历程护理存在量表(Nursing Presence Scale,NPS)是一种用于评估护士在护理实践中的存在感和影响力的工具。

它最早由美国心理学家Sternberg于1965年开发，用于评估临床实习生的护理能力。

随着时间的推移，NPS逐渐被广泛应用于护理实践和研究中，成为评估护士护理质量的重要指标。

在20世纪70年代，NPS开始被翻译成多种语言，包括英语、西班牙语、德语等。

由于不同文化背景下护理实践的特点和需求存在差异，翻译后的NPS在信效度方面可能会受到一定影响。

为了解决这一问题，一些学者开始对NPS进行汉化研究，以期提高其在中国护理实践中的应用效果。

随着我国护理事业的快速发展，护理存在量表的汉化研究取得了显著成果。

经过多次修订和验证，目前已有多个版本的汉化护理存在量表可供临床使用。

这些汉化版本在信效度方面与原版NPS相当，为我国护理实践提供了有力的测量工具。

为了验证汉化护理存在量表的信效度，研究者通常采用多种统计方法对原始数据进行分析。

这些方法包括相关系数、卡方检验、因子分析等。

citc值和总体信度系数

citc值和总体信度系数摘要：1.引言：简要介绍CITC值和总体信度系数的概念及重要性2.CITC值的概念和计算方法2.1 内容效度指数（CITC）的含义2.2 计算CITC值的方法和步骤3.总体信度系数的计算方法3.1 总体信度系数的定义和意义3.2 计算总体信度系数的方法4.CITC值与总体信度系数的关系4.1 二者之间的联系4.2 如何在实际应用中结合使用5.提高CITC值和总体信度系数的方法5.1 优化问卷设计5.2 提高数据收集质量5.3 合理分析和解释数据6.总结：CITC值和总体信度系数在研究中的应用及价值正文：作为一名职业写手，今天我们将探讨CITC值（内容效度指数）和总体信度系数在研究中的重要作用。

这两个概念在量化研究中具有重要意义，帮助研究者评估问卷或测量的质量。

接下来，我们将详细了解这两个概念的含义、计算方法以及它们在研究中的应用。

首先，让我们了解一下CITC值。

CITC值，即内容效度指数，是用于评估问卷或测量内容效度的一种指标。

在研究中，内容效度是指测量工具所涵盖的主题是否具有代表性，以及所包含的项目是否能够充分反映该主题。

CITC值可以通过以下步骤计算：1.专家评估：邀请一组专家对问卷或测量项目进行评估，给出每个项目的评分。

2.计算平均分：将所有专家的评分相加，除以专家数量，得到每个项目的平均分。

3.计算标准差：计算每个项目得分的标准差。

4.计算CITC值：将平均分除以标准差，得到CITC值。

接下来，我们来探讨总体信度系数。

总体信度系数是用于衡量测量工具整体可靠性的指标。

在研究过程中，总体信度系数可以帮助研究者确定测量结果是否可靠和有效。

计算总体信度系数的方法如下：1.同一测量工具的多次施测：在不同时间或不同条件下，对同一测量工具进行多次施测，收集多组数据。

2.计算各组数据的内部一致性：使用Cronbach"s Alpha系数或其他内部一致性指标，评估各组数据的一致性。

量表编制中内容效度指数的应用

分别不低于０８和０９提示内容效度较好。在撰写相关论文时，应包含内容效度评价的过程和主要结果。．．【关键词】量表；内容效度；内容效度指数；随机一致性
Ｄ：．６／ｉｎ１７ —３７２１．．７ＯＩ０３９ｊｓ．２７４．２２０１９．ｓ６０００
评价的信息口。然而，在实际工作中研究者常常过】度强调结构效度和实证效度等统计学指标，而忽视条目内容在量表编制中所扮演的重要角色。内容效度是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。估计一个量表的内容效度就是确定其在多大程度上代表了所要测量的行
容效度指数（－Ｖ）ＳＣＩ两类。合ＩＶ，随机一致性进行校正可计算调整后的ｋｐａ（为）结－Ｉ对Ｃａｐ值记。按计算方法不同，
ＳＣ１－Ｖ分为全体一致ＳｃｓｃＩｕ）－ｗ（．ｖ／Ａ和平均Ｓｃ３ｓＣＩｖ）－ｖ（—Ｖ／ｅ。量表ＩＶ不低于０８－Ｖ／Ａ和ＳＣＩＡｅＡ－ＩＣ．，ＳＣＩＵ７－Ｖ／ｖ
Ｃｏｎｅｔｖｌｔｄｘｉｃｌｅｅｏｍｅｔｔｎａｉｙｉｅｓａｅｄｖｌｐｄｉｎｎｎ
ＳＪｇｈｎ，ｉｋｎＳＮＺｅｑＨＩｉｃｅｇＭＯＸａｕ，Ｕｈｎｉｎｎｕ
（ｅａｍｎｏｐｅｉｏｄｔｉｉＳｈｏｏＰｂｃｅｔＣｎａＳｕｎｅｉＣａｇａ１０８Ｃｉ）ＤｐｒｅｔＥｉｍｏｇａａｓｃｃｌｕｌＨａｈｅｒｔＵｉｒｔｈｎｓ７ｈａｔｄｌｙｎＳｔｔｓｏｆ，ｆｉｌ，ｔｌｏｈｖｓ，ｙｈ４０，ｎ

统计学中的信度与效度

统计学中的信度与效度统计学是一门研究收集、整理、分析和解释数据的学科。

在统计学中，信度和效度是两个重要的概念。

它们用于评估测量工具（如问卷调查或测试）的质量和可靠性。

本文将介绍信度和效度的定义、计算方法以及在实际研究中的应用。

信度信度是指测量工具的稳定性和一致性。

在统计学中，一个可靠的测量工具应该能够反映出被测量对象的真实状态，即在不同时间和条件下具有相似的结果。

信度可以分为内部一致性信度和测试-重测信度。

内部一致性信度内部一致性信度用于评估测量工具中各个项目（题目或指标）之间的关联性或相关性。

常见的内部一致性信度计算方法包括：皮尔逊相关系数：用于连续变量之间的相关性分析。

斯皮尔曼等级相关系数：用于有序分类变量之间的相关性分析。

克隆巴赫α系数：用于多个项目构成的测量工具的内部一致性评估。

测试-重测信度测试-重测信度用于评估同一个测量工具在不同时间或条件下的结果是否相似。

常见的计算方法有：皮尔逊相关系数：对连续变量进行测试-重测信度分析。

斯皮尔曼等级相关系数：对有序分类变量进行测试-重测信度分析。

人际相关系数：对多个观察者、评分者或测量者进行测试-重测信度分析。

效度效度是指测量工具所衡量的概念与实际情况是否一致。

一个有效的测量工具应该能够准确地反映出所要衡量的特征或属性。

效度可以分为内容效度、判别效度和预测效度。

内容效度内容效度是指测量工具中各个项目是否能全面、准确地反映所要衡量的特征或属性。

常见的评估方法有：面向专家群体进行评估：邀请领域专家对测量工具进行评审和反馈。

内容有效性指数（CVI）：通过专家对每个项目进行评分后计算，通常使用于问卷调查。

判别效度判别效度是指测量工具与其他相关概念进行区分的程度。

常见的评估方法有：计算两个或多个概念之间的相关系数，如皮尔逊相关系数。

进行因子分析，检查因子载荷情况和因子方差解释比例。

预测效度预测效度是指测量工具对未来事件或行为进行预测的能力。

常见方法包括：使用回归分析等统计模型，通过历史数据预测未来结果。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ｐｃ
Ｋ’
评价
由以上结果可见，该量表中的１１个条目Ｉ－ＣＶＩ大于０．７８，Ｋ‘大于０．７４，提示这些条目内容效度优秀。条目１０只得到了６位专家中４位的认可，Ｉ－ＣＶＩ为０．６７，对随机一致性进行校正后Ｋ’为０．５６，提示内容效度一般，应考虑进行修改或删除。
量表中被所有专家均评为３或４分的条目共９条，因此Ｓ－ＣＶＩ／ＵＡ为０．７５，低于０．８。对各Ｉ－ＣＶＩ计算均数可得ｓ．ＣＶＩ／Ａｖｅ为０．９４４，大于０．９０。综合考虑，该量表的内容效度指数尚可，对条目１０进行修订或删除后，ｓ．ＣＶＩ可得到进一步改良。
万方数据
量表编制中内容效度指数的应用史静净，等
３．２注意事项有学者建议在计算ＣＶＩ之前应先算出评价者
间一致性水平（ｉｎｔｅｒｒａｔｅｒａｇｒｅｅｍｅｎｔ，ＩＲ），即专家评分都为ｌ或２的条目数与专家评分都为３或４的条目数之和除以条目总数［Ｉｌｌ。ＩＲ不低于０．７或０．８提示评价者间一致性较好【ｌ０ｌ，可进一步计算ＣＶＩ。如果ＩＲ值较低，研究者应通过与专家面谈或其他方式确认咨询问卷中测量概念和内容维度的定义是否确切，问卷所设计的评分等级是否恰当等。除非在第ｌ轮内容效度评估的专家咨询后只需作很小的修改，通常量表编制过程中要进行２轮专家咨询。第ｌ轮专家咨询一般邀请专家８～１２人（不少于３人），可由Ｉ－ＣＶＩ和对量表全面性问题的回答为条目的修改、删除或增补提供信息。通常，Ｉ－ＣＶＩ低于０．７８提示条目需进行修改，Ｉ－ＣＶＩ很低，提示条目可考虑删除。在对量表进行修改后的第２轮专家咨询，专家人数可以减少为３—５人，其信息可用于计算量表最终的Ｉ－ＣＶＩ和Ｓ－ＣＶＩ。
３内容效度指数的应用
３．１应用实例某研究者编制了含１２个条目的乙型病毒性肝
炎相关歧视态度量表，请Ａ，Ｂ……Ｆ共６位专家对其内容效度评价，结果见表２。
表２某研究内容效度专家评分及内容效度指数的计算
！垒垒！竺兰旦！竺里堡！！竺三￡竺！堕竺塑翌竺璺型！竺塑竺竺竺！兰！望
条目
Ａ
Ｂ
专家评分
ｃ
Ｄ
Ｅ
Ｆ
评分为３或４的专家人数
ＴｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓａｎｄｑｕａｌｉｆｉｃａｔｉｏｎｓｏｆｔｈｅｅｘｐｅｒｔｓＪｐｒｏｃｅｓｓａｎｄｍａｉｎｒｅｓｕｌｔｓｏｆｃｏｎｔｅｎｔｖａｌｉｄｉｔｙ
ｅｖａｌｕａｔｉｏｎｓｈｏｕｌｄｂｅｒｅｐｏｒｔｅｄｉｎｓｃａｌｅ．ｒｅｌａｔｅｄｍａｎｕｓｃｒｉｐｔ．
Ｋ＝一Ｉ．ＣＶＩ．Ｐｃ。
１．ｐｃ
表１中第４列和第５列分别给出了各情况下的ｐｃ和Ｋ‘取值。Ｋ’的评价标准是：０．４０。０．５９为一般，０．６０～０．７４为良好，大于０．７４为优秀［２１０表１中第６列是按照Ｋ’取值得到的评价结果，表中略去了Ｉ－ＣＶＩ接近或低于Ｏ．５的可能情况，因为这些情况通常提示内容效度较差。该方法将ＣＶＩ与校正了相关的Ｋ’联系在一起，通常专家间意见一致性越高，即Ｉ－ＣＶＩ越大，Ｋ’值也越高。在对随机一致性进行校正后，Ｉ－ＣＶＩ大于或等于０．７８，提示内容效度较优。
，臻聋翥麓；１；惹弱２眦Ⅳ（２）嘶．／／～啪ｅａ．ｏｒｓ．ｈ叫悱ｘ，，ｓ一
量表编制中内容效度指数的应用
史静垮，莫显昆，孙振球
（中南大学公共卫生学院流行病与卫生统计学系，长沙４１００７８）
ｆ摘要】内容效度是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。量表内容效度的定量评价中应用最广泛的指标是内容效度指数。内容效度指数分为条目水平的内容效度指数（Ｉ－ＣＶＩ）和量表水平的内容效度指数（Ｓ－ＣＶＩ）两类。结合Ｉ－ＣＶＩ，对随机一致性进行校正可计算调整后的ｋａｐｐａ值（记为Ｋ．）。按计算方法不同，Ｓ－ＣＶｌ分为全体一致Ｓ－ｃｖｉ（ｓ．ＣＶＩ／ＵＡ）和平均Ｓ－ｃｖＩ（ｓ．ＣＶＩ／Ａｖｅ）。量表Ｉ－ＣＶＩ不低于０．７８，Ｓ－ＣＶＩ／ＵＡ和Ｓ－ＣＶｌ／Ａｖｅ分别不低于０．８和０．９提示内容效度较好。在撰写相关论文时，应包含内容效度评价的过程和主要结果。
【关键词】量表；内容效度；内容效度指数；随机一致性
ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７２．７３４７．２０１２．０２．００７
Ｃｏｎｔｅｎｔｖａｌｉｄｉｔｙｉｎｄｅｘｉｎｓｃａｌｅｄｅｖｅｌｏｐｍｅｎｔ
ＳＨＩＪｉｎｇｃｈｅｎｇ，ＭＯＸｉａｎｋｕｎ，ＳＵＮＺｈｅｎｑｉｕ（ＤｅｐａｒｔｍｅｎｔｏｆＥｐｉｄｅｍｉｏｌｏｇｙａｎｄＳｔａｔｉｓｔｉｃｓ，ＳｃｈｏｏｌｏＪＰｕｂｌｉｃＨｅａｌｔｈ，ＣｅｎｔｒａｌＳｏｕｔｈＵｎｉｖｅｒｓｉｔｙ，Ｃｈａｎｇｓｈａ４１００７８，Ｃｈｉｎａ）
评价的信息【２】。然而，在实际工作中研究者常常过度强调结构效度和实证效度等统计学指标，而忽视条目内容在量表编制中所扮演的重要角色。内容效度是指一个量表实际测到的内容与所要测量的内容之间的吻合程度。估计一个量表的内容效度就是确定其在多大程度上代表了所要测量的行为领域ｌＩ】。量表编制中内容效度的确立主要通过两
ｉｎｄｅｘ，ＣＶｌｌ。
１内容效度指数的计算及判断标准
内容效度指数分为两类：条目水平的内容效度指数（ｉｔｅｍ．１ｅｖｅｌＣＶＩ，Ｉ－ＣＶＩ），对各个条目的内容效度作出评价；量表水平的内容效度指数（ｓｃａｌｅ—ｌｅｖｅｌＣＶＩ，ｓ．ＣＶＩ），对整个量表的内容效度进行评估。
１．１Ｉ—ＣＶＩ
在内容效度评价的专家咨询问卷中要求专家就每一条目与相应内容维度的关联性（或代表性）作出选择。通常，可选项是４等级评分：１＝不相关，２＝弱相关，３＝较强相关，４＝非常相关。这样，就每一条目。给出评分为３或４的专家人数除以参评的专家总数即为相应的Ｉ－ＣＶＩ，表ｌ第３列给出了常见情况下Ｉ－ＣＶＩ的取值。按此定义，计算Ｉ－ＣＶＩ以及后续的Ｓ－ＣＶＩ时，实际上是把４个等级的评分归纳成了两类：１或２分，表示条目与相应的内容维度不相关，条目对测量概念的代表性不好；３或４分，表示条目与相应的内容维度相关，条目代表性好。Ｌｙｎｎ【９１给出了Ｉ－ＣＶＩ的判断标准：当专家人数少于或等于５人时，Ｉ－ＣＶＩ应为１．００，即全部专家均认为该条目与所要测量的概念内容有较好的关联性，才认为这个条目的内容效度较好；当专家人数是６人或更多时，标准可以降低，但要求Ｉ－ＣＶＩ不低于０．７８。例如：当６位专家对某条目进行评价，有１位专家给出ｌ或２的评分（Ｉ．ＣＶＩ－－０．８３）时，该条目仍可接受；当有９位专家评分，接受最多有２位给出ｌ或２的评分（Ｉ—ＣＶＩ＝０．７８）。
竺璺鲨！竺！坐！！
菩耋评笆蝥２的Ｉ…删１
人数
专家人数
ＰⅥ。
ｃ “
ห้องสมุดไป่ตู้
评”… 价
（１）
（２）
（３）
（４）
（５）
（６）
２内容效度指数的特点
ＣＶＩ区别于其他许多内容效度评价指标的一个明显特征是它只涉及评价者间均认为条目与相应内容维度相关的一致性，而不是常用的评价者问全部（包括相关和不相关）一致性，这正是内容效度评价所关心的部分；因此ＣＶＩ得以最广泛的应用。其次，Ｉ－ＣＶＩ和Ｓ－ＣＶＩ可以分别提供条目诊断和量表效度信息。Ｉ－ＣＶＩ不仅可以用于内容效度的评价，在量表编制的前期还可以为条目的修改或删除提供信息。此外，ＣＶＩ还具有计算简单，易于理解和交流，可对随机一致性进行校正等优点。
ｓｃａｌｅ；ｃｏｎｔｅｎｔｖａｌｉｄｉｔｙ；ｃｏｎｔｅｎｔｖａｌｉｄｉｔｙｉｎｄｅｘ；ｃｈａｎｃｅａｇｒｅｅｍｅｎｔ
效度（ｖａｌｉｄｉｔｖ）是指一个量表或测验实际能测出其所要测的心理特质的程度，其常见的解释角度有３种：用测量的内容来说明目的（内容效度）、用心理学上某种理论结构来说明目的（结构效度）和用工作实效来说明目的（实证效度）ｉｌｌｏ内容效度（ｃｏｎｔｅｎｔｖａｌｉｄｉｔｙ）是量表质量的重要体现，某些杂志已要求有关量表编制的论文必须含有内容效度
Ｉ－ＣＶＩｆｏｒｃｈａｎｃｅａｇｒｅｅｍｅｎｔ．Ｓ－ＣＶＩ／ＵＡａｎｄＳ－ＣＶＩ／ＡｖｅａｒｅｂｏｔｈｓｃａｌｅｌｅｖｅｌＣＶｌｗｉｔｈｄｉｆｆｅｒｅｎｔｆｏｒｍｕｌａｓ．ＲｅｓｅａｒｃｈｅｒｓｒｅｃｏｍｍｅｎｄｔｈａｔａｓｃａｌｅｗｉｔｈｅｘｃｅｌｌｅｎｔｃｏｎｔｅｎｔｖａｌｉｄｉｔｙｓｈｏｕｌｄｂｅｃｏｍｐｏｓｅｄｏｆＩ—ＣＶＩｓｏｆ０．７８ｏｒｈｉｇｈｅｒａｎｄＳ－ＣＶＩ／ＵＡａｎｄＳ－ＣＶＩ／Ａｖｅｏｆ０．８ａｎｄ０．９ｏｒｈｉｇｈｅｒ，ｒｅｓｐｅｃｔｉｖｅｌｙ．
然而，两个或多个专家对条目与相应维度的关联性评价一致的意见还可能是由于他们对选项
１５３
的随机选择（即不代表专家的意见）造成的，分析此类数据时，应当对这种随机一致性（ｃｈａｎｃｅａｇｒｅｅｍｅｎｔ）进行校正。Ｐｏｌｉｔ等【２１给出了对随机一致性进行校正，计算调整后的ｋａｐｐａ值（记为Ｋ’）的方法：
个阶段实现：１）量表的制定阶段：包括维度定义、条目产生和量表构建；２）内容效度的评价阶段：其工作思路是请有关专家对量表条目与原定内容范围的吻合程度（相关性）作出判断。第一阶段在很多测量学的文献中已有详述，本文主要讨论第二阶段。
在内容效度的定量评价过程中，通过专家咨询，量表条目对所要测量的内容维度的代表性信息收回后，可以计算一系列的指标来评价内容效度的优劣。这些指标包括：０ｔ系数【３】、ｋａｐｐａ系数‘４１、ｒ＋ⅣＧ值例和内容效度比㈣等。目前，在这类指标中应用最广泛的是由Ｈａｍｂｌｅｔｏｎ和Ｍａｒｔｕｚａ等１７墙】提出和推广的内容效度指数（ｃｏｎｔｅｎｔｖａｌｉｄｉｔｙ
１）随机一致性概率（Ｐｃ）的估计：记ｎ为参评专家人数，Ａ为给予３或４分即认为条目与相应的内容维度相关的专家人数。对某一条目，假设每位专家随机选择相关或不相关，概率均为０．５，按照二项分布的原理，在ｎ名专家中Ａ人均认为相