【心理测量学课件】效度3

合集下载

心理测量学 PPT课件

因此，心理咨询师有必要了解心理测量的理论和技术。
❖
心理测量学知识部分的主要包括的内容有：第1节概述第2节测验的常模第3节测验的信度第4节测验的效度第5节项目分析第6节测验编制的一般程序第7节心理测验的使用
参考书目
❖ 主要依据国家职业资格培训教程的《心理咨询师（基础知识）》考试中的《心理测量知识》部分进行。这本书的主要参考教材有： 1．郑日昌、蔡永红和周益群著，《心理测量学》，人民教育出版社， 1999 2．龚耀先主编，《心理评估》，高等教育出版社，2003 3．姜长青主编，《心理测验学》，吉林教育出版社，2004 4．戴海崎、张锋和陈雪枫主编，《心理与教育测量》，暨南大学出版社，2002 5．顾海根编著，《学校心理测量学》，广西教育出版社，1999 6．宋维真、张瑶主编，《心理测量学》，科学教育出版社，1987 7．彭凯平编著，《心理测验——原理与实践》，华夏出版社，1990
的人数百分比。百分等级55的分数表示在常模，样本中有55%的人低于这个分数。
最早的一个范例是葛塞尔发展程序表（二）智力年龄
比内-西蒙量表中首先使用智力年龄的概念：基础年龄与在较高年龄水平的题目上获得的附加月份之和。计算方法：假如某儿童6岁组的题目全部通过，7岁组通过 4题，8岁组通过3题，9岁组通过2题，其智龄为：6（岁） +42（月）+32（月）+22（月）=6岁+18月=7岁6个月。（三）年级当量
第一节概述
【考查要点】 1．测量的含义； 2．不同的测量量表：命名、顺序、等
距和等比量表； 3．测验观：错误的和正确的； 4．不同的测验种类。
第一单元、测量与测量量表
一、什么是测量 • 测量就是依据一定的法则用数字对事物加以确定。 • 定义中包括三个主要的元素：（1）事物（2）数字

第5章效度_PPT幻灯片

3、经验推测法
这种效度是通过实践来检验效度。如儿童发展量表是否有效，需要经过实践调查。
（三）内容效度的特性表面效度（重点）：是由外行对测
验作表面上的检查确定的，它不反映测验实际测量的东西，只是指测验表面上看来好像是测量所要测的东西。
编制测验时，表面效度需要考虑。
最高行为测验，如智力测验、成就测验，需要较高的表面效度。
第三节影响效度的因素
一、测验本身的因素二、测验实施中的干扰因素（一）主试的影响因素（二）被试的影响因素三、样本团体的性质（一）样本团体的异质性（三）干涉变量四、效标的性质
一、测验本身的因素
如词汇和句型不能过于太难，如低年级小学生，要用拼音和图形来注解。测验取材、测验长度、试题类型、难度、区分度及编排方式等都会影响效度。
• 1、如果某测验的效度系数是0.70，则在测验中无法作出正确预测的比例是（）。
• （A）0.30 • （B）0.51 • （C）0.49 • （D）0.70
• 2、一个测验所测量的与所要测量的心理特点之间符合的程度，指的就是测验的( )。
(A)信度 (B)难度 (C)区分度 (D)效度
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
典型行为测验却要求较低的表面效度，如大多数人格测验，如UPI中的25 题“想轻生”。
二、构想效度
（一）什么是构想效度定义：是指测验能够测量到理论上的构
想或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。
建立构想效度的三步

心理测量学知识ppt课件

调查法
总结词
通过问卷、访谈等方式收集大量样本的数据，以描述心理现象的分布和特点。
VS
详细描述
调查法是心理测量学中常用的研究方法之一，通过问卷、访谈等方式收集大量样本的数据，以描述心理现象的分布和特点。调查法可以覆盖大范围的样本，具有较高的代表性，能够揭示心理现象的普遍规律和趋势。
个案研究法
信度与效度
信度的定义
信度是指测验的一致性程度，即多次测量结果之间的稳定性。
效度的定义
效度是指测验的有效性程度，即测验是否真实地反映了想要测量的心理特质或行为。
信度与效度的关系
信度和效度是评估心理测验质量的两个重要指标，信度是效度的必要条件，但效度更高的测验不一定信度更高。
因素分析
因素分析的定义
根据研究和实践反馈，不断更新和改进心理测量学的理论和方法。
THANKS
感谢观看
03
心理测量学的应用领域
教育领域
01 学科能力评估
通过心理测量技术评估学生的学习能力、学科掌 Байду номын сангаас程度，为个性化教学提供依据。
02 人才选拔
运用心理测量工具对学生的学习潜力、天赋等进行评估，选拔优秀学生。
03 教育质量监测
通过心理测量手段评估教育质量，为教育改革提供数据支持。
职业领域
职业能力评估
心理测量学的重要性
提供科学依据
心理测量学通过客观的评估方法，为心理学研究提供科学依据，帮助揭示人类行为的规律和机制。
促进个体发展
心理测量学在教育领域的应用，有助于了解学生的能力、兴趣和潜力，为个性化教育和人才培养提供指导。
辅助决策制定
在职业领域，心理测量学可以为招聘、选拔和晋升提供参考依据，帮助组织制定科学的人力资源政策。

第五章测量效度_PPT幻灯片

第五章测量效度
第二节效度的估计
二、实证效度（一）实证效度的含义、种类及作用 2 实证效度的种类和作用预测效度表达的是测验与将来进行的效标之间的
效度关系。预测效度用于预测某个个体将来的行为。
第五章测量效度
第二节效度的估计
二、实证效度（一）实证效度的含义、种类及作用
2 实证效度的种类和作用 “某人具有这种能力吗？” “某人会有这种能
反映。 3 判断一个测量是否有效要从多方面收集证
据
第五章测量效度
第一节效度概述
（二）效度的数学定义及其基本原理
回顾前面介绍的CTT的内容：一组测验分数的总变异(S2X)包括三部分：真实的（稳定的）、与测量目的有关的变
异(S2V) 真实的、但出自无关来源的变异(S2I) 随机误差的变异(S2E)
第二节效度的估计
一、内容效度（二）内容效度的确定方法 2 内容效度的统计分析方法： Cronbach提出，两测验的相关法 3再测法：
处理后的重测法
第五章测量效度
第二节效度的估计
二、实证效度（一）实证效度的含义、种类及作用 1 含义：实证效度是指一个测验对处于特定情境
中的个体的行为进行估计的有效性。即以实践的效果来作为检验标准，所以也叫效标关联效度。
联效度，是指一个测验实际测到的内容与所要测量的内容之间的吻合程度，也即测验项目在多大程度上表示了所要测定的特征范畴。
如，如果要从一批待业人员中挑选机床工，所用的测验项目就应该能表明机床操作能力的范畴。
第五章测量效度
第二节效度的估计
一、内容效度
（一）含义及应用范围
2 内容效度通常包括欲测的知识范围，以及该范围内各知识点所要求掌握的程度两个方面。一般以双向细目表的形式呈现。

《心理测量学》课件

2 发展深度学习
引入人工智能等新技术，进行更为智能、精准的测量，推动测量新模式、新机理。
3 发展互联网应用
通过互联网和移动端的应用，创新心理测量的方式和手段。
心理测量的分类
智力测量
评估个体在思维能力、学习能力、问题解决等方面的表现。
人格测量
评估个体的人格特质、兴趣爱好、价值观念等方面的表现。
心理病理测量
评估个体心理健康状态变化及其带来的影响。
行为测量
评估个体行为的反应、倾向及发展趋势等。
心理测量的标准化
1
效度
2
测量结果应当反映所要测量特质的真
实状态。
3
可靠性
测量结果应当具有一致性和重复性，避免误差。
标准化
使测量结果具有普遍性、可比性和解释性，加强心理测量的可靠度和效度。
心理测量的误差
标准差误差
由于个体差异、试题设计等原因，测量数据出现偏差。
反应偏误
测量误差
由于受试者对试题的个人喜好、态度、心理因素等的影响而引起的偏误。
由于测量工具、环境、测量人员等原因，测量数据出现误差。
心理测量的应用
领域军事教育临床社会
主要应用选拔军人、评估战斗员能力、分析战场信息等。
学生成绩评估、选材、选专业、升学考试、招生等方面。诊断、评估、治疗、康复的辅助手段。评估社会人员各类能力、洞察社会现象变化等。
心理测量的未来发展趋势
1 发展数据挖掘
以大数据、云计算为基础，实现信息多源整合，更好地挖掘隐含知识。
《心理测量学》PPT课件
心理测量学是一门研究将心理可观测特性转化为数值形式并进行量化分析的学科。
心理测量的历史
1

心理测量学(详细)PPT课件

（二）教学目的通过学习，要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好
测量所要求具备的基本条件。更重要的是，通过本课程的学习要使学生熟练掌握不同心理测量的实际应用。
（三）教学内容本课程的主要教学内容有：心理测量的基本内涵及其评价和测量的一般步骤和方
法两部分。内容涉及一般测量解析，测量的要素及量表类型，测验信、效度、难度和区分度，测量的一般步骤和方法，智力测验、人格测验等心理测验，以及心理测量的综合应用和心理测量理论的新发展等内容。
6
第二章经典测验理论的基本假设
教学要点：通过本章的学习，掌握经典测验理论的基本假设，心里特之及其特性，
心里测量的误差和种类，以及真分数的含义等内容。教学时数：[6学时]
教学内容：一、心理特质（Trait）及其可测性假设
1．经典测验(Classical Test Theory ,CTT)理论 2．特质假设
3
二、测量的要素及量表类型 1．测量的要素识记：单位（Unit），参照点(Reference Point)，量表(Scale) 2．量表类型（1）称名量表称名变量只说明某一事物与其他事物在名称、类别或属性上的不同，并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。（2）顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量，具有等级性和次序性的特点。（3）等距变量等距变量除能表明量的相对大小外，还具有相等的单位。（4）比率变量比率变量除了具有量的大小、相等单位外，还有绝对零点。
5
（五）心理测量的道德准则 1．心理测量工作者的素质要求（1）心理测量工作的知识结构.（2）对心理测量的态度 2．心理测量工作者的道德准则（1）测验的保密和控制原则（2）测验中个人隐私的保护

第五章测量效度 ppt课件

（2）效标的特性
a.多样性：一个测验可能有不同的观念效标，同一个观念效标又可能有不同的效标测量。
b.复杂性：几乎每一种效标行为都由多种特质构成，包含复杂的成分。
c.特殊性：即使一个普通的效标，在应用时也有特殊性。
d.时间性：近期效标与最后效标
（3）效标测量的条件
a.有效性：效标测量能真正反映观念效标。 b.可靠性：有较高的信度 c.客观性：效标测量必须能真正反映观念效标，防止效标污染。效标污染（criterion contamination）是指评定者知道被试的测验分数，因而影响到对效标的客观评定。
2．效标（1）效标与效标测量
效标（criterion）就是衡量一个测验是否有效的外在标准，独立于测验并可以从实践中直接获得我们所感兴趣的行为。
常用的效标：学业成就、临床诊断、实际工作表现、特殊训练成绩、不同团体的总体表现、先前有效的测验、等级评定。
观念效标：理论定义，如“大学的成功” 效标测量：操作定义，如“大学成绩”
dcbabcpct失误命中命中20216713结构效度结构效度含义特点与应用范围含义特点与应用范围结构效度结构效度structurevaliditystructurevalidity是指一个测验实际测到所要测是指一个测验实际测到所要测量的理论结构或特质的程度或者说测验分数能够说明心理学理量的理论结构或特质的程度或者说测验分数能够说明心理学理论的某种结构或特质的程度论的某种结构或特质的程度构思或结构是指心理学理论所涉及
（2）测验之间寻找证据法
a.相容效度法：新老测验之间的相关（两测验测的是同一心理特质）。若相关高，则说明新测验可能有较高的效度。
b.区分效度法：新老测验之间的相关（两测验测的不是同一心理特质），若相关低，则说明新测验可能有较高的效度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

效度：决策的应用Validity for Decisions1.实证效度2.效标3.实证效度的确定4.实证效度的运用1.1实证效度一个测验对处于特定情境中的个体行为进行估计的有效性。

实证效度又称效标关联效度（criterion-related validity）•定义–测验分数用于预测的正确性–测验得分与决策结果（效标）之间的关系强度1.2Criterion-related validity •两种：concurrent & predictive•同时效度：测验分数与效标资料同时收集test scores -criterion psycho diagnostic test -psychiatric diagnosis1.3预测效度（predictive validation）•先获得测验分数，隔一段时间后，再收集效标资料test scores----criterion(months )(years ) entrance exam-----college grades1.4效度系数的解读•r ：与效标的关系•很难达到较高水平[.60]•R 2 (Multiple Correlation )：是效标变量和多个最佳预测因子的相关；即效标方差由测验所决定的部分–Y ’=b 1X 1+ b 2X 2+ ……+ a–z Y =B 1z 1+ B 2z 2+ …..2 效标与效标测量•效标（criterion）就是衡量一个测验是否有效的外在标准，简称效标。

Ex: Interest tests criterionsatisfactionsuccess•观念效标：理论定义，如“大学的成功”•效标测量：操作定义，如大学成绩2.1效标的特性•多样性•复杂性•特殊性•时间性2.2Characteristic of a Good Criterion •明确性•有效性•可靠性•实用性•客观性2.3效标污染Criterion Contamination•from test ex. 生活质量（1）生活压力事件（2）标准（+2）与测验（1）一致•from expert’s ratingKnowledge of test scoresrating on criterion2.4常用的效标•学业成就•临床诊断•实际工作表现•特殊训练成绩•不同团体的总体表现•先前有效的测验•等级评定3.1 确定效标关联效度的步骤•1.选择恰当的效标及其测量方法•2. 确定恰当的被试样本•3. 实测测验并计分•4. 搜集效标数据•5. 确定测验分数和效标之间的相关r xy3.2实证效度的确定方法•１）相关法–测验分数与效标测量之间的相关系数。

•２）区分法–测验→工作→效标测量（工作成绩）–按工作成绩分高低两组，如工作成绩高低，测验得分高低一致，说明该测验有效度３）命中率工作表现测验成绩合格不合格合格A C不合格B D总命中率=（A+D）/（A+B+C+D）正命中率=A/（A+C）3.2实证效度的确定方法•４）功利率–使用测验所需费用和所得收益进行比较，是否利大于弊4 效度的应用-回归预测regression equationY : job success 7 -point scale supervisor X : employment T 0 -100Y= 0.07X+0.2ex. X=55 X=33Y=0.07(55)+0.2 Y=0.07(33)+0.2Y=4.05 Y=2.51YX -X s s r Y s s r X Y X s s r Y X b Y a s s r b a X b y xy ^xy x y ^xy xy ^+⋅⋅=⋅⋅-+⋅⋅=-=⋅=+⋅=）（y)x x (s s r y xy xy ^+-•=•高中英语与大学入学考试的平均分为92.59和64.18，标准差分别是21.01和11.03，两次考试之间的相关为0.86。

如果某生高中成绩为114分，那么入学考试可能得多少？4.2 决策理论与效度的应用•Decision theory–分析决策效果的数量化方法，用于选拔、诊断•术语–击中（Hit）–虚报（False Positive）–漏报（False Negative ）Percentage of Hits, False Positives andNegatives Affected by:•受以下因素影响：–test validity–基础率（Base rate ，BR ）: 50%applicantstotal successes potential BR #•录取率（Selection ratio ，SR)——划界分applicantspositions or selected SR #)#(#e.g., if 4 people apply for 1 position, SR = 1/4 = .25if 4 people apply for 4 positions, SR = 4/4 = 111251211252412633213524114692152231211测验分数工作成绩2238733•效度？P(FP) = SR –P(TP)P(FN) = BR –P(TP)P(TN) = 1 –P(TP) –P(FP) –P(FN))1()1()(SR SR BR BR r SR BR TP P xy --+⨯=•P (TP) = BR x SR•BR = .5 SR = .5,•25% of the decisions made at random will be TPs•validity=0 .4•P (TP) = .35; P (FP) = .15; P (FN) = .15; P (TN) = .35.•70% decision will be correct.Taylor ＆Russell, 1939Example: hire 40/100 people (SR = .40) on the basis of a test with a validity of .70 for a job with a BR of 50%DecisionPerformance Accept Reject TotalSuccess True Positives(CorrectAccepts)FalseNegatives(Incorrectrejections)50Failure False Positives(IncorrectAccepts)TrueNegatives(correctrejections)50Total 40 60 100Taylor-Russell Table: Expected Proportion of Successful Selections (for a Base Rate = .50)Selection RatioValidity .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .00 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .10 .58 .57 .56 .55 .54 .53 .53 .52 .51 .51 .50 .20 .67 .64 .61 .59 .58 .56 .55 .53 .53 .52 .51 .30 .74 .71 .67 .64 .62 .60 .58 .56 .54 .52 .51 .40 .82 .78 .73 .69 .66 .63 .61 .58 .56 .53 .52 .50 .88 .84 .78 .74 .70 .67 .63 .60 .57 .54 .52 .60 .94 .90 .84 .79 .75 .70 .66 .62 .59 .54 .52 .70 .98 .95 .90 .85 .80 .75 .70 .65 .60 .55 .53 .80 1.00 .99 .95 .90 .85 .80 .73 .67 .61 .55 .53 .90 1.00 1.00 .99 .97 .92 .86 .78 .70 .62 .56 .53 1.00 1.00 1.00 1.00 1.00 1.00 1.00 .83 .71 .63 .56 .53Source: Adapted from H. C. Taylor and J. T. Russell (1939), The Relationship of Validity Coefficients to the PracticalEffectiveness of Tests in Selection: Discussion and Tables, Journal of Applied Psychology, 23, 565-578.Example: SR = .40 with a validity of .70 BR of 50%DecisionPerformance Accept Reject TotalSuccess True Positives(Correct Accepts).80 or.80x40 = 32peopleFalse Negatives(Incorrectrejections)18 people or18/60 = .3050Failure False Positives(IncorrectAccepts)8 people or8/40 = .20True Negatives(correctrejections)42 people or42/60 = .7050Total 40 60 100Contrast: Test validity = .20(SR = 40/100; BR of 50%)DecisionPerformance Accept Reject TotalSuccess True Positives(Correct Accepts).58.58x40 = 23peopleFalse Negatives(Incorrectrejections)27 people or27/60 = .4550Failure False Positives(IncorrectAccepts)17 people or17/40 = .42True Negatives(correctrejections)33 people or33/60 = .5550Total 40 60 100Taylor-Russell Table: Expected Proportion of Successful Selections (for a Base Rate = .50)Selection RatioValidity .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .00 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .10 .58 .57 .56 .55 .54 .53 .53 .52 .51 .51 .50 .20 .67 .64 .61 .59 .58 .56 .55 .53 .53 .52 .51 .30 .74 .71 .67 .64 .62 .60 .58 .56 .54 .52 .51 .40 .82 .78 .73 .69 .66 .63 .61 .58 .56 .53 .52 .50 .88 .84 .78 .74 .70 .67 .63 .60 .57 .54 .52 .60 .94 .90 .84 .79 .75 .70 .66 .62 .59 .54 .52 .70 .98 .95 .90 .85 .80 .75 .70 .65 .60 .55 .53 .80 1.00 .99 .95 .90 .85 .80 .73 .67 .61 .55 .53 .90 1.00 1.00 .99 .97 .92 .86 .78 .70 .62 .56 .53 1.00 1.00 1.00 1.00 1.00 1.00 1.00 .83 .71 .63 .56 .53Taylor-Russell Table: Expected Proportion of Successful Selections (for a Base Rate = .50)Selection RatioValidity .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .00 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .10 .58 .57 .56 .55 .54 .53 .53 .52 .51 .51 .50 .20 .67 .64 .61 .59 .58 .56 .55 .53 .53 .52 .51 .30 .74 .71 .67 .64 .62 .60 .58 .56 .54 .52 .51 .40 .82 .78 .73 .69 .66 .63 .61 .58 .56 .53 .52 .50 .88 .84 .78 .74 .70 .67 .63 .60 .57 .54 .52 .60 .94 .90 .84 .79 .75 .70 .66 .62 .59 .54 .52 .70 .98 .95 .90 .85 .80 .75 .70 .65 .60 .55 .53 .80 1.00 .99 .95 .90 .85 .80 .73 .67 .61 .55 .53 .90 1.00 1.00 .99 .97 .92 .86 .78 .70 .62 .56 .53 1.00 1.00 1.00 1.00 1.00 1.00 1.00 .83 .71 .63 .56 .53. Taylor-Russell Table: Expected Proportion of Successful Selections (for a Base Rate = .50)Selection RatioValidity .05 .10 .20 .30 .40 .50 .60 .70 .80 .90 .95 .00 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .50 .10 .58 .57 .56 .55 .54 .53 .53 .52 .51 .51 .50 .20 .67 .64 .61 .59 .58 .56 .55 .53 .53 .52 .51 .30 .74 .71 .67 .64 .62 .60 .58 .56 .54 .52 .51 .40 .82 .78 .73 .69 .66 .63 .61 .58 .56 .53 .52 .50 .88 .84 .78 .74 .70 .67 .63 .60 .57 .54 .52 .60 .94 .90 .84 .79 .75 .70 .66 .62 .59 .54 .52 .70 .98 .95 .90 .85 .80 .75 .70 .65 .60 .55 .53 .80 1.00 .99 .95 .90 .85 .80 .73 .67 .61 .55 .53 .90 1.00 1.00 .99 .97 .92 .86 .78 .70 .62 .56 .53 1.00 1.00 1.00 1.00 1.00 1.00 1.00 .83 .71 .63 .56 .53Construct and predictionPredictorConstruct Cognitive abilityCriterionConstruct Job performancePredictorMeasureWonderlic Personnel TestCriterionMeasurePerformancerating Measurement level Construct level。