04测验的项目分析

合集下载

02经典测验理论--信效度+项目分析

度
适用范围：二分法计分的测验。
第二节信度评估的方法
3.克伦巴赫系数
测
验
α=
KK－1［1－
∑ Si2
Sx2
］
的
Si2:某项目分数的方差 SX2:测验总分的方差
信
说明：适用多重记分（1～n）的测验。
度
当k=2时，α 系数与分半效度估计等价。
第二节信度评估的方法
五、评分者信度
测
多位评分者对随机抽取的若干份测验卷按评

（3.3）
于是公式（3.2）可以改写为：

（3.4）
因此，一次测验中，一个团体的实测分数之间的变异性是由与目的有关的变异数（）、与测量目的无
关的变异数（），和测量误差变异数（）所
决定的。
对经典测验理论的评价
优点
以真分数模型为理论框架，使用少量的定义，依据弱假设（或弱势假设）形成。
验
1.信度系数最常用
指同一被试样本所测得的两组资料的相关系
的数。理论上，是真分数方差与实得分数的方差的
信比值。度
xx
ST2
S
2 X
（ 0≤rxx≤1）
第一节信度的概念
2.信度指数
测
真分数标准差与实得分数的标准差的比值称
验信度指数。它是信度系数的平方根。
的
rXT =
ST SX
=
rxx
两次施测期间被试的学习效果没有差别。
第二节信度评估的方法
二、复本信度等值性系数
测
以两个等值但题目不同的测验（复本）来测
验
量同一群体，然后求得被试者在两个测验上得分的相关系数。

《成本与管理会计》小测验及答案04第四章本量利分析小测验

小测验（单项选择题）1.本量利分析是分析（）在产品的销量、售价和单位变动成本或固定成本变动时的性态以及它们之间的关系。

A.总收入和总成本B.总收入、总成本和营业利润C.总收入、总成本、营业利润和现金流D.总收入2.本量利分析中的保本点销售量在数值上等于（）。

A. 固定成本除以总收入B. 固定成本除以单位贡献毛益C. 收入减变动成本D. 总收入除以变动成本3.对于经营杠杆较低的公司，下列说法正确的是（）。

A.固定成本高，变动成本低B.销量的变动幅度大于净利润的变动幅度C.亏损的可能性比高杠杆公司更大D.相对于高杠杆公司经营风险较低4.下列关于固定成本的说法中，正确的是（）。

A.长期来看可以视为变动成本B.会降低经营杠杆C.会降低亏损的风险D.在图表中是一条斜线5.如果产品组合中各产品销售比例发生变化，则（）。

A.净利润不会改变B.保本点会变化C.每种产品的单位贡献毛益会上升D.每种产品的单位贡献毛益会下降6. 生产单一品种产品的企业，保本销售额等于（）。

A.保本销售量×单位利润B.固定成本总额/贡献毛益率C.固定成本总额/（单价一单位变动成本）D.固定成本总额/单位贡献毛益7.从本量利分析图上可知，对单一产品分析时，（）。

A.单位变动成本越大，总成本线斜率越大，保本点越高B.单位变动成本越大，总成本线斜率越小，保本点越高C.单位变动成本越小，总成本线斜率越小，保本点越高D.单位变动成本越小，总成本线斜率越大，保本点越低8.产品的单价与单位变动成本上升的百分率相同，其他条件不变，则保本销售量（）。

A.上升B.下降C.不变D.不确定9.运动器材公司威尔公司只生产一种篮球，单价60元，单位变动生产成本40元，单位销售管理费用5元，销量为50000件，则其产品贡献毛益为（）元。

A.650000B.750000C.850000D.95000010.艾马妮公司生产钱包，单价40元，固定成本为40000元，变动成本占销售单价的75%，在预计销量为5000件时，艾马妮公司的安全边际是（）元。

第六章测验的项目分析

难度区分度猜测问题多选题的项目分析
• 信度和效度分析是对测验质量的整体评价。 • 项目分析是对测验中每一个测题的质量进行的分析。 • 项目分析的目的是通过分析改进项目统计量进而提高测验的信度和效度。 • 项目分析包括分析质的分析和量的分析。
第一节项目的难度
一、难度的意义
• 难度一般是指测验项目的难度，当然也可指一个测验的难度。后者是其所包含的所有测题难度的综合指标。我们这里所讲的是项目的难度。 • 从心理学角度看，难度是被试在作答项目时心智操作感到的难易程度。
• 提出者 – 美国测验学家：伊贝尔（L. Ebel）
测题鉴别指数与评价标准
区分度（D） 0.40以上 0.30－0.39 评价
非常良好良好，如能改进则更佳
0.20－0.29
0.19以下
尚可，仍需再改进
劣，必须淘汰或加以修改
极端组的划分
• 高低组的比率介于25%---33% • 标准化测验采用27% • 样本人数过少时，可以用50%作为分界点。 • 此方法只利用了一部分信息，精确性差一些。
（二）非0、1记分项目
X P X max
某题的平均得分
该题的满分值
例4-4：某试卷中一论述题为20分，10 名参加测验者得分为 10、18、14、8、 18、3、14、10、 9、8。试问该题的难度是多少？
112 X 11 .2 10 11 .2 P 0.56 20
• 2、极端分组法
三、区分度与难度的关系
• 难度是区分度的必要条件
– 难度愈接近.50，试题区别作用愈大。 – 较难项目，对高水平被试区分能力高 – 较易项目，对低水平被试区分能力高
– 中等项目，对中等水平被试区分能力高

心理测量试题

心理测量试题（98，00-05，07）一九九八年下半年北京市高等教育自学考试心理测量试卷一、判断题（正确的在题后括号内划“√”错误的划“Х”。

每小题1分，共10分）1、内容效度没有数量化的指标，有的只是一些理论推理和判断。

（）2、评估项目好坏最方便的方法，以被试者答对或通过每个项目的百分数来估计。

（）3、建立良好的主、被试协调关系，可以控制主被试交互作用引起的误差。

（）4、赖斯是标准化成就测验的始创者。

（）5、临床观察和记录不能作为测验题目的来源。

（）6、16PF是采用理论推演法编制的人格问卷。

（）7、能力区分量表（DAS）适用于2岁半——5岁11个月。

（）8、常模样本数目选择要看总体的数目，一般而言，要是全国性的常模，一般要求200-300人为宜。

（）9、在其他条件均等的条件下，测验越长，信度越高。

（）10、武德沃斯设计的“个人资料调查表”是智力测验。

（）二、单项选择题（在每小题的四个备选答案中选出一个正确的答案，并将正确答案的号码填在题干后的括号内。

每小题1分，共10分）1．在某次测验中，小张的得分为90分，在班上的百分等级是85，那么，在全班同学中有百分之几的人得分比小张低？（）A．10 B.15 C.85 D.902.根据多年的研究结果,一般的能力测验和成就测验的信度系数都在( )以上.A.0.90B.0.80C.0.70D.0.603.在测验题目合成和编排时,可以下考虑( )A.长度B.难度C.顺序D.上述都不对4.一般不受应试技巧与练习影响的测验有( )A.成就测验B.智力测验C.人格测验D.认知能力测验5.当那些未经过训练的被试或测验应和者认为某测验是有效的测验时,该测验具有( )A.内容效度B.构思效度C.表面效度D.效标效度6.一般能力倾向测验GATB共包括( )A.11个分测验B.12个分测验13个分测验 D.14个分测验7.( )可用于对儿童学习障碍的测评.( )A.考夫曼教育成就.B.格雷伏斯C.加州心理量表D.发展程序表8.项目鉴别力以P=?为高( )A.P=1.0B.P=0.90C.P=0.50D.P=0.309.总加评定法是由( )于1932年所设计的.( )A.荷兰德B.里克特C.艾森克D.史特明10.下列哪种方法下属于主体测验?( )A.会谈B.Q-分类C.语句完成测验D.语义区分测验三、多项选择题（在每小题的五个备选答案中，选出二至五个正确的答案，并将其号码分别填在题干后的括号内，多选、少选、错选均无分。

心理学研究方法04(附参考答案)

心理学研究方法2004(附参考答案)2004年北京师范大学心理学院研究生入学考试试题心理学研究方法一、填空题1．算术平均数的所用是描述了一组数据的____。

2．在正态分布中，标准差为______时百分等级数为_____。

3．误差包括随机误差和___，他会影响___。

4．在选择题中，增加题目数量会影响____。

二、1．什么是速度测验和难度测验？两者的区别是什么？2．有人说：“t检验适用于样本容量小于30的情况。

Z检验适用于大样本检验”，谈谈你对此的看法。

3．简述两个你所了解的测验名称及其用途。

4．学业考试成绩为x，智力测验分数为y，已知这两者的rxy=，IQ=100+15z，某学校根据学业考试成绩录取学生，录取率为15%，若一个智商为115的学生问你他被录取的可能性为多少，你如何回答他？5．如果两总体中的所有个体都进行了智力测验，这两个总体智商的平均数差异是否还需要统计检验？为什么?6．选择统计检验程序的方法时要考虑哪些条件，才能正确应用统计检验方法分析问题？7．哪些测量和统计的原因会导致两个变量之间的相关程度被低估？8．举例阐述信号监测论在测量感受性方面的优势及其应用领域。

9．视觉试验的额外变量有哪些？如何有效的控制这些变量？10．简述反应时测量技术的基本思想及其在心理学实验研究中的应用。

三、1．传统心理物理实验方法测量感受性时会产生哪些方面的误差。

请分析可能影响获得可靠数据的因素即可采取的措施。

2．举例阐述在一个2[组间]*3[组内]的混合实验中采用哪些统计方法对两个因素的数据变化趋势、因素的主效应、交互作用进行详细和深入的分析？如果交互作用显著，应如何进行进一步的分析，并对统计结果进行解释。

3．什么是常模参照测验和标准参照测验？比较其异同，并举例说明。

参考答案2004年北京师范大学心理学院研究生入学考试试题心理学研究方法一、填空题1．算术平均数的所用是描述了一组数据的______。

2．在正态分布中，标准差为______时百分等级数为16。

心理测量4项目分析

.40
.39
.35
.34
.33
.34
.36
.34
.31
.30
.27
.26
.24
.62
.57
.54
.56
.50
.51
.53
.57
.51
.52
.50
.49
.44
.51
.31
.28
.25
.27
.20
.21
.20
.56
.57
.49
.49
.44
.44
.40
.71
.65
.64
.60
.52
.52
.52
.77
.64
– 在人格测验中，类似的指标是“通俗性”。即取自相同总体样本中，能在答案方向上回答该题的人数。
– 两种指标的计算方法是相同的
– 难度的计算 • 二分法记分的项目（1、0记分） – 公式（通过率）：P=R／N×100% »P 指项目的难度（通过率） »R 答对或通过该项目的人数 »N 全体被试人数
– 区分度与难度呈现的是一种曲线（倒“U”的关系）。
• 难度为0.5时，区分度最高 • 难度较高或较低时，区分度中等 • 非常高或非常低的难度时，区分度也很低
– 不同水平被试中区分度与难度的关系
• 较难的题目对高水平被试有较高的区分度 • 中等难度的题目对中水平被试有较高的区分度 • 较容易的题目对低水平被试有较高的区分度
举例：第一题10名被试中8人答对，其难度为：
P1=8／10×100% =80%
• 样本例数较大时的计算方法 – 根据测验总成绩将被试分为三组 » 高分组（NH）：分数最高的27％ » 中间组：分数居中的46％ » 低分组（NL）：分数最低的27％ – 计算高分和低分组的通过率 – 计算两组平均通过率作为难度指标公式：P=(PH+PL)／2 » P 指难度（通过率） » PH 指高分组通过率 » PL 指低分组通过率

四种类型性格测试及结果分析

四种类型性格测试及结果分析性格测试是一种帮助人们了解自己性格特点的工具，可以提供有关个人兴趣、价值观和行为偏好的信息。

通过参与性格测试，人们可以更好地认识自己，发现自己的优势和劣势，并找到适合自己的职业和生活方式。

本文将介绍四种常见的性格测试及其结果分析，分别是Myers-Briggs Type Indicator (MBTI) 测验、Big Five 人格特质测验、DISC 行为风格测验和Enneagram 九型人格测验。

1. Myers-Briggs Type Indicator (MBTI) 测验MBTI测验是目前最为广泛应用的性格测试之一，通过测量人们在四个维度上的特点来确定其性格类型。

这四个维度分别是：- 内向 (I) vs 外向 (E)- 感觉 (S) vs 直觉 (N)- 思考 (T) vs 情感 (F)- 判断 (J) vs 知觉 (P)根据这四个维度，MBTI测验将人们分为16种不同的类型，如ISTJ、ENFP等。

每种类型都有自己的特点和倾向。

MBTI测验的结果可以帮助人们更好地了解自己的决策方式、信息获取方式、人际交往方式等。

例如，ISTJ(内向-感觉-思考-判断)类型的人通常更加注重细节、有条理且守时，适合从事需要组织能力和执行力的工作。

2. Big Five 人格特质测验Big Five 人格特质测验是另一种经典的性格测试方法，将人的性格特征分为五个维度：- 外向性 (Extraversion)- 宜人性 (Agreeableness)- 责任心 (Conscientiousness)- 情绪稳定性 (Emotional Stability)- 开放性 (Openness to Experience)每个维度都包含了相应的子特质。

通过对这五个维度的测量，人们可以了解自己在各个维度上的得分，从而得出相应的性格类型。

这种测验的结果可以帮助人们了解自己的社交倾向、忍耐度、干练程度等，有助于职业发展和个人成长。

90项症状评定量表结果分析

1、测验1为90项症状评定量表的结果
（1）SCL-90总分为90个项目评分之和，反映病情严重程度，其变化能反映病情演变。

总均分和因子分分值的意义。

1-2：提示心理健康/无对应的因子症状。

2-3：提示亚健康心理状态/有对应因子表现的轻度症状。

3-4：提示有心理健康问题/有对应因子表现的中度症状。

4-5：提示有严重心理健康问题/有对应因子表现的重度症状。

（2）该测验的结果与分析如下：
①SCL-90总均分2.1提示亚健康。

②SCL抑郁因子分3.3提示大部分时间有抑郁症状。

③SCL焦虑因子分2.3提示有时有焦虑症状。

④SCL其他因子分4.4提示抑郁症状重度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

上一页
下一页
难度对测验结果的影响
思考与练习二：
下面五套测验测量的都是同一种心理属性，题目数量一样，记分方法一样。从理论上讲，下面哪套测验的鉴别力最好？（）测验A：题目的难度均在 0.4~0.6之间测验B：题目的难度均匀地分布在 0.2~0.8之间测验C：绝大数题目的难度都在 0.2以下测验D：绝大数题目的难度都在 0.8以上测验E：题目的难度集中在 0.2 与 0.8两端。
难度对测验结果的影响
上一页下一页
题目的难度分布对测验分数分布的影响？
A:题目难度在0.25~0.75间均匀分布扁平的对称分布(多数测验的追求) B:题目的难度大都＞0.80 负偏态分布。哪类测验希望这样? A B C D
C:题目的难度大都＜0.20 正偏态分布。哪类测验希望这样?
D:题目间相关都很低，难度在0.50左右分数：尖峰的对称分布(不希望的) E:题目间高度相关，题目难度相近，分数：双峰或多峰分布(不希望的)
上一页下一页
2.多级评分项目的难度计算（公式见下页）
这类题目题目的评分有三个以上分值。在能力测验中，这类题目可以根据被试的答案与标准答案的接近程度，评定出多个分值。如：测验中的名词解释、简答、论述、案例分析、作文、列举等题目在非能力测验中，这类项目一般有多个程度(或层次) 不同的答案选项，根据选项的程度(或层次)，评定相应的分值。例如：我喜欢可以拆开的玩具： A.完全符合、B.部分符合、C.完全不符合我的思想似乎：A.走在了时代前面；B.一般；C.比较保守
多级评分题: D =
5) 将计算出的鉴别指数与评价标准比较，筛选试题。
上一页下一页
计算方法目录
项目区分度统计方法：点二列相关
适合分析二级评分题与测验总分、多级效标变量的相关。
r pb
X p Xq St
pq
Xp 为题目答对者的测验总分(或效标)均分 Xq 为题目答错者的测验总分(或效标)均分 St 为全体测试对象的测验总分(或效标)的标准差 p 为题目答对者的比率，p 为题目答错者的比率 rpb 与积差相关的计算结果基本相同,可用积差相关代替
上一页下一页
难度的计算
(三)测验难度对测验结果的影响
1.对测验分数分布形态影响 2.对测验信度的影响 3.对测验鉴别和区分能力的影响
上一页
下一页
难度分析
1.测验难度对测验分数分布形态的影响
如果测验项目是同质的，项目间相关在0.25~0.70间，那么题目难度在0.25~0.75间均匀分布，测验难度适中时，测验分数会出现什么情况？（如下页图例A）扁平的、近似正态的对称分布，分数的离散程度较大。题目难度大多在0.80以上，测验难度较小时，测验分数的分布会出现什么情况？（如下页图B）负偏态分布：高分偏多且较接近，低分少且较分散题目难度大多在0.20以下，测验难度较大时，测验分数的分布会出现什么情况？（如下页图C）正偏态分布：低分偏多且较接近，高分少且较分散艾伯尔的实验研究
以测验总分为标准，估算区分度、筛选题目，可以提高测验的内部一致性和信度。以效标为标准，可以提高测验的准则关联效度。
区分度的统计指标：鉴别指数、相关系数鉴别指数、相关系数系数越大，区分度越好。
上一页
下一页
区分度分析
(二)项目区分度的计算与分析
研究者提出了50多种统计方法。常用的统计方法和指标有：
上一页
下一页
(四)测验题目难度分布的要求
测验题目的难度分布：是指各种难度的题目数量在题目总数中所占比率的情况。确定项目的难度分布，要考虑两个重要因素：测验目的和项目间的相关程度
测验目的和任务不同，对题目的难度要求也不同；项目间的相关越高，项目的难度分布范围应越广。
不同类别测验对题目难度的要求：目标参照测验针对普通群体的常模参照测验选拔性测验针对少数特殊群体的标准化测验
上一页下一页
一、项目分析的目的和任务
项目分析？就是根据具有代表性的被试样本的测验数据，对每个题目进行质量分析。主要包括：项目的难度分析项目的区分度分析项目间的相关分析项目的答案选项分析目的和任务？
对测验题目进行筛选、修订，保留质量较好的题目，删除品质较差的题目，以保证测验的效度、鉴别力和信度。
上一页下一页
难度分布要求
选拔性（或筛选）测验：难度要求
测验目的：选拔或筛选出某方面能力水平较高（或较低）的少数人。测验题目的难度：应向选拔率（筛选率）方向靠近。思考与练习：如果要从2000人的总体中选拔出能力水平较高的100人，并进一步区分其能力水平高低，那么测验题目的难度多大比较合适？选拔率：100/2000 = 0.05 题目难度系数：0.3或0.2以下使测验分数分布为：正偏态
上一页下一页
难度分布要求
三、项目的区分度(鉴别力)分析
(一)什么是测验项目的区分度 (二)如何计算和分析项目的区分度 (三)测验的区分度与信度的关系
(四)项目的区分度与难度的关系
上一页
下一页
(一)什么项目的区分度(discrimination)
也称鉴别力，是指测验题目在测验所要测量的心理特性上，对被试差异的区分程度或鉴别能力。判断项目区分度的好差，主要是考察题目得分与测验总分或效标的一致性程度。
当测试人数非常多，而对难度的精确度要求不高时，可以采用面步骤和方法计算题目的难度系数：
1.可将被试按总分高低排列，然后取得分最高的27% 作为高分组，取得分最低的27%的被试作为低分组。 2.分别计算题目对于两组被试的难度系数： PH 和 PL （ PH 和 PL的计算方法？） 3.根据下面公式，计算题目对于被试总体的难度系数：
上一页下一页
难度分析
目标参照测验：难度分布
测验目的：判断教学目标是否实现题目难度要求：以教学目标的要求为标准，即：教学计划和目标要求学生形成什么样的心理品质和行为表现、能解决什么样的问题，就编制相应的问题情境、评定项目。例如，
课程要求学生能对一个测验的信度作出估计和评价，就可编制这样的题目：列出一组被试在某测验中的各题得分，要求学生计算出信度系数，并对该信度水平作出好差评价。
上一页下一页
二、测验项目的难度分析
(一)什么是测验项目的难度 (二)如何计算题目的难度 (三)测验难度对测验结果的影响 (四)测验的适宜难度分布 (五)测验题目平均难度的计算若各题满分值一样，可计算各题难度算术平均数若各题满分值不一样，可采用下面步骤和方法： • 先计算各题满分值在总分中所占比率(即权重)，然后将各题难度乘以权重，再求和及计算各题难度系数的加权平均数。举例 • 或者用被试样本的测验均分除以测验满分值
——艾伯尔:《教育测量纲要》第302页
(江西师大1984年中译本)
上一页下一页
难度对测验结果的影响
3.测验的难度对测验鉴别力的影响
鉴别学生能力水平的高低，区分出他们之间的差异，是心理与教育测验的主要功能。判断测验的鉴别和区分能力主要看哪些统计指标？测验分数的分布形态、离散程度等测验题目的难度对测验的鉴别能力有什么影响？
上一页下一页
(一)什么是测验项目的难度
项目的难度(difficulty)是指测验的项目(或试题) 难易程度，通常用 P 表示。在能力测验中，它就是指试题的难度水平。在非能力测验(如个性、态度等测验)中，难度被称为“通俗性”、“流行性”水平，指被试样本中所选答案的倾向性。
上一页
下一页
难度分析
(二)项目难度的计算
1、二级评分项目的难度计算
2、多级评分项目的难度计算
3、大规模测验的项目难度计算
4、二级评分项目难度系数的校正
上一页
下一页
难度分析
1、二级评分法题目的难度计算公式
这类项目属客观题，一般是答对给1分,答错给0分. 难度计算公式： P = R/N [即：试题通过率] R 为其中的答对人数 N 代表总体(或被试样本)人数练习：在一次200人参加的测验中，第一道单项选择题的答对人数为60人，第二道题目的答对人数为 150人，两道题目的难度系数分别是多少？第一道：P= ？第二道：P= ？
CP=(KP-1)/(K-1)
CP为校正后的难度；K为备选答案数目； P为由题目得分直接计算出的难度（即通过率）。校正目的：比较答案选项数不同的题目的难度练习1：一个四选一题目的难度系数为0.60；一个是非判断题的难度为0.70。哪个题目的难度大？ CP=(4*0.60-1)/(4-1)=0.467 CP=(2*0.70-1)/(2-1)=0.40
上一页
下一页
难度分布要求
针对普通群体的常模参照测验：难度要求
测验目的：对大规模群体的个体水平进行区分和鉴别对于能力和特性水平测验：题目的难度分布应接近正态分布，绝大多数题目的难度应在0.25~0.75之间; 平均难度在0.50左右
对于个性、态度测验：
各个项目被选答案的评定等级的次数分布应接近正态分布
上一页下一页
E
思考与练习一：
试预测下面三个测验的分数的离散程度大小变化：测验一：题目的难度都在 0.5左右；测验二：题目的难度均匀地分布在0.2~0.8之间；测验三：题目的难度集中在0.2、0.8两端。哪套测验分数的离散程度较小哪套测验分数的离散程度较大？
上一页
下一页
难度对测验结果的影响
1.鉴别指数 2.项目得分与总分的相关：积差相关、点二列相关 3.项目对总分离散程度的影响分析：方差、标准差 4.项目的效标关联效度分析：积差相关、点二列相关、Φ相关、四分相关