笔记：心理测量金瑜主编华东师范大学出版社

合集下载

金瑜《心理测量》笔记和习题(含考研真题)详解(量表与常模)【圣才出品】

第8章量表与常模8.1 复习笔记一、原始分数和导出分数（一）原始分数原始分数是指实施测验之后，根据测验指导书计算的测验分数。

传统的计分方法为：其中，为被试的测验总分，为被试在项目上的得分。

当项目为0和1计分时，空项不计分，所有的项目被等同看待。

（二）对原始分数的矫正1．矫正的原因一般认为，对于不知道正确答案的项目，各被试忽略不做的意愿是不同的。

而这种意愿对观测分数的方差是有贡献的，由这种贡献而来的方差并非主测者所感兴趣的特质的方差。

观测分数的差异并不能反映他们在所测的特质上的差异，显示的只是他们猜测的意愿和运气。

在这种情况下，要考虑对传统分数采取某种变换。

2．变换的种类（1）基于随机猜测的模型①被试知道项目的正确答案并作出选择、被试忽略不知道的项目或者瞎猜并随机在k个选项中作出选择。

基本的矫正公式为（矫正猜测的公式）：其中，为矫正分数，R为正确回答的得分，O为忽略的项目数（0和1计分情况下等于忽略的分数），k为项目的选项数（所有项目必须都有个项目）。

②基本的假设：如果被试猜测那些被忽略的项目，其猜中的概率为（所有的猜测都是随机的）。

通过这种矫正后，被试的观测分数将有所增加。

（2）第二种变换①基本公式：为对猜测进行矫正后的分数，W为错误题数，为每道题的选项数。

②基本的假设：每一个错误的反应都是随机猜测的结果。

（三）部分知识矫正分数的目的是阻止被试得到不应有的分数，对“部分知道”的项目给被试计分。

基本的逻辑是：在传统的多项选择测验上得到相同分数的被试，可能对测题所拥有的知识并不相同。

计算部分知识的方法可分为以下三类：1．信心加权（1）测验被组织成适当的形式，在这种测验中被试必须指出他对每一道题的正确性的把握是多少。

当两名被试对某题有不同的信心程度指数时，即使他们有着同样的反应，也会收到不同的分数。

（2）安切特奈特（Echternacht，1972）指出，虽然信息权重方式有一定的逻辑吸引力，但是在考试和计分中应用时，并没有增加信度和效度系数，甚至还降低了。

我国心理学专硕各大学参考书目

2016心理学专硕各大学参考书目第一章心理学导论：1.《心理学与生活》（16版）2.《普通心理学》彭聃龄北师大出版社3.《实验心理学》郭秀艳、杨治良人民教育出版社4.《现代心理与教育统计学》张厚粲北京师范大学出版社5.《心理与教育测量》郑日昌人民教育出版社第二章人格心理学：6.《人格心理学》 Jerry M.Burger 中国轻工业出版社第三章发展心理学：7.《发展心理学》林崇德北师大出版社第四章临床与咨询心理学：8.《心理咨询与治疗》钱铭怡北京大学出版社9.《临床心理学》王登峰人民教育出版社第五章变态心理学：10.《变态心理学》钱铭怡北京大学出版社第六章社会心理学：11.《社会心理学》侯玉波北大出版社第七章管理心理学：12.《管理心理学》车丽萍秦启文北京地区：1、北京大学：按347全国大纲出题2、北京师范大学：1《普通心理学》彭聃龄北师大出版社2《现代心理与教育统计学》张厚粲北京师范大学出版社3《心理与教育测量学》郑日昌人民教育出版社4《社会心理学》金盛华北大出版社5《发展心理学》林崇德北师大出版社3、首都师范大学：指定3本参考书《普通心理学》北京师范大学出版社2004年（修订版）彭聃聆《现代心理与教育统计学》北师大出版2009年第三版张厚粲、徐建平《心理测量》华东师范大学出版社200年版金瑜4、中国科学院大学：347全国大纲（今年新加清华大学和中央财经大学）天津市：5、南开大学：1心理学专业综合普通心理学叶奕乾等编华东师大出版 2010第四版2社会心理学全国高等院校《社会心理学》编写组南开大学出版社第四版 3发展心理学林崇德主编人民教育出版社，2009年（第二版）4心理测量学戴海琦主编高等教育出版社，2010年5咨询心理学乐国安主编南开大学出版社，2002年6、天津师范大学：347全国大纲河北省：7、河北师范大学：《普通心理学》（修订版）北京师范大学出版社2006年版彭聃龄。

《当代教育心理学》北京师范大学出版社2007年版陈琦、刘儒德。

第1章心理测量学

D 心理测量与经济学测量不同
例：测定某年份国民收入，必然有误差，不可以重复; 心理测量是介于经济科学与自然科学之间的测量

3、对行为相关关系的描述---对行为不能作出因果描述，这是其局限性。 4、测量结果一般为顺序关系 5、测量结果的相对稳定性（稳定---相对变化）
三、心理与教育测量的量表的水平

（2）特征：顺序量表是次低水平的测量量表，它既不表示事物特征的真正的数量，也不表示绝对的数值，因此不能进行代数运算。（3）适合的统计方法：中位数、百分位数、等级相关系数和肯德尔和谐系数等。
3.等距量表（Internal scales）

（1）定义：等距量表指不仅能够指代事物的类别、等级，而且具有相等的单位的量表。（2）特征：等距量表是较高水平的测量量表。等距量表的数字是一个真正的数量，它的各个部分的单位是相等的，因此可以对其进行加减运算。等距量表没有绝对的零点，它的零点是人们假定的相对零点。因此，等距量表中的两个数量不能进行乘除运算，即数据之间不存在倍数关系。（3）适合的统计方法：平均数、标准差、积差相关系数以及t检验和f检验。
3、“Measurement of the psychological attribute occurs when a quantitative value is assigned to the behavioral sample collected by using a test.” (C & A ) 4、“the process of quantifying the characteristics of persons according to explicit procedures and rules” (Bachman 1990: 18)

心理学考研推荐书目

心理学考研推荐书目普通心理学（1对考试最重要）1．彭聃龄，《普通心理学（修订版）》，北京师范大学出版社，2004。

2．叶奕乾、何存道、梁宁建，《普通心理学（修订二版）》，2004。

3．理查德·格里格、菲利普·津巴多著，王垒、王甦等译，《心理学与生活（第16版）》，人民邮电出版社，2003。

心理学史1．叶浩生，《西方心理学的历史与体系》，人民教育出版社，1998。

实验心理学（前三本较重要，可从1入门）1．郭秀艳，《实验心理学》，人民教育出版社，2004。

2．朱滢，《实验心理学》（第2版），北京大学出版社，2009 。

3．杨治良，《实验心理学》，浙江教育出版社，1998。

4．朱滢，《心理实验研究基础》，北京大学出版社，2006。

5．张学民、舒华，《实验心理学纲要（修订版）》，北京师范大学出版社，20046．白学军等译，《改变心理学的40项研究》，中国轻工业出版社，2004。

心理统计学（可选一本适合自己的，重点看）1．张厚粲、徐建平，《现代心理与教育统计学》，北京师范大学出版社，2003。

2．张敏强，《教育与心理统计学（修订本）》，人民教育出版社，2002。

3．王孝玲，《教育统计学（第四版）》，华东师范大学出版社，2007。

4．王爱民、李悦等译，《行为科学统计》（第七版），中国轻工业出版社，2008。

5．邓铸、朱晓红，《心理统计学与spss应用》，华东师范大学出版社，2009。

心理测量学（可重点看1）1．戴海崎等，《心理与教育测量（修订本）》，暨南大学出版社，2007。

2．金瑜，《心理测量》，华东师范大学出版社，2005。

教育心理学（前两本重点看，后两本看知识分类部分）1．冯忠良等，《教育心理学》，人民教育出版社，2000。

2．陈琦、刘儒德，《当代教育心理学》（第2版），北京师范大学出版社，2007。

3．皮连生，《教育心理学（第三版）》，上海教育出版社，2004。

4．吴庆麟等，《认知教学心理学》，上海科学技术出版社，2000。

金瑜《心理测量》笔记和习题(含考研真题)详解(心理测量和测验的历史回顾)

第1章心理测量和测验的历史回顾1.1 复习笔记一、中国古代的心理测量思想和实践（一）心理测量的完整实践的三个前提1．要肯定心理的可测性；2．要确定测量的内容；3．要在对心理内容的特性或差异性阐述的基础上，形成具体的测量方法。

（二）中国古代心理测量的卓越贡献1．中国先哲们对心理的差异性方面有深刻的认识。

如儒学创始人孔子提出“性相近，习相远”的观点。

2．中国古代先贤们明确论述了这些差异的可测量性。

如孟子有“权，然后知轻重；度，然后知长短。

物皆然，心为甚”之说。

3．中国古代还产生了真正意义上的心理测量的实践活动。

它集中地表现在对人才的评定和选拔上。

（1）三国时期刘邵的《人物志》可以认为是一部研究能力的专门著作。

对于人的形质、人性、才具以及志业等，均有独到的阐述分析。

（2）中国古代最值得称道的心理与教育测量的实践活动是初萌于商周，兴盛于隋唐的科举取士制度。

如商周时代的教育考试内容为礼、乐、射、御、书等服务于祭祀与作战之需的六艺；汉代则笔试法律、军事、农业、税收和地理等五经内容；隋唐时代，科举制度在全国范围内进行，并且制度完善。

（3）中国民间自发的测量活动也形式多样、传统深远。

如南北朝时代在中国许多地区（特别是江南地区)广为流传的“周岁试儿”活动以及七巧板益智图、九连环游戏等形式。

（4）我国著名心理学家林传鼎先生认为它是近代西方学者格塞尔的婴儿发展量表和彪勒的婴儿发展测验（程序表）的先导。

二、近代心理测量的早期尝试与先驱者的探索（一）早期对智力落后儿童的分类与训练的兴趣1．法国医生艾斯克罗法国医生艾斯克罗是第一位正式在文献中区分智力落后与精神异常的先驱。

在1839年出版的著作中，认为智力落后有程度上的不同，从正常人到最严重的白痴者之间是一个连续的向度分布。

为了区别不同程度智力落后者并把他们加以分类，艾斯克罗还发现了一个人的语言能力是他智力水平的最可靠的指标。

现今使用的鉴别智力落后的标准大多均属于语言范畴，众多智力测验均包含言语测验的内容。

教育测量与评价自学指导书

聊城大学成人高等教育——教育学专业自学指导书教育测量与评价宋东清编2011年7月前言一、课程目标教育测量与评价是教育学学专业的一门专业核心课程。

教育测量与评价的内容包括两个部分，一部分教育测量与评价的理论，另一部分特殊领域的测量量表与评价标准，前者如测量历史、信度、效度、项目分析与常模等专题，后者论述在具体研究领域中如何应用测量如智力量表、人格量表，教育测验等。

二、自学要求1.熟悉心理测量学的基本理论和操作程序；2.了解心理测量在智力、人格和教育情境测验等个领域的研究和应用情况概况；3.掌握心理测量方法的基本类型和具体研究方法和手段；4.掌握心理测量学的信、效度的含义、类型和计算方法；5.学会基本的心理测验的设计、操作和研读。

三、自学内容与学时分配建议（64课时）四、教材及主要参考资料教材：《心理测量》，金瑜主编，华东师范大学出版社，2001年。

参考书：《心理与教育测量》，戴海崎等编著，暨南大学出版社，2002年。

《心理测量》，郑日昌编著，湖南教育出版社，1987年。

第一章心理测量和测验的历史回顾教学重点：中国古代的心理测量思想和实践；近代心理测量的早期尝试与先驱者的探索；二十年来我国心理测量和测验发展概况。

教学难点：二十年来我国心理测量和测验发展概况。

教学要求：1.了解我国古代的心理测量思想和实践；2.熟悉近代心理测量的先驱者的探索获活动；3.掌握我国二十年来心理测量和测验发展特点。

教学内容：第一节中国古代的心理测量思想和实践心理测量的完整实践至少包括三个前提：1．要肯定心理的可测性，正视心理的个别差异；2．要确定何种心理特征进行测量；3．把内容操作化中国古代心理测量的贡献：1．首先，关于心理差异方面，儒学创始人孔子提出“性相近，习相远”的观点2．其次，关于心理差异的可测量性，古代先哲们也有论述。

如孟子有“权，然后知轻重；度，然后知长短。

物皆然，心为甚”还有，刘劭的《人物志》影响深远，后译为“人类能力研究”出版3．西汉杨雄提出以反应的速度为标准判断人的智力的高低；诸葛亮提出问答法和特定情境诱导法作为知人性的手段等第二节近代心理测量的早期尝试与先驱者的探索一、早期对智力落后儿童的分类与训练的兴趣1．法国医生艾斯克罗第一次在文献中正式提出精神异常者与智力落后者之间的区别；2．法国医生沈干——训练智力落后者的先驱，创建了第一座教育智力落后儿童的学校。

心理测量发展简史

心理测量发展简史一、中国古代的心理测量思想心理测量的前提：①肯定心理的可测性，正视心理的个别差异②确定测量的内容③在对心理内容的特性或差异性阐述的基础上，形成具体的测量方法（一）个体差异及其可测性思想孟子《梁惠王上》：权，然后知轻重；度，然后知长短；物皆然，心为甚。

（二）心理测量的实践活动20世纪30年代，美国学者施奥-瑞克将我国三国时期魏国人刘邵的《人物志》译为《人类能力的研究》，并在美国年销量100万册。

诸葛亮情境测验的使用：选拔将领时给予其500士兵，观察其完成任务的情况。

古代中国心理测量的贡献：①描述性的，而非定量的。

②分类式的，如把人分成三六九等。

③注重对人做整体的鉴定和评价，并倾向于和人的道德品质联系起来。

④与教育中的因材施教及人才使用有着密切的联系，它一开始就具有强烈的应用价值。

二、现代心理测量在西方国家的产生和发展（一）心理测量的产生是社会的需要①工业革命后，有专门人才的训练、人员选拔和职业指导的需要②教育的需求，如法国的义务教育（二）心理测量的早起探索者威廉-冯特（德）：在严格控制实验条件的前提下观察行为的做法对现代标准化测验严格执行指导语产生了显而易见的影响。

高尔顿（英）：统计学的奠基人，最早提出“相关”的概念。

同时是优生学创始人，认为人的能力是由遗传得来的，其差异是可测量的。

对希特勒发动二战有很大的影响。

詹姆斯-卡特尔（美）：师从冯特，同时是高尔顿的助手。

最早提出“常模”的概念。

1890年，发表《心理测验与测量》，首次提出“心理测验”这个术语。

比内（法）：世界上第一个智力测验量表，同时也是世界上第一个正式的心理测验——比内-西蒙量表。

有三个版本，其中第二个是影响最大的。

美国心理史学家波林指出“19世纪80年代是高尔顿的十年，90年代是卡特尔的十年，20世纪的头十年是比内的是十年。

”（三）心理测量的发展美国斯坦福大学：刘易斯·推孟修订的斯坦福——比内量表，采用了比率智商的概念来表示智商的高低，从此智商一词风靡全球。

心理学考研自主命题院校考试科目及参考书整理

心理学考研自主命题院校考试科目及参考书整理现在很多同学都在纠结于怎样选择院校，选择统考的还是自主命题的，自主命题的又该如何复习，老师给大家的建议是如果你非常中意某个学校，非此学校不去，并且有自信能够考上，可以选择自主命题学校，按照该学校指定科目及参考书复习，如果没有确定自己的目标，并且没有信心，那我给大家的建议是按照统考复习，我是勤思刘老师，所有自命题院校都列在这里了，大家可以参考一下。

1、中国人大社会心理学方向自主（基础、应用统考）(621)社会研究方法(833)社会心理学（含人格心理学）2、首都师范大学 775)心理学基础综合775）该考试科目不指定参考书。

主要考试内容包括：（1）普通心理学（2）实验心理学、（3）人格心理学、（4）心理统计学、（5）心理测量学、（6）发展心理学。

3、中央财经大学(616)社会心理学(816)心理学研究方法参考书：1社会心理学《社会心理学》金盛华高等教育出版社 (2005 第一版) 2心理学研究方法《心理与教育研究方法》董奇北京师范大学出版社(2004第一版) 复试参考书：普心彭聃铃4、南开大学748)心理学专业基础考试科目和参考书是《普通心理学》彭聃龄主编北京师范大学出版社2004年版《社会心理学》十三院校合编南开大学出版社2008年第四版《认知心理学》乐国安主编南开大学出版社2011年版《咨询心理学》乐国安主编南开大学出版社2002年版《西方心理学史》汪新建主编南开大学出版社2011年版《实验心理学》郭秀艳著人民教育出版社2004年版《现代心理与教育统计学》张厚粲、徐建平编著北师大出版社 2009版《心理测量》金瑜主编华东师大出版社 2005年版5河北大学发展心理学：(697)心理学专业基础综合《普通心理学》，北师大出版社，彭聃龄《发展心理学》，浙江教育出版社，林崇德《当代教育心理学》，北师大出版社，陈琦，刘儒德《实验心理学》，浙江教育出版社，杨治良《心理与教育测量》作者：戴海琦暨南大学出版社《现代心理与教育统计学》，北师大出版社，张厚粲，徐建平复试心理与教育研究方法《心理与教育研究方法》，北师大出版社，董奇同等学力加试心理学史《心理学史》，高等教育出版社，叶浩生同等学力加试教育心理学《当代教育心理学》北师大出版社，陈琦，刘儒德基础心理学：(659)心理学概论 (816)心理学研究方法心理学概论《普通心理学》，北师大出版社，彭聃龄《发展心理学》，浙江教育出版社，林崇德《当代教育心理学》，北师大出版社，陈琦，刘儒德心理学研究方法《实验心理学》，浙江教育出版社，杨治良《心理与教育研究方法》，北师大出版社，董奇《现代心理与教育统计学》，北师大出版社，张厚粲，徐建平复试认知心理学《认知心理学》，北京大学出版社，王甦，汪安圣同等学力加试心理学史《心理学史》，高等教育出版社，叶浩生同等学力加试心理与教育研究方法《心理与教育研究方法》，北师大出版社，董奇6、河北师大(730)心理学专业基础综合《普通心理学》（修订版）彭聃龄主编，北京师范大学出版社；《实验心理学》（第2版）朱滢主编，北京大学出版社；《现代心理与教育统计学》张厚粲、徐建平主编，北京师范大学出版社。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

心理测量金瑜主编华东师范大学出版社2001版说明：1.本笔记仅就自己认为的难点，疑点，以及重点部分进行摘抄评述，主要是关于测量理论的部分，不涉及其他，其实测量学大部分内容都很清晰，稍微花点心思甚至可以猜测一些章节的题型；2.选择这本书是因为这本书详略得当，讲解清晰，对于理论部分的讲解深入浅出，非常有利于理解学习。

3.由于测量学和统计学的关系密切，但实际上二者有着本质的不同，所以在二者联系紧密的地方略加注解，稍加辨析，未为得当，尚祈见教。

第二章第一节测量的基本问题（按：这一章节的内容虽然很基础，就考试来言不是很重要，但是理解好了不仅有利于测量学内容的学习，对于实验心理学中心理物理法的理解也很重要，孟庆茂版实验心理学中也讲到了数的属性划分。

）一、测量的定义1.S.S.Stevens：“测量是按照法则指派数字”。

2.测量三要素：（1）测量的对象——事物的属性和特征；（2）测量的规则或法则——给事物的属性分派数字的依据；（3）测量的结果——描写事物属性的数字或符号；3.测量的对象的性质1：（1）具体型——气味（2）抽象型——智力（3）确定型——长度（4）随机型——记忆广度（5）模糊型——热情奔放与冷若冰霜4.测量的结果：数的属性划分2（1）同一性和区分性——类别\称名量表（2）等级性或序列性——等级量表（3）等距性——等距量表（4）可加性——等距量表、等比量表35.数量法则4的制定：所谓数量法则，即一种有序配对的集合，用函数的形式表达为f={（X,Y);X=任何事物,Y=一个数字}，也就是测量这个概念定义所表达的内容。

1以下的划分其实可以分为两个维度，一个是具体性，一个是确定性。

前者包括（1）和（2），后者包括（3）（4）（5），正如作者所说，这其中并无绝对的区分界限。

2数的属性如何体现（表现为不同的量表），其实受制于所测量事物的属性和所应用的法则（即所使用的测量方法）3可加性就是可计算性，数学上加减为一级计算，乘除为一级计算，等距量表只具有可加减的特性，等比量表可以进行乘除计算，因为它有绝对零点；这里进行的排列，并不意味着数的属性相对应的量表只具有该特征，排在下面的量表涵盖上面量表的特性。

4在心理学即所应用的测量理论二、测量的要素1.参照点——计算的起点，包括两类，绝对零点和相对零点（这个是等距量表和等比量表区分的重要一点）2.单位——具有确定的意义；具有相等的价值三、四中测量水平和测量量表1量表scale：广义上讲，任何可以使事物数量化的值和两的渐进系列都可以成为量表根据数的属性描述事物属性所达到的程度的不同：1.类别量表2.等级量表——心理测量学中大部分数据为这个水平，研究者利用正态分布将之等距化；3.等距量表4.等比量表四、直接测量与间接测量——心理测量均属于间接测量五、测量的方法，广义上包括实验法，观察法，测验法，在心理测量学中采取狭义的定义，专指测验法六、误差与精确程度受制于三个因素：（1）事物的性质；（2）测量工具；（3）实际工作中的要求；第二节心理测量的基本概念一、定义二、可能性：桑代克：凡物之存在必有其数量麦柯尔：凡有数量之物皆可测量三、特点：1.间接性 2.相对性四、测量的水平：等级（可以使用正态分布将之转化为z分数，从而达成等距数据的转化）第三节基本概念一、心理测验三要素：1.行为样组——心理特性2.标准化——测量的一致性3.客观性——保证测量的科学性，即测量方法可重复1这个知识点在测量学、统计学、实验心理学中都出现过，可见它的重要性。

简而言之，统计学中，无论描述统计还是推断统计都是围绕这四中测量水平展开方法的使用，描述统计中比较突出的就是统计图的描绘所应用的数据类型不同，推断统计中参数检验和非参数检验的区分，所不同的是统计学中将这个知识点表述为数据的水平而不是量表；在实验心理学中，围绕这个量表展开阐述的是心理物理法，费希纳的方法为等距量表，史蒂文森的的方法为等比量表，此外还有将等级数据转化为等距数据的方法等等二、客观性指标信度效度难度和鉴别力（区分度）第五章信度第一节信度的理论1.误差的种类（1）抽样误差——即标准误，由于测量学的样本巨大，所以可以忽略，此外抽样误差与测量本身的误差并无联系（2）系统误差——与信度无关，与效度有关（3）测量误差（随机误差）——信度完全受其影响，与信度效度都有关系2.真分数理论数学表达式X=T+E真分数定义：真值操作定义：无数次测量的平均值三假设：（1）误差分数的平均数是零。

——测量误差的随机性。

1（2）误差分数与真分数相互独立，即相关为零。

（否则不称其为误差了）（3）两次测量的误差分数之间的相关为零。

23.信度的基本定义： 222tt t t S S r r ∞∞== r tt 是信度，r t ∞信度指标，r t ∞2叫决定系数，表示因变量能以自变量解释的比例部分。

3 即真分数所占测验分数总变异的比例。

4.注意：信度是一组测验（工具）之间的一致性，而非个人的分数的一致性。

第二节测量误差的来源主要来自三个方面：测验本身测验实施过程被试本身第三节估计信度的方法4一、重测信度（稳定系数）1.再测验测验一段时距−−−→−——重复测量 2.使用积差相关公式进行计算。

3.误差来源：所测特性稳定被试个体差异偶发因素二、副本信度（等值系数） 1.B A 测验复份测验复份最短时距−−−→−——有副本1 这个假设保证了无数次测量平均值趋近真分数的可能。

2 保证每次测量的独立性，这点也是推断统计中首先要满足的假设之一。

3 这里可以联系到统计学中相关章节对于决定系数的解释，同时，这种方差的分解对于方差分析也是很关键的。

4 所谓估计信度的方法可以理解为信度的操作定义，而信度意义本身应该从定义公式出发理解这个问题，而不是从计算方法出发进行解释。

2.使用积差相关公式进行计算。

3.误差来源：两份测验是否等值被试个体差异偶发因素4.稳定——等值系数——副本加重复测量B A 测验复份测验复份一段时距−−−→− 三、内在一致性信度1.项目同质性2.分半法（1）斯皮尔曼——布朗公式：nnnn tt r r r +=12 （2）斯皮尔曼——布朗公式：ll ll nn r n nr r )1(1-+=这两个方法要求测验两半严格平行。

（3）费拉南根公式：)1(2222t b a tt S S S r +-=，其中，S a 2，S b 2分别是两个分半测验的方差，S t 2是整个测验的总分方差。

（4）卢龙公式：221td tt S S r -=，其中S d 2是两个分半测验分数之差的方差，S t 2是整个测验的总分方差。

这两个方法不要求两个分半测验分数的变异性相等。

13.基于项目协方差的方法利用每一道测题的方差或者协方差来计算信度。

（1）K —R20 要求（0，1）计分：))(1(22tt tt S pq S n n r ∑--= （2）K —R21 要求（0，1）计分：))(1(22t t tt S q p n S n n r ----= （3）克隆巴赫α系数：))(122ti t S V S n n ∑--(=α 4.基于方差分析的方法——霍伊特信度——与概化理论有关四、评分者信度两个评分者：积差/等级相关系数多个：肯德尔W 系数1 也就是要求方差齐性。

第四节影响信度系数的因素一、分数分布范围的影响11.分数分布范围越宽，信度系数越高2.克莱公式（可以用来计算分数分布范围如何影响信度的）：220)1(1nnn S r S r ∞--= 二、测验长度的影响：斯皮尔曼-布朗通式三、测验难度分数分布测验难度影响−−→−2第五节测量的标准误差一、间接估计的方法 1.计算公式：推导而来）由2t2e tt -1r (1S S r S S tt t e =-= 2.测量的标准误差与信度一样，反映的是一组被试的情况。

33.使用测量的标准误差估计真分数——使用的是统计学中区间估计的方法，唯标准误计算方法不同。

4.注意：（1）标准误估计的个体分数值是区间估计，而非确切的点（2）S e 越小，估计越精确（3）真分数并不等同于个体的真正的能力4二、直接估计的方法。

相当于卢龙公式中的异的标准差，而，是指两次测验分数差其中d e 2121,707.0S S S S S x x x x e --=第六章效度第一节概述一、测验效度的基本问题1.测验测量的是什么东西，测验测到了它要测的东西吗？2.测验对它所测量的东西测到了什么程度？1 其实是被试同质性与异质性问题，被试同质性越高，分数分布范围越窄，反之亦然。

同样的，这个问题对于统计学中相关和回归的计算也是至关重要的，这点可以由各种信度的计算公式得出。

2 可以归结到第一个原因中去，难度影响分数分布从而影响信度。

3 统计学中也是如此，各项指标都是反映一组被试的情况4 信度只表示测量的一致性，而不是测量的可靠性，可靠性是效度二、效度的含义1.定义（1）操作定义：一个测验对其所要测量的特性测量到什么程度的估计（2）理论定义：总变差中由所测量的特性造成的变差所占的百分比2.效度的性质（1）效度针对测验结果（2）效度针对某种特定的测验目的（3）效度只有程度上的差异，而不是全或无的差别三、效度与信度的关系1.高信度是高效度的必要条件，而不是充分条件这并非说在任何情况下，信度越高越好。

（这要看测验的具体要求）2.信度系数的平方根是效度系数的最高限度第二节内容效度和结构效度一、内容效度1.含义：评估测题是否充分代表了所要测量的内容范围2.验证提高的方法专家评定——双向细目表评分者信度也可以作为内容效度的一个指标克隆巴赫的量化方法（两个测验分数的相关法）3.表面效度对于最高行为测验有帮助，对于典型行为测验不合适。

二、结构效度1.含义：测验能说明心理学上的理论结构或特质的程度，或用心理学上某种结构或特质来解释测验分数的恰当程度。

结构——指用来解释人类行为的理论框架或心理特质。

2.验证结构效度的方法1：（1）测验内方法：内容效度被试解答测题时的反应过程测验的同质性（2）测验间方法：相容效度会聚效度和区分效度（3）不同类型信度的特点（4）准则关联效度的研究（5）发展水平的变化：稳定系数（即信度资料）也可以作为效度的证据（6）实验操作第三节准则关联效度一、准则1.含义：就是效标。

即利用测验分数来推断准则的取值能有多准确。

2.准则的测量（1）准则应能代表理论上测验有效性的主要方面，跟所研究的问题真正相关。

（2）准则测量与准则要有较高的相关性。

（3）准则测量必须测量误差小，具有高效度二、准则关联效度的估计方法1信度和效度直接关系密切。

1.效度系数——测验分数和准则分数之间的相关系数（1）积差相关系数——预测分和准则分都是连续变量时（2）二列相关系数——人为二分变量，连续变量2.组的分类（1）基本思想：根据准则行为进行分组，若这些组别在预测分数上也应该有显著性差异，那么就说这个预测效度的效度是较高的。