用规则空间模型和属性层次方法进行认知诊断

合集下载

基于rsm的化学平衡概念理解研究

基于rsm的化学平衡概念理解研究

单位代码10445学号2012020764分类号G449.5研究生类别全日制硕士硕士学位论文论文题目基于RSM的化学平衡概念理解研究学科专业名称课程与教学论申请人姓名李敏指导教师毕华林论文提交时间2015年3月26日独创声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。

据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得(注:如没有其他需要特别声明的,本栏可空)或其他教育机构的学位或证书使用过的材料。

与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。

学位论文作者签名:学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。

本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。

(保密的学位论文在解密后适用本授权书)学位论文作者签名:导师签字:签字日期:20年月日签字日期:20年月日目录摘要 (I)Abstract (Ⅱ)1研究概述 (1)1.1研究背景 (1)1.1.1科学素养:科学教育的首要目标 (1)1.1.2概念理解:培养科学素养的核心要素 (1)1.1.3规则空间模型:诊断概念理解的有效的理论模型 (2)1.2提出问题 (3)1.2.1基于规则空间模型的概念理解的测量亟待研究 (3)1.2.2概念理解的教学的需求 (4)1.3研究目的 (5)1.4研究意义 (5)1.5研究思路 (6)2概念界定 (6)2.1理解的界定 (6)2.2概念理解的界定 (8)3文献综述 (9)3.1化学平衡的相关研究 (9)3.2概念理解诊断测量的相关研究 (12)3.3规则空间模型的相关研究 (14)3.3.1规则空间模型的简介 (14)3.3.2规则空间模型的应用研究概述 (16)4化学平衡概念理解认知属性模型的理论建构 (19)4.1化学平衡概念理解的过程属性 (19)4.1.1概念理解的过程属性界定 (19)4.1.2概念理解的过程属性的层次关系 (22)4.2化学平衡概念理解的知识内容属性 (24)4.2.1新课改教材中化学平衡知识建构体系(以高中鲁科版教材为例) (24)4.2.2新课标要求 (25)4.2.3化学平衡的知识内涵的界定 (26)4.3构建化学平衡认知属性模型 (26)4.4化学平衡相关知识-表征水平的结构图 (27)5实证研究 (28)5.1调查研究目的及对象 (28)5.2研究步骤 (28)5.2.1邻接矩阵和可达矩阵 (28)5.2.2缩减事件矩阵Qr、典型属性矩阵Ea (30)5.2.3被试的理想反应模式 (33)5.2.4调查问卷的编制 (35)5.2.5数据分析 (40)5.2.6建立规则空间,估计θ和ζ (43)5.2.7实际反应模式的归类 (49)5.3研究结果 (53)6化学平衡的教学建议 (57)7展望 (60)参考文献 (61)附录 (64)致谢 (69)摘要化学平衡作为学习其它概念的基本概念,它的理解是至关重要的。

规则空间模型在进位计数制诊断性测验中的应用

规则空间模型在进位计数制诊断性测验中的应用

环境 问题 已成 为 当今 世界 的突 出问题 。作 噪声 的传播 ,课 间不 大声喧 哗 ,课 堂上不 学 生 到 实 验 室 按 要 求 得 到 结 果 以 验 证 所 学 为一 名物 理教 师更要 参与 其 中,利 用学 科 窃窃 私语 ,尽 量 减小 桌子 的移动 ,要 保持 的 内容 ,多数 学生是 老师 怎么说 学生 就怎 优势 , 在教学中适 时 、 适度 的进行环保教育 , 安静 ,提高 课堂 质量 。从 小 事做 起 ,从 身 么做 ,对于器 材 的来源从 不过 问 ,多数学 并让 学生 通过 学习 物理来 增强 环保意 思。
~。一一 2一 一 一一m一m 一 。一 一
理计 量学 相结 合 的认知 诊断模 型 , 能够有 它 效地诊 断学 生在解题 中 的认 知错误 ,从 而帮 助教师有针对性 地改进教学 ,提高教学 质量 。 本 研究 以诊断 高二学生对 不 同进 位计数 制及其 相互 转换 的技 能掌握情 况为 目的 。首

一一 一一 一~ 一一 一一 一 一 一 一 。一
H一。 一9 ~一 "一8 一一。 一一 一 一2 ~一 一。 m 6 7 一 一 一
图 11 - 七种属性 间的层级 关系 对 本次研 究 回收的 19份有 效试 卷 ,除 8 去3 7份 满分 试 卷 后 的 12份 试 卷 ,运 用 在 5
先 ,我 和高一 高二年级 任教 的老师一起 对这
部分 的知识 技能进行 了界定 ,确定 了七种属
性 ,并 对这七 种属性 间的关 系进行分 析 ,理

清它 们 之间 的层级 关 系 ( 图 1 1 如 — ),编制
了 1 6道试 题 来测 试被 试 在本 研究 所 指 向领 域的知识结构 。

认知诊断示例

认知诊断示例
生试卷,10~50人,取2份,50以上,取10份,共取34份。 (二)教师诊断与认知诊断对照及结果分析 首先,对3名教师培训,了解认知属性及层级关系, 了解每道题考核的认知属性,学习掌握判定未掌握认知属
性的方法。判卷,对学生做错的试题,标注出要考核的属
性,确定学生未掌握的属性,结果填入下表:
结果对照表
2.试题难度对认知诊断的影响 对某些知识内容较为复杂,选用复杂的试题来考察认知属 性,学生作答的正确率会下降,从而掌握率下降,影响认知 诊断结果。 3.认知诊断模型选择 心理测量学家DiBello和Stout(2007)给出一般认知诊断 模型选择的原则:所选择的认知诊断模型,应足够复杂以便 提供存分的技能诊断信息,同时模型参数又要足够的精简, 还要存分拟合数据。
A、B、C三套试卷估计ቤተ መጻሕፍቲ ባይዱ识状态中各属性的掌握概率
试卷编号 A B C A1 0.98 0.99 0.99 A2 0.96 0.98 0.96 A3 0.96 0.97 0.95 A4 0.95 0.98 0.96 A5 0.93 0.96 0.92 A6 0.94 0.97 0.93 A7 0.92 0.95 0.89
111
mean
124
3009
0.98
0.99
0.92
0.97
0.90
0.96
0.93
0.96
0.89
0.94
0.93
0.95
0.85
0.93
1.测试结果良好,各属性平均掌握率在0.9以上。 2.101,102都是市内重点小学,101为初学,102学过一段时间
,102除A1属性外掌握率都比101高,说明继续学习对巩固上一 部分的知识有一定的促进作用。

参数化认知诊断模型:心理计量特征、比较及其转换

参数化认知诊断模型:心理计量特征、比较及其转换

参数化认知诊断模型:心理计量特征、比较及其转换高旭亮;涂冬波【摘要】与项目反应理论(IRT)相比,认知诊断(CD)因能提供更为细致、丰富的诊断信息而深受国内外研究者的推崇,并成为现代心理测量理论的核心;而认知诊断模型(CDMs)则是实现诊断功能的核心技术环节,认知诊断模型的好坏直接决定着认知诊断的准确性及有效性.本文以模型分类、模型计量学特征、模型假设、模型适用范围以及模型间的数学转换关系为视角,对国际上十几种常用参数化认知诊断模型进行归纳、综述及评价,为实际应用者在认知诊断模型比较与选用上提供借鉴和参考.%Compared with the item response theory(IRT),CognitiveDiagnosis(CD)can provide more meticulous and abundant diagnostic information,so it is deeply respected by researchers at home and abroad,and has become the core of the modern psychological measurement theory.Cognitive diagnostic models(CDMs)are core technologies of realizing diagnostic functions,and directly determine the accuracy and validity of cognitive diagnosis.From the perspective of the model classification,the model metrology characteristics,the model assumptions,the applicable scope of the model and the mathematical transformation relationship between models,the paper sums up,reviews and evaluates more than 10 kinds of common parameterized model of cognitive diagnosis,and provides an important reference for the actual users in cognitive diagnosis model comparison and selection.【期刊名称】《江西师范大学学报(哲学社会科学版)》【年(卷),期】2017(050)001【总页数】17页(P88-104)【关键词】认知诊断评估;认知诊断模型;链接型与分离型;约束化模型;一般化模型【作者】高旭亮;涂冬波【作者单位】江西师范大学心理学院,江西南昌 330022;江西师范大学心理学院,江西南昌 330022【正文语种】中文【中图分类】G449认知诊断评估(cognitive diagnosis theory,CD)是认知心理学与心理计量学(心理测量学)相结合的产物,其目的是探讨个体内部的心理加工机制,实现对个体认知发展实况(含优点与缺陷)的诊断评估,以促进个体全面发展。

认知诊断理论概述

认知诊断理论概述

分数报告: 属性掌握概率 学习之路
认知诊断模型: 模型选择 参数估计 统计收敛性 模型数据拟合检验
认知属性分析: 属性提取 属性层级关系界定 测验Q矩阵标识 测验题目编制
学习优势剖面图
16
常见的认知诊断模型
认知诊断模型 (Cognitive Diagnostic Model, CDM)
LOGO
认知诊断理论概述
认知诊断理论概述
认知诊断理论的背景与基础
Q矩阵的重要地位与规则空间模型 常见认知诊断模型介绍
1
2 3 4 5
认知诊断评估的结果报告
认知诊断评估对我国学业评价的启示
2
1、认知诊断理论的背景与基础
3
认知诊断理论的背景
教育问责制 (accountability in education)
点击添加标题
3PLM 题目参数值
匹 配 分 类 间接匹配:匹配 (θ, ζ) 对 理想反应模式 RSM (Tatsuoka, 1983, 1985)
24
认知诊断模型—规则空间模型
• 规则空间模型的主要步骤
Q矩阵理论部分
1. 确定属性与题目间的关系并编制事件Q矩阵 (incidence Q matrix) 2. 界定属性间的先决关系 (prerequisite)
9
认知心理学的发展 (续)
认知诊断的定义
对被试在测验所测属性或知识点 (如通分、借位与约
分等) 上的掌握水平进行分类 (掌握还是未掌握) 通过认知诊断方法或模型确定被试的不可直接观测的 认知结构或知识状态,确定被试已经掌握哪些属性, 哪些属性未掌握需要补救
除了二分,还可 以是多分的情况
认知诊断模型nida模型nida模型简介与dina模型一样也是非补偿性模型不同于dina模型的参数建模于题目水平nida模型的参数建模于属性水平每个属性都有一个猜测和失误参数认知诊断模型nida模型nida模型项目特征函数认知诊断模型dino模型dino模型简介不同于dina模型和nida模型它属于补偿性模型dino模型的参数建模于题目水平认知诊断模型dino模型dino模型项目特征函数认知诊断模型gdina模型gdina模型简介gdina模型是dina模型的一般化通过设计矩阵和矩阵的转换gdina模型可以简化为其他一些常用的模型如dina和dino等gdina模型可以将所有潜大类分为个潜在组是正确作答题目j所需要的属性个数每个潜在组表示一种简化的属性向量每个潜在组都有相伴随的正确作答概率认知诊断模型gdina模型gdina模型简介认知诊断模型gdina模型gdina模型的项目特征函数对于identity链接方式gdina模型的正确作答概率公式可以分解为属性的主效应以及属性间的交互效应之和红框标识的系数一般为非负蓝框标识的可取任意值认知诊断模型gdina模型gdina模型的其他链接方式及特例除了identity链接方式还有log和logit链接方式identity链接方式下的全模型等价于log和logit链接下的全模型dina模型和dino模型是全模型的特例acdmrrum和llm分别是identitylog和logit链接方式下的加法模型认知诊断模型gdina模型gdina模型的其他链接方式及特例续dina可通过在gdina中设定除了和其他参数都为0得到并令和dino可通过在gdina中设定其中得到并令认知诊断模型gdina模型gdina模型的参数估计也采用mmleem算法但与dina的稍有不同dina模型中是将似然函数直接对参数求偏导令其为0解得参数值gdina模型的参数比较多直接对参数求偏导的方法计算量太大太复杂于是采用两阶段的方法计算先将似然函数对概率值p求偏导令其为0求出p的估计值再在所有掌握模式下用最小二乘法获得参数估计值认知诊断模型模型数据拟合

认知诊断中如何利用关联规则对项目属性自动标识

认知诊断中如何利用关联规则对项目属性自动标识

3关联规 则在认知诊 断中的应用 1几种常用的认知诊断模型
1 1 则空 间模型 ( u p c d l S .规 R l S ae Mo e,R M) e
对 于 一 个 题 库 来 说 , 常 需 要 增 加 新 经 子项 目。 的 项 目来 对题 库进 行 扩 充 , 而 , 的 项 目 然 新
学 术 论 坛
Sic a eh IYfoao Hr§ cre n cno lvtI e ! e d丁 o g r f a l n q : i d
认 知 诊 断 中如 何 利 用 关 联 规 则对 项 目属性 自动标 识
罗凌云 杨赛华 邝铮 ( . 江西 师范大学计 算机学 院 江西南 昌 1 3 0 2 : 2 江西 省高安 市第Z 学 江西高 安 3 0 0 ) 20 2 . s J x 3 8 0 摘 要: 利用属性层级关 系( AHM) 进行认知诊 断 ̄ - 个优 点是 有利于指导测验 的鳊制和开发 , e- 但是在 实际应 用过程 中由专 家指 定属・  ̄/ I t / ' - 关 系不 利 于题 库 的 扩 充 。 文采 用 关 联 分 析 的 方 法 , 用相 关 系数 消 除 负关联 现 象 , 过 找 出 每 个 项 目的 子 项 目, 新 增 项 目的 属 性 进 行 本 利 通 对
对 近 年 来 , 们 越 来 越 关 注 针 对 人 类 学 某 种 意 义 上说 , 所 测 项 目属 性 进 行 自动 人 中“ 知失 误 ”c g i v u s行为 的研 标 识 , 认 (o n t e b g ) i 也就 是 对 项 目进 行 ‘ 知 诊 断 ’ 通 过 认 , 究, 认知 诊断 测验(ig otc tsig 逐渐兴 被 试 群 体 的 得 分 分 布状 况 来对 属性 的 标 识 da n si et ) n 再 起 。 常 把 对 个 体 知识 结 构 、 工 技 能 或认 以 及 属性 的 层 级 关 系 进 行 认 定 , 利 用 更 通 加

留学生汉语基本颜色词习得模式诊断研究——以规则空间模型为工具


万物 , 甚至于 自己内心的感受 。在很 多民族语 言的 词汇中, 颜色词都是非常活跃 的重要组成部分。在 汉语 中 , 颜 色词词 汇 量 丰 富 , 系 统性 强 ; 那 些 稳 定 而 能产的基本颜色词 , 作为词根, 构成了以其为核心的 大批颜色词, 形成一个个小 的颜色词词群。对基本 颜 色词 的认 知 , 是对 整 个 现 代 汉 语 颜 色词 系统 认 知

要: 认知诊断方法能够 对留学生各 不相 同的基本颜 色词 习得模 式进行描 述 , 并且 对补救
提 供建议 。本文 以规则 空间方法对留学生现代 汉语普通话基本颜 色词 的习得模式进行诊 断 , 并提 供“ 学习之路 ” 供补救参考 。研 究发现 , 规则空 间模 型对 汉语 作为 二语 的颜 色词 习得研 究适 用, 研 究中的被试全部成功 归类 ; 对 于汉语基 本颜 色词基本 义和 日常 生活 中较 为常见 的转义 , 留学生 习 得 比例也较 高; “ 学习之路 ” 是 一种 实用 的提 示学习者补救路 径 的方法 , 对 于下一步 的 学习和教 学
日裔美籍学者tatsuoka提出的规则空间模型rulespacemodel简称rsm是目前认知诊断模型中比较成熟的一个它使用二元属性模式来定义考生在所考察领域的认知结构并运用统计模型识别技术对被试作答反应背后隐藏的认知模式进行判别进而对所有个体在每个属性上的认知状况进行诊断和描述bucktatsuokaamp
有直接的指导作 用。
关键词 : 颜 色词 ; 习得 ; 认知诊断 ; 规 则空间 ; 补救
中图分类号 : B 8 4 2 . 5 文献标识码 : A 文章编号 : 1 0 0 3— 5 1 8 4 ( 2 0 1 4 ) 0 1 — 0 0 2 9— 0 7

常见的认知诊断模型及其比较


认 知 诊 断评 估 是 教 育评 估 领 域 一 个 新 的 发 展方 向, 它 主要 是 通过 对 学 生 在 一 组精 心 设 计 的 题 目上 的 作答 反 应 进 行 分 析 , 推 测 学 生在 测 验 所 涉 及 的一 组 知 识 或技 能 ( 属性 ) 上 的 掌握 情 况 , 从 而为 学 生个 别 辅 导 、 教 师教 学 反 馈 提供 依 据 。认 知 诊 断评 估 的 关 键 是 构 建 反 映 学 生 问题 解 决 过 程 的 Q矩 阵并 选 用适 当的认 知诊 断模 型 。 认 知 诊 断模 型 是 一 种 通 过 描述 学 生 的属 性 掌握 情 况 与 其 题 目反 应 之 间关 系 以 实 现 认 知 诊 断 功 能 的测 量模 型 ,属 性 是 测 验 所 考 察 的知 识 或 技 能 的统
阶段性成果 。
范士青 / 华 中师范大学心理 学院博士生 , 湖北第 二师范学 院教育科 学学 院教师 研 究 方 向 为 教 育 心 理 学 与 学 校 心 理 辅导 。( 武汉 4 3 0 2 0 5 )

刘华 山 / 华 中师范大学心理学 院教授 , 博士生导 师。通讯作 者。
理 论 与 技 术 ●
教 育
测 量 与 评

常 见 的认知诊 断模 型 及其 比较
范 士青 刘华 山
【 摘 要 】认 知诊 断模 型是 连接 学 生的 内在属 性 掌握 模 式和 外在题 目 反 应之 间的桥 梁 , 是教 育评 估 领域 一 个
新 的发展 方 向。 经过4 0多年 的发 展 , 认 知诊 断模 型 目前有 6 0 种左右, D I N A、 D I N O、 N I D A、 N I D O、 R— R U M和c — R U M ̄ _ 其 中最常 见的模 型 。这六 种认 知诊 断模 型适 用 于题 目计 分 、 属性 掌握表 征 和题 目对 属性 的 考查 都采

认知诊断学习文档

一、名词解释认知诊断:认知诊断是基于认知加工过程的诊断,是对个体认知加工过程中所涉及的认知属性的诊断。

从广义上说,认知诊断是建立观察分数和被试的内部认知特征之间的关系;从狭义上说,是指在测试中,按被试有没有掌握测试所测的技能或特质来对被试加以分类。

而所谓测试的认知诊断,不但了解学习者的能力知识结构,还能解释其通过知识掌握了哪些实际技能,在学习过程中采取了何种学习策略。

认知属性:认知属性一词用来描述被试正确完成任务所需的知识、技能、策略等,它是对被试问题解决心理内部加工过程的一种描述。

属性层级关系:认知属性不是独立操作,而是从属于一个相互关联的网络,认知属性间可能存在一定的心理顺序、逻辑顺序或者层级关系。

属性层级关系又四种基本类型:线性、收敛、分支、无结构。

这四种基本类型可组合为更复杂的网络层级关系。

Q 矩阵理论:Q 矩阵理论主要是确定测验项目所测的不可观察的认知属性,并把它转化为可观察的项目反应模式,将被试不可直接观察的认知状态在项目上可观察的作答反应相连接,从而为进一步了解并推测被试的认知状态提供基础。

即: 确定属性层级关系→连接矩阵→可达矩阵→事件矩阵→缩减实践矩阵→典型属性矩阵→典型项目反应模式这一过程统称为Q 矩阵理论。

Q 矩阵:Q 矩阵指描述测验项目于属性间关系的矩阵,它一般由J (J 指测验项目数)行K (K 指测验测量的属性个数)列的0—1矩阵组成,若1=jk Q 代表项目j 测量了属性k ,若0=jk Q 代表项目j 未测量属性k 。

A 矩阵(邻接矩阵)R 矩阵(可达矩阵)直接先决属性A1→A2→A3:A1为A2的直接先决属性间接先决属性A1→A2→A3:A1为A3的间接先觉属性理想掌握模式即所有可能存在的知识状态//利用扩张算法获取理想掌握模式p9理想反应模式指被试在不存在任何失误和猜测等误差条件下对项目的作答反应情况.即若被试掌握了项目考核的所有属性则被试答对该题,若被试至少有一个项目考核属性未掌握,则被试答错该项目。

认知诊断理论及其应用

认知诊断理论及其应用作者:郭磊来源:《心理技术与应用》2013年第02期摘要:只能提供单一总分结果的测验已不能满足当前教育教学的需求。

认知诊断理论的出现弥补了只能报告单一总分的缺陷,可提供更加丰富的测量信息,即能够测量出学生在学科知识点上的掌握情况,为教师的教学活动提供个性化的指导。

本文主要介绍了认知诊断的发展历程、相关理论、主要的认知诊断模型、测验编制方法、效度检验及其在实践中的应用等六个方面,以期认知诊断理论能被更多的心理学工作者熟悉,推动该理论日后的发展及运用。

关键词:认知诊断理论;认知诊断模型;测验编制;效度;应用当前大部分测验只能提供单一的测验总分或能力值,但是具有相同分数或能力值学生的认知结构(或称知识状态)可能不同,因此,对他们采取的教学补救措施是不一样的。

由此产生了一个很重要的问题:如何才能精确地测量出学生的知识状态呢?认知诊断理论能够回答该问题。

一、认知诊断的发展理论和实际需求推动了认知诊断的快速发展。

理论上,认知诊断的计量模型可以提供一个有效机制来验证认知理论;实践中,美国政府于2001年提出的《不让一个孩子掉队》的法案更是促进了认知诊断的蓬勃发展。

其实早在20世纪80年代,就已经有众多学者开始注重认知科学和心理测量学的结合对教育领域的指导作用。

Glaser曾批判传统的教育测验缺乏对被测心理特征的关注[1],Snow和Lohman在其编写的《认知心理学对教育测量的影响》中曾预测,教育测验可能会要求提供更多的学习诊断及教学指导信息。

Nichols首次将认知科学和心理测量学的结合称作认知诊断评估,并在1995年出版专著《认知诊断评估》,从而使得该名称沿用至今[2]。

Stout认为在21世纪,认知诊断将会成为新的测验范式[3],并得到广泛的研究。

许多认知诊断研究者先后出版专著,从各个角度详细地介绍了认知诊断理论及其应用,其中包括:Leighton和Gierl在2007年出版的《教育认知诊断评估:理论及应用》[4],Tatsuoka于2009年出版的《认知评估:规则空间简介》[5],以及Rupp等人于2010年出版的《诊断测量:理论,方法及应用》[6]。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

同一规则(不论正确与否)的情况下的得分模式。由于猜测或失
误,被试的反应模式会偏离理想反应模式。Tatsuoka(1987)给出 了这些反应模式的统计分布[4]。
RSM 通过分析测验项目得到描述项目与属性的关系的二
值关联矩阵 Qk×n (k 是属性数,n 是项目数),Qk×n 的第 i 行第 j 列 元素 qij 若为 1,则表示项目 j 具有属性 i,反之 qij 则为 0。 Tatsuoka 用布尔代数相关性质把不可观察的属性掌握模式转
即产生(0- >1)的错误,概率为 Pjk("),其中 Pjk(#)是第 k 个理想反
应模式(其对应的能力值为 $)答对第 j 题的概率,Pjm(%)类同。记


! ! PjExpected(&)= Pjk(θ) [1- Pjm(’)]表示发生了 K 个从(0- >1)的错
k=1
m=1
误,M 个从(1- >0)的错误时的概率,把 Vα 归到使 PjExpected(()值 最大的类中。
t(1),...,t(2)]'。通过计算可知:f(x)的期望值为 0,方差 varf(x)=


!pj(3)qj(4)[pj(5)- T(6)]2。定义 7=f(x)/[varf(x)] 2 ,从而得出(8,9)。
j=1
Tatsuoka 把由 : 和 ; 构成的二维空间称为规则空间,这样项目
反应模式就转化为空间中的变量。
0 引言
无论是观察分数还是能力分数都只是对被试的一个大概 描述,对具有相同分数或相同能力的学生,却有不同的知识状 态及不同认知结构这一现象无法做出合理解释;相同分数的个 体间差异无法区分;被试掌握了什么知识,未掌握什么知识等 信息无法反映。而认知诊断能对被试在完成测验项目时的认知 过程或心理加工过程进行诊断和评估。
4 结束语
本文介绍了 RSM 和 AHM 模型,并对这两种模型的归类
计算机时代 2008 年 第 6 期
·3·
基于 ArcXML 的 We bGIS 原理及相关技术
王朋飞,赵 强 (华北电力大学计算机科学与技术系,北京 102206)
①按此法由 16 个理想反应模式 (包括全 0 的模式) 产生 1000 个被试的得分阵 X1,用参数估计软件 ANOTE1.60 估计反 应模式对应的能力参数和项目参数;②根据能力值估计值 *、项 目区分度估计值 a 和难度估计值 b 可计算每一理想模式对每 一项目的答对概率 P 和答错概率 Q,其中 P=(1+exp(- Da(+- b)))-1 (其中 D=1.7),Q=1- P。然后利用模式变体思想对理想模式进行 变体,一个理想模式可以得到 3 个模式变体,而全 0 和全 1 模 式只能各得到 1 个模式变体,这样可得 44 个新模式,其中有 12 个模式与理想反应模式相同,因而只有 22 个非理想反应模式; ③由 38 个反应模式 (16 个理想模式、22 个非理想模式) 产生 2000 个被试的得分阵 X2,用 ANOTE1.60 估计反应模式对应的 能力参数和项目参数;④把 38 个反应模式看作观察模式,然后 用各种分类方法把它们归类到 16 个理想反应模式中,38 个模 式的正确归类个数如表 1。
模拟的基本思想是在保证反应模式的总得分服从正态分 布的前提下来产生项目反应模式、估计项目反应模式对应的能 力值和项目参数值。故设计模拟方法如下:
产生得分阵方法:求出每个反应模式的总得分及得分人数 K,总得分按从小到大排序,把区间[- 3,3]平均分成 K 个小区 间,每个小区间上根据正态分布函数求出相应的面积就是该类 被试占总人数的比例,区间[- 3,3]之外的面积平均分给得分最 小和最大的,总人数乘以被试比例就可以得到该类被试人数, 其中得分相同的模式平均分配人数。
1 规则空间模型(RS M)
Tatsuoka 的 RSM 是一种认知错误诊断模型,是将被试在 测验项目上的作答反应划归为某种与认知技能相联系的属性 掌握模式的统计方法[5]。模型的一个基本假设是测验项目可以 用特定的认知技能(又称属性)描述,属性包括被试正确求解测 验项目必须具有的各方面的能力,如技能、策略、加工过程或知 识点等。属性掌握模式一般不可观察,要把它转化为与之相对 应的可观察的理想项目反应模式。把观察模式归类到理想模式 就能诊断出被试的知识状态。这里“理想”是指始终一贯地使用
至终用错误规则导出的反应模式。
⑤ 根据被试的观察反应模式,把被试归类到相应的理想
项目反应模式中。分类方法有两种,称为方法 A 和方法 B。
方法 A:把观察反应模式 Vα 与所有的理想项目反应模式
Vt 逐元比较,记 Dtα=Vt- Vα,当 Dtα 元素 dtαj=0 时,即无错;当
dtαj=1 时,即产生(1- >0)的错误,其概率为 1- pjm(!);当 dj=- 1 时,
计算机时代 2008 年 第 6 期
·1·
用规则空间模型和属性层次方法进行认知诊断*
祝玉芳 1,邓丽萍 2,周世科 1,丁树良 1 (1. 江西师范大学计算机信息工程学院,江西 南昌 330022;2. 江西赣江职业技术学院)
摘 要:认知诊断能区分分数相同的被试间的差异,它被视为新一代的心理与教育测量学研究的核心之一。规则空间模 型是最有影响的诊断模型之一,属性层次方法是其一种变体。文章介绍了规则空间模型(RSM)和属性层次方法(AHM)的 理论和应用,并对这两个模型进行了比较研究,用蒙特卡洛模拟比较了规则空间和属性层次方法的归类优劣。结果表明, 属性层次方法中的方法 A 最好;规则空间的归准率比属性层次方法中的方法 B 高,但比方法 A 低。 关键词:认知诊断;规则空间模型(RSM);属性层次方法(AHM);分类法;蒙特卡洛模拟
t(#)=
1 n
pj($)。
j=1
③ 计算异常反应模式指标(Cautsion Index)%,它反映实际
反应模式与理想反应模式间的差异。& 的计算方法如下:f(x)=(P
(’)- X)(P(()- T()))',其中 P(*)=(p1(+),p2(,),...,pn(-)),X 是被试的
项目反应向量。T(.)是项目答对概率的均值向量,即 T(/)=[t(0),
国内目前对 RSM 的研究比较少。国外对 RSM 的研究集中 在两个方面:一是模型的理论研究,主要对模型中的一些评价 指标及 RSM 维度进行研究;二是模型在考试与评价实践中的 应用。关于属性层次方法的研究目前国内还没有。因为国内对 RSM 和 AHM 研究很少,可它们在认知诊断应用中又非常重 要,所以本文介绍 RSM 和 AHM 的理论及应用方法,以便应用 于实践中。本文首先介绍 RSM;然后介绍 AHM;接着比较了 RSM 和 AHM 的不同之处,并用蒙特卡洛模拟比较 RSM 和 AHM 的归类优劣;最后进行了总结和讨论。
化为可观察的理想项目反应模式,然后按如下的步骤进行判别
分类,诊断出被试的知识状态:
① 通过参数估计法求出每一组项目反应模式(包括理想和
观察的)对应的能力值 !,及每个项目的参数(如区分度 a、难度 b
以及猜测度 c)。
② 计算某种项目特征曲线的项目答对概率 pj(")(j=1,2,...,n)、

! 被试的真分数
④ 将理想反应模式得到的 Ri=(<Rj ,=Rj )作为纯规则点,再计
算被试 i 作答反应模式对应的规则点 Xi=(>Xj ,?Xj )与所有纯规则

Ri=(@Rj
,ARj

) 的 马 氏 距 离 :D ij
=(Xi-
Rj)' ∑ - 1(Xi-
Rj)
(i=1,2,...,N;
j=1,2,...,k), 其 中 ∑ 是 变 量 BR j 和 F (XR j ) 的 协 方 差 阵 ∑ =
2 属性层次模型(AHM)
Leighton 等人[8]指出,RSM 没有强调认知属性的层级关系,
也没把该关系指定在邻接矩阵中。AHM 在此基础上进行了改
进,同时他们也提出了两种分类方法。AHM 把认知理论和心理
测量结合了起来,只要属性层级关系是正确的,就可以根据简
化 Q 阵来编制测验项目。属性的层级关ቤተ መጻሕፍቲ ባይዱ是否符合被试观察的
反应模式,可以通过 HCI 指标来检验[7,8]。
AHM 诊断被试知识结构的具体过程如下:
① 确定待考察的属性、个数(假设有 k 个)及其层级关系。
② 由层级关系得出 k 阶邻接矩阵 A 来表征属性间的直接
关系,进而得到可达阵 R 表征属性间直接或间接关系。
③ 构造 k 行 2k- 1 列矩阵 Q(k),即 Q(k)中包含所有的属性
组合(扣除不含任一属性的组合),把 Q(k)中不符合 R 中关系的
列去掉,求出简化关联矩阵 Qr。 ④ Qr 转置得到被试属性掌握模式矩阵 E,再得出期望项
目反应模式全集。这里的期望反应模式跟 Tatsuoka 的 RSM 中
的理想反应模式是相似概念,不过 Leighton 等人定义的更严
格,期望反应模式只含正确应用规则所得到的反应,不含自始
应模式中,即归类到最可能发生该类错误的模式中。下面用蒙 特卡洛模拟比较 RSM 和 AHM 的归类优劣。 3.1 实验方法
本文采用 AHM 中 16 种理想反应模式[8],并对其变体讨论 分类结果。对于每一种理想反应模式,得 1 分的项目计算答对 概率为 P,将 P 最小的项目得分改为 0 可得一种理想模式的变 体;得 0 分的项目计算答错概率为 Q,Q 最小的项目得分改为 1 又可得到一种新的变体;再把 P 最小的项目得分改为 0,Q 最小 的项目得分改为 1 得到一种变体。除去与理想反应模式相同的 模式,得到的理想反应模式的变体称为“非理想反应模式”。本 研究把理想反应模式和非理想反应模式的正确归类个数作为 分类方法的优劣指标。 3.2 AHM 中参数估计的模拟方法
相关文档
最新文档