考试系统中的组卷算法
网络考试系统中的命题库设计与组卷算法——以“计算机应用基础”课程为例

N T技术 基 础 之 上 的 。尽 管 A P N T支 持 多 种 E S.E
二、 命题库 的设计
命题 库是课 程 网络考 试 系 统 的核 心 , 设 计 的 其 好坏 直接 影响 了题库 子 系统 的实 现 以及试 卷管理 子 系统 中的组 卷 功能及 考试 功能 的实现 。建立 具有 合 理结 构 的命 题 库 , 要 对 课程 的教 学 目标 及 考 核 重 需 点及 方式 有深 入 的了解 , 以此 确 定命 题 的各 种 属 性
中图分类号 :P 9 T3 1 文献标志码 : A
’
文章编号 :6 2— 6 4 2 1 】 1 0 0— 17 20 (0 2 0 —05 0 4
一
、
刖
舌
及 结构 , 而 完成 题 库 系统 的 数 学模 型 。一 旦 题 库 从 的数学模 型得 以确 定 , 可 以直 接 进行 题 库 子 系 统 就
这 些试 题 的科 学性 和有效 性 , 还要 组 织 大量 的被 试
的纸张 , 从而减少对 自然资源的消耗。
以 “ 算机 应 用 基 础 ” 程 的 网 络考 试 系统 为 计 课 例 , 个较 为完 整 的 网络 考试 系统应 包括 题 库 子 系 一 统 、 卷管 理子 系统 、 试 过 程控 制 子 系 统 、 师及 试 考 教 考生 管理 子系 统 、 阅卷 管 理 子 系统 等 。对 于 一个 具
样 本进 行抽样 测试 , 而对试 题参 数 的有 效 性进 行 进
校正。
( 数据 库管理 系统 的选 择 一)
一种考试系统组卷算法设计

2 算 法概 述
组卷算法是 网络考试 软件 的关 键技术 之一。 如何实现 自
选择现行通用的Ln x + A a h 十 P P 式, iu p ce H模 主要是 动组卷 、 组卷 是否高效优质 , 这是决定考试 系统优劣的重要 因为版 权保 护的问题 , 尽可能选择较 少争议的共享软件 进行 因 素 。 面 上 的网 络 考 试 系 统 一 般 采 用 随 机 搜 索 法 、 溯 试 市 回 探法和遗传算法等 “。
同时考虑到考试规模较大、 参与人数 多, 系统要 且 伴随着计算机应用 的曰益推广和深入 , 网络考试软件也 二次开发 。
逐 步 地 走 向了人 们 的 视 野 之 中 , 其 是 大 中 专 业 院 校 和 一 些 求较高 , 尤 数据库系统选择微 软的S L e v r 0 5 Q S r e 2 0 作为支撑 专业 考 试 机 构 , 是 频 频 使 用 。 对 于 传 统 的、基 于 纸 和 笔 平 台。 更 相
. 基 金项 目: 江 育 0 年教育 术研究 课题“ 于Bபைடு நூலகம்架 21 随机搜 索法 浙 省教 厅2 0 1 技 规划 基 / 构 S
的 网络 考试 系 统研 究与 实现” ( 目编号 : B 5) 浙 江 农业商 贸职 业学 项 305, 院科 研 基金资助 。
随机搜索原理是根据组卷约束参数 , 利用随机函数生成 相关试题标志号, 将对应试 题放 入试卷 中。 此过程不断重复 , 直至 组卷完 成或 题量不足 导致 组卷失败 。 种方 法原 理简 此
型结构简单 、 时间要求较高; 我们 采用随机搜索和模 糊匹配 回溯试 探法 , 实质是对 问题答案的穷举。 其 它是在 解决 相结合的方法进行组卷。 其过程先是参照用户的基本组卷要 f题 的方法集合中, 司 任选一条路往前走, 能进则向前进入, 不 求 , 设计出本 次组卷的数学 量化模 型; 而后模 糊弱化部分次
在线考试系统中组卷算法的比较与选择

t lgn  ̄' r,l l
占据存 储空 间大 和计 算量 大 , 而导 致性 能下 降 。 从 采用 分段 的浮点 数编码 , 染色 体形 如 (1 , , )其 中a o, … 勰 , i 表示试 题库 中试题 的题号 ,为试卷要 求 的试题数 。 n 基因按照题 型
3北 京 天 奈 科 技 公 司 , 京 1 0 2 ) . 北 0 0 5
摘 要 : 在对 试 卷 结构作 数 学描 述 的前 提 下 , 用遗 传 算 法 的 自适 应 全局 优 化特 性 , 利 在传 统 组 卷 算 法基 础上 设 计 出
了 自适 应 遗传 算法 , 它能 克服 某些传 统 算法 的缺 陷, 正意 义上 实现 智 能组卷 。 真
关键 词 : 传 算法 ; 遗 自适 应 ; 能 智 中图分 类号 :P 1 T 32 文献 标识 码 : A 文章 编 号 :6 2 7 0 (0 8 0 — 0 1 0 1 7 — 8 0 2 0 )8 0 6 — 3
有序排序 , 并且将 同类 型的试题放 在同一个 区间内 , 图l 示 如 所
31 教 学 层 次 比 例 的 约 束 .
库 中试 题 的数 目。 色体 上 的每一 个基 因代 表对 应 的试 题是 否 染
被 挑 选 :为 该 试 题 被 挑 选 ,为 该 试 题 没 有 被 挑 选 , 么 每 一 个 l 0 那
染 色体 代表 一组 选题 结果 。 如 . 例 试题 库 中共有 l 道题 , 中第 0 其
=
∑l %te ( ∑(x p ) y ) × p~
‘ = 1l = 1 i
p
作 者简 介 : 领 弟( 9 0 , , 孙 1 7 ~) 女 河北 沧 州人 , 河北 工程技 术 高等 专科 学校 讲 师 , 究 方 向为软 件 开发 ; 研 于书 举 (9 9 , , 14 -) 男 北京 人 , 京 工业 大学教 北 授 , 究方 向为 企业 数 字化 、 能信 息 系统 ; 占威 ( 9 0 , 河北 肃 宁人 , 研 智 孙 1 7 ~) 男, 北京 天奈 科技 公 司工程 师 , 究方 向为新 材 料技 术 。 研
组卷算法

M为符合 条件题量
1、将符合条件 V1
V2
V3
V4 …… Vm
的题目加载到
向量vector
2、将题目“洗牌” 实现随机效果
FOR (i= m ;i >1 ; i--){ int j = Random(m-1); 交换Vi 和Vj;
}
3、按顺序取出组卷的题量
并发到考试试卷中
V1 V2 …… Vk
F(x)的值越小说明个体的适应度越高,越符合组卷期望。
遗传算法
选择概率
个体在遗传操作中被选择的概率,适应度越大被选中的概率越大,即 适应度值越小被选中的概率越大
1 / F(xi) P(xi) = ----------------
N
∑ 1 / F(xj)
j=0
遗传算法
流程图
遗传算法
传统遗传算法的不足:
遗传算法
基本的遗传算法可定义为一个8元组:
SGA = (C,E,P0,M,Ф,Г,ψ,Τ)
其中:C为个体的编码;E为个体适应度评价函数; P0为初始种群;M为群体的大小; Ф为选择算子; Г 为交叉算子; ψ为变异算子; Τ为终止条件。
遗传算法
适应度函数:
n
F(x) = ∑ wigi
i=1
n:表示约束条件的维度,如题型、题量、知识点、曝光度等 wi:表示第i个约束维度所占的权重 gi:表示第i个约束维度值与期望值的误差
缺点:相对前面两种算法来说速度慢,不适用于组卷 需求中的第三种情况。
遗传算法
概念 简称GA(Genetic Algorithms),是1962年由美国 Michigan大学的Holland教授提出,是一种模拟自然 界遗传机制和生物进化论而成的一种并行随机搜索最 优方法。主要包括三个方面内容:适者生存、遗传、 变异。
交通行政执法人员在线考试系统组卷算法的设计与实现

交通行政执法人员在线考试系统组卷算法的设计与实现【摘要】本文介绍了交通行政执法人员在线考试系统组卷算法的设计与实现。
在从背景介绍入手,阐述了研究意义和研究目的。
在首先概述了在线考试系统的基本情况,然后详细介绍了组卷算法的设计原理,包括基于知识点的题目难度分析和基于题型的题目组合。
展示了算法实现细节。
在分析了设计与实现的优势,并提出了系统优化的方向,同时展望了未来的发展前景。
通过本文的研究,可以为交通行政执法人员在线考试系统的发展提供理论支持和实践指导。
【关键词】交通行政执法人员、在线考试系统、组卷算法、知识点、题目难度、题型组合、算法实现、设计优势、系统优化、未来发展。
1. 引言1.1 背景介绍交通行政执法是维护社会交通秩序、确保公共安全的重要工作之一。
随着社会的发展和交通工具的不断更新,交通行政执法人员的工作也变得更加繁重和复杂。
为了提高交通行政执法人员的专业水平和实战能力,许多单位开始采用在线考试系统来进行培训和评估。
传统的考试方式往往存在诸多问题,包括考试内容难以更新、题目类型单一、评分不公等。
而在线考试系统则具有随时随地参与学习和考试、题目难度自适应、成绩实时反馈等优势,能够更好地满足交通行政执法人员的培训需求。
设计一套高效、科学的组卷算法对于交通行政执法在线考试系统的建设至关重要。
通过对考试内容的分析和题目组合的优化,可以提高考试的质量和有效性,帮助交通行政执法人员不断提升专业素养和执法水平。
完成。
1.2 研究意义交通行政执法人员在线考试系统是为了提高交通行政执法人员的专业水平和能力,确保他们在执法过程中能够做出正确的决策和处理交通事故。
通过在线考试系统,交通行政执法人员可以定期参加考试,测试自己的知识水平和技能掌握情况,及时发现不足并加以改进。
这对于提高交通行政执法人员的执法水平和工作效率具有重要意义。
研究意义不仅在于提高交通行政执法人员的素质和水平,还可以促进交通行政执法工作的规范化和专业化发展。
考试系统中的自动组卷算法分析与研究

关键词 :考试 系统 ;组卷 ;算法 ;计算机辅 助教 学
Ana y i a Re e r h l ss nd s a c of Aut m a i s Pa r G e e a i go ihm i Ex o tc Te t pe n r ton Al r t n ami ton na i Sy t m se
计 算机 时代 2 1 年 第 8 00 期
・ 3・ 4
考试 系统 中的 自动组卷算 法分析 与研 究★
王鹏 飞 ’ 智 明 ,贺 ,朱 铁樱 ’ (.浙 江广厦 建设 职业技 术 学 院信 息 与控 制工 程 学院 ,浙 江 东阳 32 0 ;2 1 2 10 .江西理 工大 学信 v程 学院) 0_ -
o rs ig c uss fgapn o re,whc rvd sb s fr tahn eom.As a p r o o ue-si e nt cin h bet i ,fi es ih po ie ai o ec ig rfr s at f cmp tr s td is u t ,te ojci t ar s a s r o vy n
摘 要 :考试是教 学过程 中不可缺 少的重要 环节 , 它可以检测教 学效 果和 学生对课 程 的掌握情 况 , 为教学 改进提 供依
据 。作 为计算机辅助教 学的一部分 , 算机 考试 系统 的客 观性 、 计 公正性 、 面性 正受到人们越 来越 多的关注。文章主要 全 分析并研 究了计算机考试 系统 中的 自动组卷算 法。
1 组卷算 法分 析
自动组卷是 考试系统 自 动化操 作的核心 目标之一 , 它要按 设计 , 使得 由计算机所生 成的试卷达到专 家组 卷级 水平 。 自动 照教师 和教学 的要求 , 把题 库 中的试题进行 灵活组 合 , 来组成 组卷 系统 是实现 无纸化考 试 、 考试标 准化 与个 性化 、 程网络 多样 的试题 , 远 并从 根本上避 免雷 同试卷 的出现 ; 而且还 要求试 学 习辅导与在线 测试等的基础 。组卷过 程中 , 的难度分布 卷 中的试题虽然 不同 , 试卷难易程度相 同, 试题 但 考查知识点相 同 , 是否合理至关重要 , 一份好 的试卷应该使考生 的成绩 大致呈正 试卷的结构也相 同。 计算机 自动从 试题 库 中选择试题 , 组成符 态分布 。组卷算法应 该使 知识点的覆盖 范围全面 , 分布合 合要 求的试卷 , 难度 是计算机辅助 教学的重要环节 。如何保 证生成 理 , 选 试题 符合 大 纲要 求 , 分体 现 组卷 的 科学 性 与合 理 的试卷能 最大 限度地满足 用 户的不 同要求 , 具有随机 性 、 所 充 并 科 性 。要想设计一份能够 比较全 面 、 准确地测试 出考生掌握 有关 学性 、 合理性 , 实现 自动组卷 的一个难 点 。常见 的 自动组 卷 是 知识情况 , 合教 育测量学上 的难 度 、 符 区分度 、 信度和效 度等指 算法 有以下三种 。
基于遗传算法的考试系统组卷算法设计

试卷难度计算公
式如下 :
组卷算 法是针对考 试系统 中的组卷 问题 所提 出的一 种
d 一 =1
式(
× ). /
( 2 )
解决问题的算法, 该算法会根据考试系统对组卷 问 题所提出 的要求' 采用遗传算法思想, 合理和快速地生成相应的试卷,
因此’ 研究组卷算法的关键在于研究相 关的试题参数 和组卷
周富肯
Z u ho Fu en k
( 南海东软信息技术职业学院计算机系,广东 佛山 580) 200
(ea t e t o o pt r S i n eN na e s f n t t t f If ra in T cn l g ,G a g og F s a 2 0 0 D p r m n f C n u e c ec ,a h iN uo t Is i ue o no m t o e h o oy u nd n oh n 5 80 )
2 , 试 ; 是 i试 的 度 数 ) 是 卷 焘D 第 道 题 难 系 ; 中 社
。
s m是第 i 道试题的分值; 是试卷的总分; 表示该试卷有
道 试题
目标’ 再结合遗传 法 来解决 问题 。
・
( 2鉴别 度: ) 是最大 限度区分被试者 的特性 和能力 的指
标
,
试题参数 说明
捅
要 : 文分 析 了考 试 系 统 中的 组 卷 问题 , 合 遗 传 算 法 , 算 法 预 处 理 、 码 方 法 、 始 化 群 体 、 应 厦 函 数 、 择 算 本 结 从 编 初 适 选
子、 交叉算子和变异算子这 几个 方面, 详细地研 究 了 如何采用遗传算法解决组卷问题 。并且通过实验数据 , 与随机抽取算法和
浅谈网络考试系统组卷算法的设计

2 、常 用 组 卷 算 法 的 简 介及 分析
比较 常用 的组 卷算 法有 随机 组 卷 算 法 、 糊 组 卷 算 法 、 溯 试 模 回 探 算 法 以及 遗 传 算 法 等 。
21随机 组 卷算 法 . 随机组卷算法先根据实际需求确定抽取试题 的控制参 数, 然后 根据参数随机从试题 库中抽取符合条件 的一道试题存入试卷表 中, 循环执行此过程直到试题总分等于设定的分值即可完成组卷 。 随机 组卷算法简单 , 便于实现。 该方法适合于组卷控制参数 较少 的情况 ,
1、 引 言 随着计算机技术与网络技术的高速发展 , 网络技术开始在教育 领域 加以广泛应用 , 其中一方 面的应用就是网络考试 。 利用计算机 网络 技术实现的计 算机网络考试取代传统方 式的考试 已成 为一 种 趋 势并且在很多行业领域 已经得到 了比较广 泛的应用 。 然而 , 目前 在包括我们学校在 内的很多院校 内部的教学活动 中, 每个学期例行 的考试依然采用传统 的基于纸和笔的考试 形式 , 采用此形式院校要 耗费大量 的资源 去编 制题 目、 印刷卷 纸、 组织考试 、 监考 、 改试 卷 评 和 分 析 统 计 考 试 结 果 等等 , 作 量 大 、 间 长 、 析 统 计 效 率 低 , 工 时 分 对 于学校的人力 、 物力 、 财力都是一个 很大的消耗。 因此 , 开发适合我 们院校 内部各科 目考试使用 的网络 考试系统显然具有较强的实用 价值 。 在 网络考试 系统 的开 发过程 中 , 组卷算法 ( 即考试系统从海量 试题 库中抽取一定量的试题组成一份试卷的方法 ) 的设 计是 系统 中
数学理论以及人工智能技术来 实现组卷 。 组卷时用一定的数学矩阵 来表示各种组卷参数 , 接着通过计算机采用“ 消矩阵” 的方法 , 随机 地 由试题 库中逐一选取符 合要 求的试题 。 直至组卷参数矩 阵基本都 变为零矩 阵, 从而完成试卷组合过程 。 模糊组卷 算法相 比随机 算法 较为复杂 , 实现起 来比较 困难 。 23回 溯试探 算法 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5 考试系统中的组卷算法5.1遗传算法概述5.1.1 遗传算法的基本概念遗传算法(Genetic Algorithm.GA)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法【27】。
所以,遗传算法吸取了自然界中“适者生存,优胜劣汰’’的进化理论,为解决许多传统的优化方法难以解决的优化问题提供了新的途径。
由于遗传算法的整体搜索策略和优化搜索方法在计算中不依赖于梯度信息或其他辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的鲁棒性。
如今,遗传算法不论是在算法设计上还是在基础理论上,均己取得了长足的发展,已成为信息科学、计算机科学、运筹学和应用数学等诸多学科所共同关注的热点研究领域【281。
遗传算法作为一种概率搜索算法,借鉴了生物学中自然选择和遗传机制的高度并行、随机、自适应的性质,它利用某种编码技术作用于被称作染色体的二进制数据串,其基本思想是模拟由这些染色体组成的群体进化过程。
由于遗传算法是由进化论和遗传学理论相结合而产生的直接搜索优化算法【291,因此,在遗传算法中也借鉴了许多生物学中的术语。
(1)个体(Individual):也称基因型个体,个体是遗传过程中带有遗传特征的实体,也是遗传算法中的所处理基本对象和结构。
(2)基因(Gene):基因是携带遗传信息的基本单位,用于表示个体的特征。
(3)位串(String):与遗传学中的染色体的概念相对应,是个体的表现形式。
(3)种群(Population):一定数量的个体的集合叫做种群。
(5)群体规模(Population Size):在群体中个体的数量称为群体大小。
(6)适应度(Fitness):适应度表示某一个体对于生存环境的适应程度,对于生存环境适应程度较高的个体将获得更多的繁殖机会,而对生存环境适应程度较低的物种,其繁殖的机会就会相对减少,甚至逐渐灭绝。
(7)遗传操作(Genetic Operation):遗传算法是一种群体型操作,该操作以群体中的所有个体为对象。
遗传操作由选择(Selection)、交叉(Crossover)和变异(Mutation)三个基本操作算子组成。
①选择:根据遗传学的理论,对生存环境适应程度较高的物种遗传到下一代的机会相对较高。
所以在遗传算法中,应用选择算子对群体中的个体进行优胜劣汰操作,父代中适应度较高的个体被遗传到子代群体中的概率较大,而适应度较低的被遗传到子代群体中的概率较小。
②交叉:遗传算法中的交叉算子使得在原始群体中的优良个体的特性能够在一定程度上继续得到保持,而另一方面,又使得算法能够探索新的基因空间,使新的群体中的个体更加多样性。
③变异:变异算子能够对群体中个体串的某些基因位置上的基因值作变动。
遗传算法中,变异算子的应用使得算法具有了局部的随机搜索能力,并且可以使遗传算法始终维持群体的多样性。
5.1.2遗传算法的流程遗传算法的运行过程是一种的典型的迭代过程,遗传算法在整个进化过程中的遗传操作是随机的,但是算法能够有效地利用历史信息来预测下一代期望性能有所提高的寻优点集。
所以,在这一不断进化的过程中,群体中的个体地得以逐代优化,并逐渐地收敛到一个最适应环境的个体上面,即获得最优解。
以下为遗传算法的一般流程。
(1)选择编码策略,将参数集合转换成位串结构空间。
(2)定义适应度函数和遗传策略,并计算交叉概率、变异概率等遗传参数。
(3)采用随机初始化的方式生成初始群体。
(4)计算群体中的个体在通过位串编码后的适应度函数值。
(5)依据设定好的遗传控制参数,使选择、交叉和变异算子作用于群体,产生下一代的群体。
迭代执行,直到群体性能满足需要。
根据算法的流程,在遗传算法的运行过程中,对自变量的编码、初始群体的设定、适应度函数的设计、遗传操作(选择、交叉和变异)、遗传控制参数(包括群体规模、执行遗传操作的概率等)的设定是遗传算法中的核心内容。
5.2基于遗传算法的组卷算法一份高质量的试卷,应该在题型、难度、区分度和知识点分布等各项指标之间达到相对平衡。
并能够最大程度满足用户要求。
所以,组卷问题实际上是一个复杂的多目标组合优化问题,问题的求解精度越高,表明试卷质量越好【301。
而传统的组卷方法往往很难解决这个问题,甚至很难描述这样复杂的带约束优化的问题。
因此,选用一种合理组卷方法,可以保证系统自动生成的试卷能最大程度地满足出题者对试卷的需要,并使试基于遗传算法的考试系统的设计与实现卷具有较高的随机性、科学性和合理性。
此外,在对响应速度要求较高的网络交互环境下,算法的效率也是自动组卷的关键。
在考试系统进行自动组卷的时候,首先要将难度、知识点等相对模糊的要求进行量化,转化成计算机可以理解的要求,然后依据组卷算法从试题库中抽取一定数量并且满足要求的题目组成试卷。
5.2.1 组卷算法的数学模型组卷问题的数学模型是组卷算法的基础。
因此需要在分析组卷问题的基础上建立一。
个性能优良的数学模型。
对于自动组卷功能来说,其要求实现的是通过获取用户的对试卷需求信息后,建立相应的试卷模式,然后根据该试卷模式建立组卷算法的数学模型。
用户的需求对组卷系统来说是一种模糊的约束,因此,首先需要把这些模糊的约束量化成具体的并且能够被计算机识别的量化指标。
考试系统中的所有试题都被存放在试题库中,而题目本身也有其固定的属性,试题各项属性的确定能够直接影响到组卷系统的准确性和效率。
试题的属性指标定量地描述了每一道试题的内在属性、外部特征以及它在考试测试中的功能,是计算机进行自动抽题组卷的基础。
在组卷前,首先要给定的试卷的相关约束条件,例如卷面分数、难度系数、区分度以及不同题型、能力层次和知识点的题目所占比例等,并据其从大量的试题库中抽取出最优的试题组合。
所以,用q代表题目的分值,a:代表题目难度,q代表能力层次,口。
代表题目所考察的知识点、a。
代表题目的区分度,a。
代表题型。
那么,组成一份总共有彤道试题的试卷,如果每道试题有n项属性,就相当于构建了一个肌×刀的目标矩阵S。
S=all a12a21 a22aml am2 ⋯⋯口椰(5.1)目标矩阵S其实是一个问题求解的目标状态矩阵,且目标状态不是惟一的。
目标矩阵应满足以下的约束条件【31】:(1)试卷总分为Z:%%一z=Σ研, (5.2)(2)试卷难度系数为D:D=Σ口,,口,://Σ口订(5.3)●.一”。
‘●-一”(3)Z。
为第P教学要求的分数,教学要求(了解、理解、掌握、应用)和所占分数由用户给定,即教学要求约束。
m中C3j--{:)麓i二;Zp-Ec,,口,, (5.4),=l(4)试卷区分度为Q:Q=睁%檐%\j=l //,=1c5,乙为第g种题型的分数,其中气,=0聊乙=Σc6,‰,=lc6,乙为第办知识点的分数,其中c4,=0:二i:;(5.5)(5.6)Zh=Σc。
,口,。
(5.7)i--I5.2.2组卷算法的设计在考试系统中,采用了基于遗传算法的组卷算法。
遗传算法的几个主要特点,如直接对结构对象进行抽象,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用导向式概率化的寻优方法,能自动获取和指导优化的搜索空间;自适应地高速搜索方向,并且不需要确定规则等都适宜于处理自动组卷的问题。
但是传统的遗传算法首先生成~定规模的初始群体,然后使其中的个体以一定的概率进行交叉与变异,实现个体结构的重组,再按预定的评价函数选择复制优秀个体,组成新的一代,如此循环迭代,以期最终找到满足寻优条件的全局最优解。
但是,这样的算法存在着越道搜索后期效率越低下,并且容易产生末成熟即收敛的情况。
针对系统自动组卷的具体情况,本文主要从适应度函数、初始种群、控制参数等几个方面对遗传算法加以改进,使其能够很好满足各项组卷需求。
(1)初始种群初始种群的特性对遗传算法的计算结果和计算效率均有重要影响,算法要实现全局最优,初始种群在解空间中应该尽量分散。
而在传统遗传算法中,初始种群是随机产生的,所以,为了加快遗传算法的收敛并减少迭代次数,初始种群的生成要满足题型、题量和试卷总分的要求,这样能够有效提高求解速度。
(2)适应度函数在遗传算法中,采用适应度函数值是来评判群体中的个体优劣,一般情况下,适应度函数值越大的个体越好,即表示这个试题的组合的各项约束条件越接近用户指定的理想值。
适应度函数值是遗传算法进行优化所用的主要信息,它与个体的目标值存在一种对应关系。
遗传算法科用适应度值这一信息来指导搜索方向,根据约束条件,建立目标函数为误差函数,另外,根据实际组卷经验,对不同的约束条件可给定不同的允许误差(O.01"-.,0.05),只要试卷个体满足第i项组卷要求的误差在容差范围内,即可认为第i项组卷要求的误差为0,这样以加快搜索到合理解的速度,由目标函数来设计适应度函数,而不需要适应度函数连续或可导以及其它辅助信息。
我们采用以下形式的适应度函数:其中e,(o≤P,≤1)对应为第f项组卷因素对组卷约束程度的归一化相对误差,Ji},(o≤t≤1)为的相应的误差权值系数,适应度函数可以较好的反映求解组卷问题的特征,当试卷个体对各项组卷约束条件的相对误差越小时,它的适应度函数值就越大,则表示试卷个体越接近组卷目标。
(3)遗传算子①选择算子:选择操作指从群体中按个体的适应度函数值选择出较适应环境的个体。
选择将使适应度高的个体繁殖下一代的数目较多,而适应度较小的个体,繁殖下一代的数目较少,甚至被淘汰。
本文采用期望值模型选择机制,首先计算出群体中所有个体期望被选中的次数ⅣJ:M一形(M为群体规模,f为第f个个体的适应值),然/ΣFi/ i=I后根据M的整数部分确定个体f被选中的次数。
然后对Ⅳ『的小数部分作为概率进行贝努利试验,如果试验成功,则该个体被选中。
这样,不但个体适应值高的个体更容易被选中,而且即便是适应值晓得个体也更有可能被选中。
②交叉算子:在遗传算法中,交叉算子将被选中的两个个体的基因按一定的交叉概率,即P进行交叉,从而生成两个新的个体.这里将以上选出的个体进行两两随机配对,对每一对相互配对的个体采用有条件的“均匀交叉”,即两个配对个体的每一个基因座上的基因都按设定的交叉概率P和一定的条件(确保交换后个体仍是有意义的组合)进行交换,并产生两个新个体。
⑧变异算子:变异算子的基本内容是对群体中的个体串的某些基因位置上的基因值作变动。
对变异算子的改进主要是在同一题型段内进行有条件的单点变异,并且变异只针对交叉后的个体。
(4)控制参数交叉是优化新生中的一个重要步骤,在传统遗传算法中,交叉概率只是个常数,但在实际情况中,优良的交叉率与遗传代数间的关系较大。