通过数据挖掘技术预测学生学习成绩

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

d)重 复 上 面 的 步 骤 。
3.B 样条神经网络控制的仿真研究
3.1 控制模型的建立 被控对象串连起来, 以便使期望输出与被
控对象输出之间的传递函数等于 1, 从而在将此网络作为前馈控制器
后, 使被控对象为期望输出。神经网络用于控制有很多种结构, 本文采
用 神 经 网 络 直 接 逆 控 制 。神 经 网 络 直 接 逆 控 制 就 是 将 被 控 对 象 的 神 经
素外, 还有多方面的因素, 最重要的是学习方法。为使学生能提高学习 加入学习成绩 属 性 , 学 习 成 绩 属 性 值 根 据 两 个 学 期 评 定 , 把 百 分 制 换
效 率 , 有 正 确 的 学 习 方 法 , 从 而 提 高 学 习 成 绩 , 本 文 介 绍 了 在 SQL 为上等、中等、较差。这 93 个数据中学习成绩居上等水平的 29 个, 居
43
科技信息
○高校讲台○
SCIENCE & TECHNOLOGY INFORMATION
2007 年 第 22 期

要求: Cm(k)" e(j) ≤1 j=0
主要分为以下几个步骤:
1 初始化: k=0,ω=0 根据需要设定学习率 βi, 衰减系数 C 和允许误 差 ε的值。
2 开始学习训练:
a) k=k+1
绩的因素大致分为: 1)课前预 习 ; 2)按 作 息 时 间 学 习 ; 3)上 课 记 笔 记 ; 4)
课后复习; 5)独立完成作业。然后进行数据采集, 数据来源为山东信息 图1
职业技术学院软件系软件技术专业的两个班。
2.数据预处理 为保证数据质量, 在调查之前对学 生 明 确 调 查 的
从图 1 所示的决策树及结点颜色( 颜色深, 表示( 下转第 102 页)
通过 SQL Server 自带的数据挖掘功能, 利用决策树实现了对影响
学习成绩的关键环节的挖掘, 具体过程如下:
1.数据收集与描述 收集、描述数据是个数据挖掘 工 作 中 相 当 重
要的一部分工作。我们首先找出影响学生学习成绩的多方因素, 然后
从学生角度分析, 刨除智力因素外, 在学习环节上, 将影响学生学习成
10 段, 用四阶 B 样条函数作为神经网络控制的基底函数时, 其在输入
空间上的分布具体用如下式子表示:
X-3=- 0.3 X-2=- 0.2 ... X13=13 权值为行矩阵, 项数为 13, 令:
λ0=X- 3 λ1=X- 2 ... λ16=X13 设 λ0 和四阶 B 样条函数 B14(x)相对应,λ1 和四阶 B 样条函数 B24(x) 对应,依次类推,直到 λ12 和四阶 B 样条函数 B134(x)相对应。 设 控 制 信 号 : y=sin(x), 按 图 的 将 B 样 条 神 经 网 络 , 在 MATLAB 中
(2) 关联分析: 数据关联是数据库中存在的一类重要的可被发现 的知识。若两个或多个变量的取值之间存在某种规律性, 就称为关联。
(3) 聚类: 数据库中的记录可被化分为一系列有意义的子集, 即聚 类。聚类增强了人们对客观现实的认识, 是概念描述和偏差分析的先 决条件。
另 外 还 有 概 念 描 述 、偏 差 描 述 等 。 4.决 策 树 方 法 的 主 要 优 点 数 据 挖 掘 的 常 用 技 术 有 人 工 神 经 网 络 、决 策 树 、遗 传 算 法 等 。 而 本文采用决策树技术对数据进行挖掘, 相对于其他挖掘方法, 决策树 方法应用最为广泛, 其独特的优点主要包括: ( 1) 学习过程中使用者不需要了解很多背景知识, 只要训练事例 能够用属性――结论的方式表达出来, 就能用该算法进行学习; ( 2) 决策树的分类模型是树状结构, 简单直观, 比较符合人类的的 理解方式; ( 3) 可以将决策树中到达每个叶节点的路径转换为 IF- THEN 形 式的分类规则, 这种形式更有利于理解。 二 、通 过 数 据 挖 掘 预 测 学 生 学 习 成 绩
表 1 经过预处理后的数据
1.数据挖掘的定义 数据挖掘( Data Mining) 就是从大量的、不完
序号 课前预习 按时学习 记笔记 完成作业 课后复习 学习成绩
全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、







人 们 事 先 不 知 道 的 、但 又 是 潜 在 有 用 的 信 息 和 知 识 的 过 程 。 与 数 据 挖
变量及其所占空间也将呈指数增长, 网络训练过程也会变得复杂; 虽 然 B 样条网络比模糊逻辑在精确性上更加可调,但不如采用模糊逻辑 表达灵活、计算速度快,也不如小波神经网络的自适应性。[5] 科
● 参考文献
[ 1] 孙增圻, 张再兴, 邓志东.智能控制理论与技术[ M] .北京 : 清 华 大 学 出 版 社.1991. [ 2] 王春行.液压伺服控制系统[ M] .北京: 机械工业出版社.1989. [ 3] 张立明.人工神经网络的模型及其应用[ M] .上海: 复旦大学出版社. 1993. [ 4] 薛 定 宇.反 馈 控 制 系 统 设 计 与 分 析— ——MATLAB 语 言 应 用 [ M] .北 京: 清华大学出版社.2000. [ 5] 景 小 宁 等.B 样 条 神 经 网 络 的 算 法 设 计 及 应 用.计 算 机 应 用 与 软 件 [ J] .2005(7): 22- 7. [ 6] 潘 薇 , 安 莹.MATLAB 辅 助 控 制 系 统 设 计 与 仿 真 [ M] .北 京 : 电 子 工 业 出 版 社.2005.
Server2000 下采用决策树挖掘方法, 在若干影 响 学 生 学 习 成 绩 的 环 节 中等水平的 44 个, 成绩较差的 20 个。其中调查的 5 项数据项为条件
中, 找出关键环节, 从而实现数据挖掘功能。
属性, 学习成绩属性为类别属性。最后得到的数据如表 1 所示。
一 、数 据 挖 掘 的 的 知 识
能越有价值。 3.数据挖掘的主要功能 数据挖掘通过预测未来趋 势 及 行 为 , 做
出 前 摄 的 、基 于 知 识 的 决 策 。 数 据 挖 掘 的 目 标 是 从 数 据 库 中 发 现 隐 含 的、有意义的知识, 主要有以下几类功能:
(1) 自动预测趋势和行为: 数据挖掘自动在大型数据库中寻找预 测性信息, 以往需要进行大量手工分析的问题如今可以迅速直接由数 据本身得出结论。







假 设 的 前 提 下 去 挖 掘 信 息 、发 现 知 识.数 据 挖 掘 所 得 到 的 信 息 应 具 有
先未知,有效和可实用三个特征。先前未知的信息是指该信息是预先







未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知







识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可
数据项说明: 课前预习中的 A、B、C 分别代表经常预习、时有预习、基本不 预 习。 按时学习中的 A、B、C 分别代表严格、比较严格、一般。 记笔记中的 A、B、C 分别代表多数都记、记的一般、偶尔记。 完成作业中的 A、B、C 分别代表独立完成、参考完成、抄袭完成。 课后复习中的 A、B、C 分别代表经常复习、时有复习、偶尔复习。 学习成绩中的 A、B、C 分别代表上等、中等、较差。 3.数 据 挖 掘 实 现 1) 建立数据表:在 SQL Server 中建立数据库后, 建 立 相 应 的 表 , 并 在表中录入相应的数据。 2) 设置数据源: 在控制面板中设置数据源, 连接的数据库为我们 新建的库。 3) 在 SQL Server 中 进 行 数 据 挖 掘 的 过 程 : 启 动 Analysis Manager, 在 Analysis Manager 树 视 图 中 展 开 “Analysis Servers”, 单 击 服 务 器 名 称 , 建 立 与 Analysis Servers 的 连 接 ; 右 击 服 务 器 名 称 , 单 击 “新建数据库”命令; 右击建立的数据库下的“数据源”文件夹, 单击“新 数据源”命令; 在“数据链 接 属 性 ”对 话 框 中 , 单 击 “提 供 者 ”选 项 卡 , 然 后 选 中 “Microsoft OLE DB Provider for ODBC Drivers”, 单 击 “连 接 ”选 项卡, 从“使用数据源名称”列表中单击选中数据库。创建揭示客户模 式的数据挖掘模型, 在 Analysis Manager 树 窗 格 中 右 击 “挖 掘 模 型 ”文 件夹, 单击“新建挖掘模型”命令; 打开挖掘模型向导, 通过向导建立挖 掘模型。依据学习成绩为 A 的读取客户决策树, 如图 1 所示。
科技信息
○计算机与信息技术○
SCIENCE & TECHNOLOGY INFORMATION
2007 年 第 22 期
通过数据挖掘技术预测学生学习成绩
张兴科 王 浩 (合肥工业大学计算机与信息学院 安徽 合肥 230000)
摘要: 介绍了数据挖掘的基本知识, 数据挖掘的功能与方法, 并通过数据挖掘, 找出了影响学生学习成绩的关键环节。 关键词: 数据挖掘; 知识; 决策树; 学习 Abstr act:This paper introduces the basic knowledge,the function and the method of data mining. Based on data mining,we can find key problems that influence the students’mark. Key wor d:data mining;knowledge;dimension tree;study
进行仿真, 控制框图如图 2 所示。[4]
图 2 B 样条控制框图
对用 B 样条神经网络控制的电液伺服系统进行仿真, 限于篇幅, 本文只给出通过第三次学习后得到的控制曲线和误差曲线如图 3 图 4 所示。
图 3 B 样条神经网络控制第三次学习曲线
图 4 B 样条神经网络Leabharlann Baidu制第三次学习误差曲线
由图可知, 在第三个周期内, B 样条神经网络就可以控制电液伺 服系统跟踪输入信号的精度达到理想的效果, 最大误差在 2%左右, 误 差主要集中在- 0.02- 0.02 误差带之间。可见, 采用 B 样条神经网络来 控制电液伺服系统, 系统的控制精度可以大大提高。


b)由式 ei (1)=yd - yi (1)=yd - ωi (1)a(x)。计算 e(k), e(k) , e(k) mean。
c)根据上面式子计算 m(k), β(k), ω(k)。当时, 检验学习训练过程是
否收敛在允许的误差范围内, 如果在, 储存此时的权值 ω1。当 m(k)=0
时, 初始化权值 ω=ω1, 重新储存权值 ω1。
掘 相 近 的 同 义 词 有 数 据 融 合 、数 据 分 析 和 决 策 支 持 等 。







2. 数据挖掘与传统分析方法的区别 数据挖 掘 与 传 统 的 数 据 分







析(如 查 询 、报 表 、联 机 应 用 分 析)的 本 质 区 别 是 数 据 挖 掘 是 在 没 有 明 确
在教 育 教 学 活 动 中 , 教 学 质 量 的 好 坏 与 教 学 条 件 、教 师 业 务 水 平 目的、意义, 使学生反馈的数据尽可能真实、准确。在取得数据后, 对不
有关外, 更重要的是学习的主体- - 学生。学生学习成绩好坏除智力因 合格数据予以剔除。参加调查的学生 98 名, 实际取得合格数据 93 个。
网络逆模型, 以图为神经网络控制模型, 以阀控液压缸为被控对象, 建
立了模型后, 在 MATLAB 中建立电液伺服系统的仿真模型。用 B 样条
神经网络控制电液伺服系统, 对系统进行仿真研究。[5]
3.2 电液伺服系统 B 样条神经网络仿真
设输入信号周期基准为 1, B 样条函数为四阶, 将输入空间分为
4.仿真结果及结论 将 B 样条神经网络控制引入到电液伺服系统中, 对其进行仿真, 可以得知, 用 B 样条神经网络控制电液伺服系统, 系统可以很好地跟 踪输入信号, 学习速度快, 不存在局部极小点, 在一定范围内, 随着 C
的增大, 泛化能力增强 但是, B 样条网络在使用中也存在不足之处。当维数增加时,存储
相关文档
最新文档