《大数据分析基础与R语言》教学大纲
R语言编程基础-教学大纲

《R语言编程基础》教学大纲
课程名称:R语言编程基础
课程类别:必修
适用专业:大数据技术类相关专业
总学时:48学时(其中理论18学时,实验30学时)
总学分:3.0学分
一、课程的性质
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。
数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。
数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业,有实践经验的数据分析人才已经成为了各企业争夺的热门。
为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的数据分析人才需求,特开设R语言编程基础课程。
二、课程的任务
通过本课程的学习,使学生认识R的编译环境,获取与安装R语言,使用R包,控制流、文件读取、数据可视化及使用可视化工具Rattle进行数据分析等基本操作。
本课程将紧密结合示例操作,及时讲解基础知识、相关函数及可视化操作,为学生今后进行实际编程操作奠定基础,为数据分析可视化提供方法,同时,掌握Rattle工具能更方便的实现数据挖掘相关操作。
三、课程学时分配
四、教学内容及学时安排
1.理论教学
2.实验教学
五、考核方式
突出学生解决实际问题的能力,加强过程性考核。
课程考核的成绩构成= 学习态度(10%)+课堂参与(20%)+期末考核(70%),期末考试建议采用开卷形式,试题应包括基本概念、绘图、分组聚合、数据合并、数据清洗、数据变换、模型构建等部分,题型可采用判断题、选择、简答、应用题等方式。
《R语言数据分析》课程教案—01R语言数据分析概述

《R语言数据分析》课程教案—01R语言数据分析概述《R语言数据分析》课程教案第1章R语言数据分析概述一、材料清单(1)《R语言商务数据分析实战》教材。
(2)配套PPT。
(3)引导性提问。
(4)探究性问题。
(5)拓展性问题。
二、教学目标与基本要求1.教学目标根据目前数据分析发展状况,将数据分析具象化。
而后介绍数据分析的概念,流程,目的以及应用场景。
阐述使用R语言进行数据分析的优势。
列举说明R语言数据分析重要Packages的功能。
2.基本要求(1)了解数据分析的概念。
(2)了解数据分析的流程。
(3)了解数据分析在实际中的应用。
(4)了解R语言数据分析中常用的Packages。
三、问题1.引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。
(1)数据分析能够做什么?(2)现实生活中存在哪些数据分析技术?(3)该如何进行数据分析?(4)R语言有哪些优势?2.探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。
或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。
(1)数据分析的完整流程是怎样的?(2)数据分析的能够应用在那些场景?(3)R语言常用的Packages有哪些?3.拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。
亦可以提供拓展资料供学生研习探讨,完成拓展性问题。
(1)数据分析是不是万能的?(2)分析本班人员的基本信息可以从哪些角度入手?四、主要知识点、重点与难点1.主要知识点(1)数据分析的概念、流程与应用场景。
(2)R语言在数据分析中的优势。
(3)R语言常用的Packages。
2.重点(1)数据分析的概念、流程与应用场景。
(2)R语言常用的Packages。
《大数据开发基础》课程教学大纲(含目录)

课程名称:大数据开发基础英文名称:Big Data Development Foundation适用对象:计算机专业本科三年级以上的学生课时:32课时一、课程性质、目的和任务1.本课程为计算机专业大学本科生及研究生选修的一门课程;2.目的是让学生了解并掌握四个领域(即大数据系统的起源及系统特征、大数据系统的架构设计及功能目标设计、大数据系统程序开发、企业大数据案例分析)的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数据开发的实践能力;3.本课程重点让学生掌握五个方面的内容:(1)HDFS使用操作;(2)MapReduce开发;(3)HBase数据库的开发;(4)Hive数据仓库开发;(5)大数据案例分析;二、教学内容及要求第一章大数据概述授课学时:1基本要求:1.了解大数据概念、特征、数据计量单位以及大数据的类型;2.了解大数据系统的设计背景、以及当前大数据系统存在的不足;3.了解大数据系统的设计思想、设计目标和设计原则;4.了解大数据系统的整体逻辑架构设计及运行逻辑,了解当前大数据系统的主流架构;第二章大数据应用开发思路和开发环境配置授课学时:1基本要求:1.掌握大数据系统应用读写操作的开发流程;2.掌握分析大数据开发技术及思路;3.掌握大数据Java开发的环境配置、Plugin插件的安装,Hadoop环境配置;第三章HDFS 分布式文件系统授课学时:4基本要求:1.了解HDFS设计目标、基本概念;2.掌握HDFS文件系统的命令操作;3.掌握Java对HDFS的程序开发操作,包含目录管理、文件列表、读取、导入导出、文件压缩等开发;4.真机实操训练(实验环节1);第四章 MapReduce 分布式编程授课学时:6基本要求:1.了解MapReduce的设计思想、基本概念;2.了解MapReduce的系统架构、作业运行机制和关键技术;3.掌握MapReduce的数据类型的自定义以及数据类型的使用;4.掌握MapReduce开发,定制输入输出的数据格式;5.掌握将HDFS文件系统中整个文件作为输入数据的开发;6.掌握利用MapReduce完成小文件聚合成一个大文件的开发;7.掌握压缩数据处理程序开发;8.掌握任务组合过程,掌握迭代组合、并行组合及串行组合;9.掌握任务的前后链式组合;10.掌握多数据源连接的开发,包含Map端开发以及Reduce端开发;11.掌握Hadoop全局参数的使用,全局文件的使用;12.掌握与关系型数据库的访问连接;13.真机实操训练(实验环节2);第五章 HBase 分布式数据库授课学时:4基本要求:1.了解HBase分布式数据库的设计目标、基本概念;2.了解HBase逻辑架构以及物理架构;3.掌握HBase分布式数据库Shell命令操作;4.掌握HBase数据库系统的Java开发,包含创建表、删除表,查询所有表操作;5.掌握HBase数据库系统的Java开发,包含插入记录、查询数据,组合查询、修改删除记录等开发;6.真机实操训练(实验环节3);第六章 Hive数据仓库开发授课学时:6基本要求:1.了解Hive数据仓库的工作原理及特点;2.了解Hive架构设计,包含数据类型、数据存储方式以及查询方式;3.掌握Hive数据仓库系统的HQL语言语法;4.掌握HQL的创建表、查看表及查询有结构,修改表以及删除表;5.掌握利用HQL语句将HDFS的文件导入数据仓库;6.掌握分区表、桶表、外部表的使用;7.掌握HQL语句的联合查询、子查询、创建视图等操作;8.掌握利用Java开发UDF自定义函数,以及自定义函数的使用;9.掌握Java连接Hive数据仓库进行数据查询;10.真机实操训练(实验环节4);第七章Spark数据挖掘授课学时:4基本要求:1.了解数据挖掘的基本概念和手段,介绍数据挖掘的常用算法、编程语言等;2.了解常用的数据挖掘工具;3.了解最新大数据处理技术Spark平台,包括RDD基础及编程接口介绍,以及SparkSQL逻辑架构,流式处理技术SparkStream等;4.了解介绍Spark平台下机器学习(Machine Learning)架构解析,以及Spark MLlib经典算法解析和案例;5.案例详解,解析通过Spark MLlib的协同过滤算法,来分析某大型电商的商品推荐过程,并说明实现方法和代码;第八章综合案例分析1、某网站访问日志分析授课学时:2基本要求:1.了解网站访问日志的数据结构;2.了解网站访问日志的分析方法以及本次分析日志需要完成的目录;3.了解分析过程以及分析工具的使用;4.大数据环境实验(实验环节5);2、某搜索引擎网站日志分析授课学时:2基本要求:1.了解搜狐网站对关键词搜索记录的数据结构;2.了解关键词搜索的分析目标及预期完成分析结果;3.了解分析流程、分析工具以及重点代码的介绍;4.大数据环境实验(实验环节6);3、某大型电商数据分析授课学时:2基本要求:1.了解本案例中电商数据的字段结构;2.了解本次电商数据预期完成分析的指标以及分析结果的再利用介绍;3.了解分析流程、分析工具以及重点代码的介绍;4.大数据环境实验(实验环节7);三、课程考核课程成绩中期末考试成绩占60%,平时成绩占40%;期末考试分笔试和上机操作两部分进行。
《R语言数据分析》课程教案(全)

《R语言数据分析》课程教案(全)第一章:R语言概述1.1 R语言简介介绍R语言的发展历程、特点和应用领域讲解R语言的安装和配置1.2 R语言基本操作熟悉R语言的工作环境学习如何创建、保存和关闭R剧本掌握R语言的基本数据类型(数值型、字符串、逻辑型、复数、数据框等)1.3 R语言的帮助系统学习如何使用帮助文档(help()、?、man()函数)掌握如何搜索和安装R包第二章:R语言数据管理2.1 数据导入与导出学习如何导入CSV、Excel、txt等格式的数据掌握如何将R数据导出为CSV、Excel等格式2.2 数据筛选与排序掌握如何根据条件筛选数据学习如何对数据进行排序2.3 数据合并与分割讲解数据合并(merge、join等函数)的方法和应用场景讲解数据分割(split、apply等函数)的方法和应用场景第三章:R语言统计分析3.1 描述性统计分析掌握R语言中的统计量计算(均值、中位数、标准差等)学习如何绘制统计图表(如直方图、箱线图、饼图等)3.2 假设检验讲解常用的假设检验方法(t检验、卡方检验、ANOVA等)掌握如何使用R语言进行假设检验3.3 回归分析介绍线性回归、逻辑回归等回归分析方法讲解如何使用R语言进行回归分析第四章:R语言绘图4.1 ggplot2绘图系统介绍ggplot2的基本概念和语法学习如何使用ggplot2绘制柱状图、线图、散点图等4.2 基础绘图函数讲解R语言内置的绘图函数(plot、barplot、boxplot等)掌握如何自定义图形和调整图形参数4.3 地图绘制学习如何使用R语言绘制地图讲解如何使用ggplot2绘制地理数据可视化图第五章:R语言编程5.1 R语言编程基础讲解R语言的变量、循环、条件语句等基本语法掌握如何编写R函数和模块化代码5.2 数据框操作学习如何使用数据框进行编程讲解如何使用dplyr等工具包进行数据框操作5.3 面向对象编程介绍R语言的面向对象编程方法掌握如何使用R6和S3编程范式第六章:R语言时间序列分析6.1 时间序列基础介绍时间序列数据的类型和结构学习时间序列数据的导入和预处理6.2 时间序列分解讲解时间序列的分解方法,包括趋势、季节性和随机成分使用R语言进行时间序列分解6.3 时间序列模型介绍自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)和自回归积分滑动平均模型(ARIMA)学习如何使用R语言建立和预测时间序列模型第七章:R语言机器学习7.1 机器学习概述介绍机器学习的基本概念、类型和应用学习机器学习算法选择的标准和评估方法7.2 监督学习算法讲解回归、分类等监督学习算法使用R语言实现监督学习算法7.3 无监督学习算法介绍聚类、降维等无监督学习算法使用R语言实现无监督学习算法第八章:R语言网络分析8.1 网络分析基础介绍网络分析的概念和应用领域学习网络数据的导入和预处理8.2 网络图绘制讲解如何使用R语言绘制网络图学习使用igraph包进行网络分析8.3 网络分析应用介绍网络中心性、网络结构等分析方法使用R语言进行网络分析案例实践第九章:R语言生物信息学应用9.1 生物信息学概述介绍生物信息学的概念和发展趋势学习生物信息学数据类型和常用格式9.2 生物序列分析讲解生物序列数据的导入和处理使用R语言进行生物序列分析9.3 基因表达数据分析介绍基因表达数据的特点和分析方法使用R语言进行基因表达数据分析第十章:R语言项目实战10.1 数据分析项目流程介绍数据分析项目的流程和注意事项10.2 R语言项目实战案例一分析一个真实的统计数据集,实践R语言数据分析方法10.3 R语言项目实战案例二使用R语言解决实际问题,如商业分析、社会研究等10.4 R语言项目实战案例三结合数据库和API接口,进行大规模数据分析和处理重点和难点解析重点环节1:R语言的安装和配置解析:R语言的安装和配置是学习R语言的第一步,对于初学者来说,可能会遇到操作系统兼容性、安装包选择等问题。
《R语言》课程教学大纲

《R语言》课程教学大纲总主编刘鹏张燕主编程显毅刘颖朱倩适合专业:数据科学与大数据技术专业课程编号:先修课程:数理统计、数据库、大数据导论学分: 4 总学时: 64一、课程性质、目的与要求课程性质:专业必修课。
课程目的:本课程是各专业想了解大数据分析技术的学生必修的一门基础课程,具有很强的实践性和应用性。
它以《数理统计》、《大数据导论》为基础,主要培养学生大数据分析和计算机编程基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。
课程要求:本课程设置的目的是通过对R语言的语法规则、数据结构、数据清晰、数据变换、数据整合、数据可视化、数据建模构的学习,较好地训练学生利用计算机解决对数据进行分析和展现,使学生具有数据分析和数据展现的能力,为培养学生有较强数据开发能力打下良好基础。
二、教学内容理论总学时:32学时第1章绪论 1学时基本要求:(1)了解R语言特点和优势。
(2)理解数学思维的基本原理。
(3)掌握统计思维的基本原理。
(4)理解逻辑思维的基本原理。
重点:树立正确的思维观。
难点:逻辑思维。
第2章 R语言入门 1学时基本要求:(1)理解R语言工作空间,环境变量的显示、保存和删除。
(2)了解R包的作用。
(3)能够安装R语言开发环境。
(4)能够编辑和运行R脚本。
(5)R语言基本语法。
重点:R语言脚本编辑和运行。
难点:R包。
第3章数据类型 4学时基本要求:(1)掌握向量的产生、引用、合并等操作,包括x:y,seq(),c(),rnorm()。
(2)掌握矩阵的产生、引用、合并、转换等操作。
(3)理解数据的产生、引用、转换等操作。
(4)熟练掌握数据框的产生、引用、转换等操作。
(5)理解列表的产生、引用、转换等操作。
(6)掌握因子的作用、定义和转换。
(7)熟练掌握常量和变量。
(8)基本掌握字符串处理函数。
(9)掌握常用数据类型转换函数。
重点:数据框和向量的应用。
难点:列表和因子的应用。
R语言基础-教学大纲

R语言基础-教学大纲计算机科学与技术专业《R语言基础》教学大纲课程编号:英文名称:R Language Basics课程层面:专业技能课程性质:必修总学时:48 理论学时:32实践学时:16 学分: 3开课单位:信息工程学院——计算机科学与技术教研室一、课程简介R语言基础是一门实践性和应用性较强的面向理工科各本科专业学生开设的必修课程,是相关专业后续课程的重要基础和先导课程。
本课程的目的是以R语言为平台,介绍R的基础知识,包括创建、运行以及调试R脚本;用户自定义R函数;用R绘制基本图形;R的循环语句和逻辑控制语句;二次函数、三角函数、指数函数、对数函数以及如何用R绘制这些函数图形;矩阵的基本运算和线性方程组的求解;概率分布与模拟;数据的拟和等,具备利用计算机解决实际问题的基本能力。
二、教学基本要求1.知识要求掌握R语言的基本语法、基本语句;掌握创建、运行及调试R脚本的基本方法;掌握用户自定义R函数的基本语法;掌握R的循环语句和逻辑控制语句;二次函数、三角函数、指数函数、对数函数以及如何用R绘制这些函数图形;掌握矩阵的基本运算和线性方程组的求解;理解概率分布与模拟;数据的拟和等,提高学生的理论知识水平。
2.素质和能力要求培养学生掌握程序设计的方法与编程技术,养成良好的程序设计风格;培养学生计算机程序设计逻辑思维,具备算法设计、实践动手的能力;培养学生利用计算机解决实际问题的能力,能灵活应用R语言进行统计分析,具备程序调试的技能。
三、教学方法与手段1.以应用为背景,以程序设计为主线,把程序设计的思想贯穿整个教学过程中,重点放在分析问题。
设计算法,表达算法,最后在计算机上实现算法,培养学生程序设计能力,在具体的应用环境下学习语法知识,重视方法、思想、能力的结合。
2.在课堂教学过程中,以任务为驱动,采用案例教学方法,综合使用PPT课件、程序演示和板书等教学手段,重点在算法设计、算法表达、和算法的实现,通过程序演示,可以直观验证算法和想法语法规则,提高学生的学习兴趣。
《R语言与应用统计分析》课程教学大纲

《R语言与应用统计分析》课程教学大纲一、课程基本信息课程编号:12178课程名称:R语言与应用统计分析英文名称:R language and application statistical analysis课程类型:专业课课程要求:选修学时/学分:48/3(讲课学时:32 实验学时:16)先修课程:概率论与数理统计、线性代数理论与应用、离散数学后续课程:文本挖掘技术、社会计算适用专业:数据科学与大数据技术二、课程描述“R语言与应用统计分析”是数据科学与大数据技术专业的选修课。
针对R语言这一当前最为流行的用于数据分析和统计制图的语言及操作系统,课程主要讲授如何运用R语言获取数据、整理数据、注释数据、总结数据、数据可视化、数据建模和整理结果。
课程的任务是使学生了解R语言作为数据分析平台的诸多特性,了解R语言的数据结构以及基本的数据管理方法,能够编写R函数进行数据整合。
熟练掌握R语言绘图方法、数据总结方法、基本实验设计、实验功效分析等功能。
通过本课程的学习,培养学生的R语言编程能力,进而具备完整的基于R语言的应用统计分析和实现能力。
三、课程教学目标1.理解R语言的基本思想和基本概念,能够基于R语言的原理并采用应用统计分析方法对复杂工程问题进行研究,包括设计程序、分析与结果解释、并通过信息综合得到合理有效的结论。
(支撑毕业能力要求2)2.掌握以R语言为工具的应用统计分析系统的开发与设计方法,应用R语言的基本理论知识设计软件实验,并能够针对相对复杂的软件系统设计解决方案,编写程序进行求解。
(支撑毕业能力要求5)四、教学内容、安排及教学目标得对应关系五、其他教学环节(课外教学环节、要求、目标)1.自学图形单元在授课前自学授课内容,达到能熟练操作图形创建和保存方法。
2.运用熟练掌握条形图、箱线图、点图使用方法、饼图和扇形图的使用方法、直方图与核密度图的使用方法,设计解决实例。
六、教学方法1. 课堂教学主要采用CAI教学,辅助多媒体、实际上机运行环境等形式进行。
轻松入门学习R语言数据分析

轻松入门学习R语言数据分析第一章:引言在数据时代的背景下,数据分析成为了一项非常重要的技能。
而R语言作为一种开源的编程语言,被广泛应用于数据分析和统计领域。
本章将介绍什么是R语言以及为什么选择R语言作为数据分析工具。
第二章:R语言基础知识本章将介绍R语言的基础知识,包括安装R语言、R语言的基本语法和常用数据类型等。
此外,还将介绍如何使用R语言进行简单的数据操作和数据可视化。
第三章:数据处理与清洗数据分析的第一步是对数据进行处理与清洗。
本章将介绍如何使用R语言进行数据处理与清洗,包括数据导入与导出、缺失值处理、异常值处理以及数据重构等。
还将介绍常用的数据清洗技巧和方法。
第四章:数据探索与可视化数据探索与可视化是数据分析的重要环节。
本章将介绍如何使用R语言进行数据探索与可视化,包括数据摘要统计、数据分布分析、相关性分析以及常用的数据可视化方法和工具。
第五章:统计分析统计分析是数据分析的核心内容。
本章将介绍如何使用R语言进行常见的统计分析,包括描述性统计、推断统计以及回归分析等。
同时,还将介绍如何使用R语言进行假设检验和模型建立。
第六章:机器学习与预测建模机器学习和预测建模是数据分析的热门领域。
本章将介绍如何使用R语言进行机器学习和预测建模,包括常见的机器学习算法、交叉验证和模型评估等。
同时,还将介绍如何使用R语言构建预测模型。
第七章:实例分析与案例研究本章将通过实例分析和案例研究的方式,结合前面所学的R语言数据分析技术,对真实的数据进行分析和解读。
通过实例和案例的学习,读者将更加深入地理解和掌握R语言数据分析的应用。
第八章:进阶与拓展本章将介绍R语言数据分析的进阶与拓展内容,包括如何使用R语言进行文本挖掘、网络分析以及时间序列分析等。
同时,还将介绍R语言在大数据处理和深度学习方面的应用。
第九章:总结与展望本章将对整个学习过程进行总结,并展望R语言数据分析的未来发展趋势。
同时,还将提供一些学习资源和推荐书目,供读者进一步深入学习和研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
想基础
合计:32
实践教学进程表
周次实验项目名称学
时
重点、难点、课程思政融入
点
项目类型(验证/综合/设计)
教学
方式
12
相关、回归分析7
重点:实践相关分析及各种
回归分析方法
难点:分辨各种回归之运用
差异
课程思政融入点:培育科学
探索精神和创新意识,培育
踏实严谨、精益求精的工匠
精神
综合课堂实作
13
14
机器学习方法9 重点:操作各类机器学习方
法,包括监督式学习和非监
督式学习之理论及实务操
作
难点:理论及程序语言之结
合为难点
课程思政融入点:培育科学
探索精神和创新意识,培育
踏实严谨、精益求精的工匠
精神
综合课堂实作
15
16
17 期末报告
合计:16
考核方法及标准
考核形式评价标准权重平时出席考勤20
课堂实作课堂实作40
期末报告报告及程序代码缴交40
大纲编写时间:2019/09/05
系(部)审查意见:
系(部)主任签名:日期:年月日。