大数据教学大纲

大数据教学大纲
大数据教学大纲

《大数据》课程教学大纲

适合专业:数据科学与大数据技术专业课程编号:

先修课程:高等数据、线性代数、JAVA 学分: 4 总学时: 64

一、课程性质、目的与要求

课程性质:专业必修课。

课程目的:通过对大数据的相关知识介绍,使学生掌握大数据的概念和原理,熟悉大数据的理论与算法,了解大数据未来发展趋势,能够利用所学知识,进行大数据应用实现和算法设计,培养学生运用大数据技术解决大数据行业应用问题。课程要求:本课程系统介绍了大数据的理论知识和实战应用,包括大数据概念与应用、数据采集与预处理、数据挖掘算法与工具、R语言、深度学习以及大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。期望学生对大数据处理技术有比较深入的理解,能够从具体问题或实例入手,利用所学的大数据知识在应用中实现数据分析和数据挖掘。

二、教学内容

理论总学时:36学时

第1章大数据概念与应用 2学时基本要求:熟悉大数据的概念与意义、大数据的来源、大数据应用场景及大数据处理方法等内容。

重点:大数据的定义、研究内容与应用。

难点:无。

第2章数据采集与预处理 4学时基本要求:熟悉常用的大数据采集工具,特别是Apache Kafka数据采集使用方法;熟悉数据预处理原理和方法,包括数据清洗、数据集合、数据转换;掌握数

据仓库概念与ETL工具Kettle的实际应用。

重点:Apache Kafka数据采集、数据清洗、数据仓库与ETL工具。

难点:ETL工具Kettle的实际应用。

第3章数据挖掘算法 6学时基本要求:熟悉常用的数据挖掘算法,内容上从分类、聚类、关联规则和预测模型等数据挖掘常用分析方法出发掌握相对应的算法,并能熟练进行数据挖掘算法的综合应用。

重点:分类算法、聚类算法、关联规则、时间序列预测。

难点:数据挖掘算法的综合应用。

第4章大数据挖掘工具 4学时基本要求:熟练掌握机器学习系统Mahout和大数据挖掘工具Spark Mllib下的分类算法、聚类算法、协同过滤算法的使用,并对其他数据挖掘工具有所了解。重点:Mahout安装与使用、Spark Mllib工具的使用。

难点:Mahout和Spark Mllib工具的使用。

第5章 R语言 4学时基本要求:了解R语言的发展历程、功能和应用领域;熟悉R语言在数据挖掘中的应用;掌握R语言在分布式并行实时计算环境Spark中的应用SparkR。

重点:R语言基本功能、R语言在数据挖掘中的应用、SparkR主要机器学习算法。难点:R语言与数据挖掘。

第6章深度学习 4学时基本要求:了解深度学习的发展过程和实际应用场景,并结合人脑的工作原理,理解深度学习的相关概念和工作机制,做到能够熟练使用常用的深度学习软件。重点:人脑神经系统与深度学习、卷积神经网络、深度置信网络、循环(递归)神经网络、TensorFlow和Caffe。

难点:人工神经网络。

第7章大数据可视化 4学时基本要求:熟悉大数据可视化的基础知识;掌握文本可视化、网络可视化、时空数据可视化、多维数据可视化等常用的大数据可视化方法,可通过Excel、Processing、NodeXL和ECharts软件实现数据的可视化。

重点:数据可视化流程、大数据可视化方法、大数据可视化软件与工具。

难点:时空数据可视化、多维数据可视化。

第8章互联网大数据处理 4学时基本要求:掌握互联网信息抓取技术,能够通过互联网信息抓取、文本分词、倒排索引与网页排序这4个主要步骤实现互联网大数据处理,并能够熟练运用。重点:Nutch爬虫、文本分词、倒排索引、网页排序。

难点:倒排索引。

第9章大数据商业应用 2学时基本要求:熟悉用户画像和精准营销的构建;熟悉广告推荐系统的建设;熟悉互联网金融的应用方法。

重点:用户画像构建流程、用户标签、广告推荐、互联网金融应用方向。

难点:信用评分算法、分类模型的性能评估。

第10章行业大数据 2学时基本要求:以地震大数据、交通大数据、环境大数据和警务大数据为例来熟悉行业大数据的应用,学会利用数据创造价值。

重点:理解数据和数据分析在业务活动中的具体表现。

难点:无。

三、实践教学要求

实践总学时:28学时

注:1、实验类型:演示、验证、综合、设计、研究。

2、实验要求:必做、选做。

四、课时分配

五、建议教材与教学参考书

六、教学形式与考核方式

教学形式:本课程采用课堂讲授、分析和实践教学等手段开展教学活动。

考核方式:本课程采用平时考察与期末闭卷考试相结合的考核方法。平时考察主要考察课堂表现、作业完成情况,平时成绩占30%(课堂表现及考勤占5%,作业占25%)。期末考试主要采用闭卷考试的方式。命题要求覆盖大纲重点内容,题型不少于四种,难易程度适中。

大数据导论思维、技术与应用教学大纲

大数据导论 1. 课程简介 本课程的主要目的是让学生了解什么是大数据,大数据的特点,大数据思维,大数据的核心技术,大数据应用,大数据带来的变革,以及大数据面临的挑战,从而使学生对大数据技术和应用有一个初步的了解。本课程重视演示和实战,以便使学生通过亲身体验来理解和掌握大数据的核心概念。 2. 课程安排(74学时:42学时讲课,6学时演示,26学时实验) 第一阶段:大数据概述(8+4+0) 第一课:(理论:2学时) 第一章大数据概述 第二课:(理论:2学时) 第二章大数据采集 第三课:(理论:2学时) 第三章大数据预处理 第四课:(演示:2学时) 演示一:大数据技术演示 第五课:(理论:2学时) 第四章大数据处理系统 第六课:(演示:2学时) 演示二:大数据应用演示 第二阶段:大数据存储技术(8+0+8) 第七课:(理论:2学时) 第五章大数据文件系统HDFS 第八课:(使用:2学时) 实验一:分布式文件系统HDFS使用 第九课:(理论:2学时) 第六章 NoSQL数据库HBase 第十课:(实验:2学时) 实验二:列式数据库HBase使用 第十一课:(理论:2学时) 第七章数据仓库Hive 第十二课:(理论:2学时)

第七章数据仓库Hive 第十三课:(实验:2学时) 实验三:HiveQL 命令行的使用 第十四课:(实验:2学时) 实验四:使用JDBC程序操作数据库 第三阶段:大数据处理技术(12+0+10)第十五课:(理论:2学时) 第八章大数据批处理Hadoop MapReduce 第十六课:(理论:2学时) 第八章大数据批处理Hadoop MapReduce 第十七课:(实验:2学时) 实验五:批处理模式MapReduce应用 第十八课:(理论:2学时) 第九章大数据快速处理Spark 第十九课:(实验:2学时) 实验六:内存处理模式Spark应用 第二十课:(理论:2学时) 第十章大数据实时流计算 Spark Streaming 第二十一课:(实验:2学时) 实验七:流式处理模式Spark Streaming应用 第二十二课:(理论:2学时) 第十一章分布式图计算框架 Spark GraphX 第二十三课:(实验:2学时) 实验八:图处理模式Spark Graph应用 第二十四课:(理论:2学时)

《大数据导论》课程大纲

《大数据技术导论》课程教学大纲 Instruction of Big Data Technology 一、课程基本情况 课程编号: 课程类别:专业任选课 课程学分:2 学分 课程总学时:32学时,其中讲课: 20 学时,实验(含上机): 12 学时 课程性质:考试 开课学期:第3学期 先修课程:大学生计算机基础 适用专业:计算机应用技术 开课单位:计算机科学与技术学院 二、课程性质、教学目标和任务 《大数据技术导论》课程是计算机应用技术专业想了解大数据分析技术的学生必修的一门基础课程,具有很强的实践性和应用性。它以《大学计算机基础》为基础,主要培养学生大数据平台运维、大数据分析和数据可视化基本思想和基本技能,为后续的数据挖掘应用性课程和数据产品开发课程的学习打好编程基础。 本课程设置的目的是通过对Hadoop,HDFS,MapReduce,HBase,R语言的学习,较好地训练学生大数据平台运维、数据分析和数据展现,使学生具有数据分析和数据展现的能力,为培养学生有较强数据开发能力打下良好基础。 三、教学内容和要求 1.概论(4学时) (1)了解大数据技术产生的历史必然; (2)理解大数据的特征; (3)理解大数据生命周期; (4)理解大数据、云计算、物联网之间的相互关系;

(5)了解大数据的变革; (6)熟练掌握Linux常用命令 (7)了解Linux目录结构; (8)熟练使用vi编辑器 目的:通过上述知识的学习,使学生了解大数据基本概念、特征、处理流程,熟练掌握Linux常用操作命令。 重点:linux操作; 难点:大数据生命周期。 2.大数据生态系统(4学时) (1)掌握HDFS分布式文件系统的结构; (2)掌握HDFS存储原理; (3)掌握HDFS读写操作; (4)掌握MapReduce编程框架 (5)理解Map原理; (6)理解MapReduce原理; (7)了解zookeeper架构和工作原理 目的:通过上述知识的学习,使学生了解大数据生态系统疾病组件,掌握HDFS和MapReduce工作原理,并进行相应的操作。 重点:HDFS工作原理和读写过程; 难点:MapReduce编程。 3.大数据采集与预处理(4学时) (1)理解数据及其分类; (2)了解数据采集方法和工具; (3)掌握数据清洗的任务和作用; (4)掌握数据变换的种类和过程; (5)熟练Python爬虫 目的:通过上述知识的学习,使学生理解数据分类,理解数据清洗和数据变换的意义,熟练Python爬虫。 重点:Python爬虫; 难点:Python爬虫。

《大数据处理与云计算》课堂教学大纲.doc

《大数据处理与云计算》教学大纲 课程类别:专业教育课课程名称:大数据处理与云计算 开课单位:信息与通信工程学院课程编号:N03050703 总学时:40 学分:2.5 适用专业:信息工程专业 先修课程:无 一、课程在教学计划中的地位、作用 大数据处理与云计算是信息工程专业高年级学生开设的一门专业教育课。本课程主要学习大数据处理和云计算的相关原理和技术,根据实际需求,构建相应的大数据处理和云计算平台框架。 通过本课程学习,使学生掌握大数据的采集、传输、处理和应用的技术,了解Hadoop 分布式系统基础架构,掌握HDFS和MapReduce技术。了解HBase、Hive、Zookeeper、Avro、Pig等相关大数据技术,与实际工程应用相结合,构建相应的云计算平台。教学应当结合实际实验条件,培养学生实践动手能力,了解大数据技术发展现状,促进大数据相关教学改革。 二、课程教学内容、要求及学时分配 第一章大数据与云计算概况 1、了解大数据概念 2、了解大数据的产生、应用和作用 3、了解云计算技术的概述 4、了解云计算的特点及技术分类 5、了解大数据与云计算、物联网之间的关系 第二章大数据处理与云计算的关键技术 1、理解大数据处理的基本流程 2、掌握大数据的关键技术 3、理解大数据的处理工具 4、了解大数据面临的挑战 5、理解云计算及关系型数据库 第三章 Hadoop 1、了解Hadoop概述 2、了解Hadoop发展简史 3、理解Hadoop的功能与作用

4、了解Hadoop的优缺点 5、了解Hadoop的应用现状和发展趋势 6、掌握Hadoop项目及其结构 7、掌握Hadoop的体系结构 8、掌握HDFS的体系结构 第四章 MaReduce 1、理解分布式并行编程 2、理解MapReduce模型概述 3、掌握Map和Reduce函数 4、掌握MapReduce工作流程 5、掌握并行计算的实现 6、掌握新的MapReduce框架:Yarn 7、理解新旧Hadoop MapReduce框架的对比 第五章 HDFS 1、理解HDFS的假设与目标 2、理解HDFS的相关概念 3、掌握HDFS体系结构 4、掌握HDFS命名空间 5、掌握HDFS存储原理 6、掌握通讯协议 7、理解数据错误和异常 8、理解从HDFS看分布式文件系统的设计需求第六章 Zookeeper 1、了解Zookeeper简介 2、掌握Zookeeper的工作原理 3、理解Zookeeper的数据模型 第七章 HBase海量实时处理实战技巧 1、理解HBase简介和架构 2、掌握HBase核心知识点 3、掌握HBase高级应用

大数据算法教学大纲

《大数据算法》课程教学大纲 课程代码:090141128 课程英文名称:Big Data Algorithm 课程总学时:40 讲课:32 实验:8 上机:0 适用专业:信息与计算科学 大纲编写(修订)时间:2017.11 一、大纲使用说明 (一)课程的地位及教学目标 大数据不论在研究还是工程领域都是热点之一,算法是大数据管理与计算的核心主题,因此将大数据算法作为信息与计算科学专业的一门选修课程。通过本课程的学习,使学生能掌握一些大数据算法设计的基本思想,较好的理解和传统算法课程不一样的算法设计与分析思路,通过实践练习初步掌握大数据算法设计与分析的技术,并能够将其中的思想应用于实际的研究和开发。从而提高学生的创新实践能力,加强学生开展科研工作能力。为今后进行更深入的研究奠定良好的理论基础。 通过本课程的学习,学生将达到以下要求: 1. 掌握大数据算法设计的基本思想,较好的理解大数据算法设计与分析的基本思路; 2. 初步掌握大数据算法设计与分析的基本方法和技术; 3. 初步具备将大数据算法应用于实际开发的能力,并能够分析算法效率。 (二)知识、能力及技能方面的基本要求 1.基本知识:掌握大数据算法设计和分析的基本思想,掌握概率算法、I/O有效算法、并行算法等大数据算法的基本思想。 2.基本理论和方法:掌握大数据算法设计的一般原理和步骤。要求学生能够掌握亚线性算法、外存算法、并行算法等算法的设计方法和分析技术。 3.基本技能:具备运用亚线性算法、外存算法、并行算法等算法综合解决实际问题的能力,初步具备将大数据算法应用于实际开发的技能。 (三)实施说明 1.教学方法:本课程涉及大数据理论、算法设计技术、算法分析方法,涉及知识面广且比较抽象。建议采用案例教学并结合演示让学生理解和掌握各种算法设计方法,通过课堂讨论、课后作业和实验训练,加强学生对大数据算法设计方法的掌握。采用启发式教学,培养学生思考问题、分析问题和解决问题的能力;以最新的研究成果为导向,引导和鼓励学生通过查阅文献、实践获取知识,让学生了解大数据算法的前沿知识,培养学生的自学能力;增加讨论课,调动学生学习的主观能动性。 2.教学手段:本课程建议采用课堂讲授、讨论、多媒体教学相结合的教学形式,以确保在有限的学时内,全面、高质量地完成课程教学任务。 3.教师在授课过程中可以根据实际情况酌情安排各部分的学时,课时分配表仅供参考。 (四)对先修课的要求 本课程的教学必须在完成先修课程算法设计与分析之后进行,该课程的学习为算法的设计奠定了基础。 (五)对习题课、实践环节的要求 1.对重点、难点章节(如亚线性算法、外存算法、并行算法等)安排习题课,针对本章的算法进行回顾和总结,讲解典型算法设计题。课堂讲解算法思路,要求学生课后自己进行算法

大数据技术与应用基础教学大纲

大数据技术与应用基础》教学大纲 时:60 码: 适用专业: 定: 核: 准: 、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行动纲要》,还是《“十三五”规划》中都深刻体现了政府对大数据产业和应用发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统产业的融合还处于起步阶段,各行业对大数据分析和挖掘的应用还不理想。但随着市场竞争的加剧,各行业对大数据技术研究的热情越来越高,在未来几年,各领域的数据分析都将大规模应用。 本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复杂的基本情况,从初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式

的各种系统和工具。考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域 丰富广泛,在教学过程中应注重掌握大数据分析的实践操作。本课程通过丰富简单易上手 的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。 、课程教学基本要求 1 . 了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。 2 . 掌握Scrapy 环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。 3 . 深刻了解hadoop的基础理论,理解并掌握Hadoop单机及集群环境的部署方法。 4 . 掌握HDFS的基本概念和HDFS在hadoop中的作用,理解并识记HDFS勺使用,了解 HDFS的JAVA API接口及数据流原理;让学生明白Map过程与Reduce过程这两个独立部分各自的原理及合作途径,知道如何独立编写满足自己需求的Map Reduces序。 5.理解HBase中涉及的基本概念,掌握HBase的简单应用;让学生了解数据仓库的基 础概念,熟悉Hive与HDFS Map Reduced接的关心。 6.熟悉Spark和RDM基本概念,熟悉spark接口的使用,解决实战时的步骤及思路。 7.明白Hadoop和Storm之间的差别,掌握对Storm的使用。理解Apex的工作过程并能简单应用。 8. 了解Druid 的基本概念、应用场景以及集群架构,掌握批量数据加载、流数据加载 的操作。了解Flink 的重要概念和基本架构,掌握Flink 简单的使用实例。

大数据教学大纲

《大数据》课程教学大纲 适合专业:数据科学与大数据技术专业课程编号: 先修课程:高等数据、线性代数、JAVA 学分: 4 总学时: 64 一、课程性质、目的与要求 课程性质:专业必修课。 课程目的:通过对大数据的相关知识介绍,使学生掌握大数据的概念和原理,熟悉大数据的理论与算法,了解大数据未来发展趋势,能够利用所学知识,进行大数据应用实现和算法设计,培养学生运用大数据技术解决大数据行业应用问题。课程要求:本课程系统介绍了大数据的理论知识和实战应用,包括大数据概念与应用、数据采集与预处理、数据挖掘算法与工具、R语言、深度学习以及大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。期望学生对大数据处理技术有比较深入的理解,能够从具体问题或实例入手,利用所学的大数据知识在应用中实现数据分析和数据挖掘。 二、教学内容 理论总学时:36学时 第1章大数据概念与应用 2学时基本要求:熟悉大数据的概念与意义、大数据的来源、大数据应用场景及大数据处理方法等内容。 重点:大数据的定义、研究内容与应用。 难点:无。 第2章数据采集与预处理 4学时基本要求:熟悉常用的大数据采集工具,特别是Apache Kafka数据采集使用方法;熟悉数据预处理原理和方法,包括数据清洗、数据集合、数据转换;掌握数

据仓库概念与ETL工具Kettle的实际应用。 重点:Apache Kafka数据采集、数据清洗、数据仓库与ETL工具。 难点:ETL工具Kettle的实际应用。 第3章数据挖掘算法 6学时基本要求:熟悉常用的数据挖掘算法,内容上从分类、聚类、关联规则和预测模型等数据挖掘常用分析方法出发掌握相对应的算法,并能熟练进行数据挖掘算法的综合应用。 重点:分类算法、聚类算法、关联规则、时间序列预测。 难点:数据挖掘算法的综合应用。 第4章大数据挖掘工具 4学时基本要求:熟练掌握机器学习系统Mahout和大数据挖掘工具Spark Mllib下的分类算法、聚类算法、协同过滤算法的使用,并对其他数据挖掘工具有所了解。重点:Mahout安装与使用、Spark Mllib工具的使用。 难点:Mahout和Spark Mllib工具的使用。 第5章 R语言 4学时基本要求:了解R语言的发展历程、功能和应用领域;熟悉R语言在数据挖掘中的应用;掌握R语言在分布式并行实时计算环境Spark中的应用SparkR。 重点:R语言基本功能、R语言在数据挖掘中的应用、SparkR主要机器学习算法。难点:R语言与数据挖掘。 第6章深度学习 4学时基本要求:了解深度学习的发展过程和实际应用场景,并结合人脑的工作原理,理解深度学习的相关概念和工作机制,做到能够熟练使用常用的深度学习软件。重点:人脑神经系统与深度学习、卷积神经网络、深度置信网络、循环(递归)神经网络、TensorFlow和Caffe。 难点:人工神经网络。 第7章大数据可视化 4学时基本要求:熟悉大数据可视化的基础知识;掌握文本可视化、网络可视化、时空数据可视化、多维数据可视化等常用的大数据可视化方法,可通过Excel、Processing、NodeXL和ECharts软件实现数据的可视化。

《大数据概论》教学大纲

附件1 广东财经大学华商学院课程教学大纲 一、课程简介 大数据概论是一门理论性和实践性都很强的课程,针对计算机、信息管理和其他各专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家、大数据的未来等内容,具有较强的系统性、可读性和实用性。 二、教学目标 (一)目的与要求 本课程是大数据系列课程的基础,系统地介绍大数据涵盖的内容,包括数据与大数据概述、大数据获取与感知、大数据存储与管理、大数据分析、大数据处理、大数据治理、大数据安全与隐私等。除了介绍大数据的技术内容,课程还介绍了部分行业中大数据的典型应用案例,反映了大数据在社会经济生活中的重要价值。从而达到四个方面的对于大数据的认识:认识数据与大数据、认识大数据带来信息化第三波浪潮、认识大数据对现有信息技术体系的挑战、认识亟待构建的大数据治理体系。 课程基本要求:

(1)了解本课程的教学设计; (2)熟悉本课程的基本内容与学习要求; (3)主动完成本章的导读案例、思考和阅读全部内容。 二、主要教学模式和教学手段 采用线下教学为主,线上教学为辅。 主要学习模式:课堂面授课程,通过常用的工具进行实践教学,线上教学为辅,选择合适的教学平台进行线上补充教学。 主要教学方法:1:问题导向法 2:对比教学法 3:讨论教学法 4:任务驱动法 主要教学手段:1:多媒体机房教学 2:在线课程教学 3:视频教学网站 四、教学内容(要求编写所有章节的主要内容) 第一章什么是大数据 内容: 1.1人类信息文明的发展 1.2 大数据时代的来临 1.2.1 信息技术的发展 1.2.2 数据产生方式的变革 1.3 大数据的主要特征 1.3.1 大数据的数据特征 1.3.2 大数据的技术特征 1.4 大数据的社会价值 熟练掌握: 了解人类信息文明的发展历程 熟悉大数据时代的来临和具体发展表现 掌握大数据的主要特征 掌握大数据的社会价值 第二章大数据技术基础 内容:

大数据分析A教学大纲

清华大学大数据方向硕士学位 公共必修课课程 数据分析学(I) Data Analytics (I) 开课单位:数据分析学(I)课程组 授课教师: 黎波、张楠、郑路、庞珣、苏毓淞、罗昊、王程韡(暂定) 教学目的: 本课是针对社会科学和管理类研究学开设的数据分析基本课程。通过本课的学习,学生将对(大)数据分析的价值、意义和基本原理建立清晰和比较全面的认识,掌握有关数据发掘、处理、建模和解释的基本原理和方法,了解和熟悉数据分析在社会科学研究、商业分析和公共管理等领域的实际案例。 Data Analytics (I) is a graduate level course mainly designed for students with social sciences and management background. The objective of the course to give students a broad overview of the basic principles and applications of data analytics. Students will also be familiar with the various aspects of data analytics such as exploring, managing, modeling and interpreting data. Students’ learning will also be enhanced by their exposure to r eal life applications of data analytics in social science research, business analysis and public management.

云计算与大数据概论 教学大纲

计算机科学与技术专业 《云计算与大数据概论》教学大纲 一、课程基本信息 课程中文名称:云计算与大数据概论 课程代码: 学分与学时:4学分,64学时(其中,理论学时58,实验学时6) 课程性质:必修课程 授课对象:计算机科学与技术专业 二、课程教学目标与任务 本课程就是理论性与应用性均较强得课程,通过本课程得学习,了解云计算与大数据发展概况,掌握云计算技术、云计算体系结构,了解当前主流得云计算平台,了解大数据开发技术,掌握Hadoop平台得应用方式,理解MapReduce、PIG与Hbase,了解云计算与大数据安全得标准与规范。 三、学时安排 四、课程教学内容与基本要求 第1章云计算与大数据概述 教学目得:通过本章学习,掌握云计算与大数据得概念,了解云计算与大数据技术得发展现状,掌握云计算与大数据得特点与优势,了解云计算分类方式,了解当前主流得云计算与大数据供应商.

基本要求:掌握云计算与大数据得概念,掌握云计算与大数据得特点与优势 重点与难点:云计算与大数据得特点与优势 教学方法:讲授、学生收集资料。 主要教学内容: 1.云计算与大数据得概念。 2.云计算与大数据技术发展现状。 3.云计算与大数据得特点与优势。 4.云计算得分类. 5.主流云计算与大数据供应商。 6.云计算与大数据得联系 第2章云计算技术 教学目得:通过本章学习,掌握虚拟化技术得原理与实现方式,包括服务器虚拟化、网络虚拟化、存储虚拟化、应用虚拟化与桌面虚拟化,了解分布式计算得原理与应用。掌握IaaS、PaaS、SaaS三种云计算服务方式得特点与应用范围。 基本要求:掌握虚拟化技术得原理与实现方式,掌握三种云计算服务方式。 重点与难点:虚拟化技术、分布式计算技术 教学方法:讲授、学生收集资料。 主要教学内容: 1、虚拟化技术原理与实现方式。 2、分布式计算得原理。 3、IaaS、PaaS、SaaS三种云计算服务方式得特点与应用范围。 ?第3章云计算平台 教学目得:通过本章学习,了解当前主流得云计算平台服务商,掌握Google、亚马逊、微软、阿里巴巴、百度与腾讯所提供得云计算服务得原理与内容。 基本要求:了解当前主流得云计算平台服务商及其所提供得云计算服务。 重点与难点:Google云计算体系,亚马逊云计算架构 教学方法:讲授、学生收集资料、实验。 主要教学内容: 1、主流云计算平台服务商. 2、Google云计算体系,GFS文件系统、Google App Engine。 3、亚马逊平台存储结构、弹性云EC2、AWS等. 4、微软得Microsoft Azure。 5、阿里云服务平台。 6、百度开发者云服务。 7、腾讯云服务平台。

《大数据开发基础》课程教学大纲

大数据开发基础 一、课程性质、目的和任务 1. 本课程为计算机专业大学本科生及研究生选修的一门课程; 2. 目的是让学生了解并掌握四个领域(即大数据系统的起源及系统特征、大数据系统的架构设计 及功能目标设计、大数据系统程序开发、企业大数据案例分析)的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数据开发的实践能力; 3. 本课程重点让学生掌握五个方面的内容: (1)HDFS使用操作; (2)MapReduce开发; (3)HBase数据库的开发; (4)Hive数据仓库开发; (5)大数据案例分析; 二、教学内容及要求 第一章大数据概述 授课学时:1 基本要求: 1.了解大数据概念、特征、数据计量单位以及大数据的类型; 2.了解大数据系统的设计背景、以及当前大数据系统存在的不足; 3.了解大数据系统的设计思想、设计目标和设计原则; 4.了解大数据系统的整体逻辑架构设计及运行逻辑,了解当前大数据系统的主流架构; 第二章大数据应用开发思路和开发环境配置 授课学时:1 基本要求: 1.掌握大数据系统应用读写操作的开发流程; 2.掌握分析大数据开发技术及思路; 3.掌握大数据Java开发的环境配置、Plugin插件的安装,Hadoop环境配置;

第三章HDFS分布式文件系统 授课学时:4 基本要求: 1.了解HDFS设计目标、基本概念; 2.掌握HDFS文件系统的命令操作; 3.掌握Java对HDFS的程序开发操作,包含目录管理、文件列表、读取、导入导出、文件压缩等开发; 4. 真机实操训练(实验环节 1); 第四章MapReduce分布式编程 授课学时:6 基本要求: 1.了解MapReduce的设计思想、基本概念; 2.了解MapReduce的系统架构、作业运行机制和关键技术; 3.掌握MapReduce的数据类型的自定义以及数据类型的使用; 4.掌握MapReduce开发,定制输入输出的数据格式; 5.掌握将HDFS文件系统中整个文件作为输入数据的开发; 6.掌握利用MapReduce完成小文件聚合成一个大文件的开发; 7.掌握压缩数据处理程序开发; 8.掌握任务组合过程,掌握迭代组合、并行组合及串行组合; 9.掌握任务的前后链式组合; 10.掌握多数据源连接的开发,包含Map端开发以及Reduce端开发; 11.掌握Hadoop全局参数的使用,全局文件的使用; 12.掌握与关系型数据库的访问连接; 13.真机实操训练(实验环节2); 第五章HBase分布式数据库 授课学时:4 基本要求: 1.了解HBase分布式数据库的设计目标、基本概念; 2.了解HBase逻辑架构以及物理架构; 3.掌握HBase分布式数据库Shell命令操作; 4.掌握HBase数据库系统的Java开发,包含创建表、删除表,查询所有表操作; 5.掌握HBase数据库系统的Java开发,包含插入记录、查询数据,组合查询、修改删除记录等开发; 6.真机实操训练(实验环节3);

《大数据导论》—教学大纲

《大数据导论》教学大纲

前言 一、大纲编写依据 《大数据导论》是一门通识课程,也是数据科学与大数据专业的必要先修课程,面对大一学生开设。通过该课程学习,让学生了解大数据专业的内涵特点、大数据与社会经济发展的关系以及大数据的主要学科知识和课程体系。同时培养学生大数据处理问题的思维,引导学生认知大数据技术。要求学生了解学习大数据需要掌握的基础技术知识,熟悉海量数据处理的基本流程以及与之匹配使用的主要技术和工具。通过本课程的学习,加深学生对大数据的认识,并为后续专业课程打下良好基础。 二、课程目的 1、知识目标 通过课程学习让学生掌握大数据的概念和基本特征、理清大数据、云计算与人工智能的关系,了解大数据与社会各领域的应用关系。并就大数据硬件架构和处理流程及相关技术与工具介绍,让学生了解数据预处理,Hadoop、Spark、Strom、数据存储及数据分析等技术,为后续相关课程做铺垫,让不同专业学生可选择不同方向继续大数据的深入学习。 2、能力目标 (1) 实践能力 通过本课程的学习,培养自我学习和自我设计的意识和能力;培养数据搜集、加工处理和分析的能力;通过合作学习培养沟通交往、团队协作等能力。 (2) 创新能力 通过学习大数据产生促进新应用、新技术、新工具的产生,培养学生的创新精神,在什么情况下可以尽快抓住机会,促进学生将大数据与生活结合起来,培养使用大数据技术解决问题的思维。 三、教学方法 1、课堂教学 (1) 讲授 本课程的教学内容以讲授为主,讲授的主要内容有大数据的基本概念和基本特征、大数据行业必备基础知识、数据采集与预处理方法、大数据存储与管理、大数据计算框架、数据存储技术、数据分析技术,以及大数据与热门行业云计算和人工智能的结合。根据教学大纲的要求,突出重点和难点。 (2) 教师指导下的学生自学 指导学生自主学习大数据热门技术网络爬虫、Hadoop、Spark及Strom。教师通过给出一些相关的实例帮助学生理解和进行程序设计,并布置相应的习题让学生进行练习。 (3) 其它教学方法 尽可能运用动态演示手段进行多媒体辅助教学,解决好教学内容多、信息量大与学时少

大数据技术与应用基础_教学大纲.doc

《大数据技术与应用基础》教学大纲 学时: 60 代码: 适用专业: 制定: 审核: 批准: 一、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展 的《促进大数据发展行动纲要》,还是《“十三五”规划》中都深刻体现了政府对大数据产业和应用 发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统产业的融合还处于起步阶段,各 行业对大数据分析和挖掘的应用还不理想。但随着市场竞争的加剧,各行业对大数据技术研究的 热情越来越高,在未来几年,各领域的数据分析都将大规模应用。 本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复杂的基本情况,从 初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式的各种系统和工具。 考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域丰富广泛,在教学过程中应注 重掌握大数据分析的实践操作。本课程通过丰富简单易上手的实例,让学生能够切实体会和掌握各 种类型工具的特点和应用。 二、课程教学基本要求 1.了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。 2.掌握 Scrapy 环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。 3.深刻了解 hadoop 的基础理论,理解并掌握 Hadoop 单机及集群环境的部署方法。 4.掌握 HDFS 的基本概念和 HDFS 在 hadoop 中的作用,理解并识记 HDFS 的使用,了解HDFS的JAVA API 接口及数据流原理;让学生明白Map 过程与 Reduce过程这两个独立部分各自的原理及合作途径,知道如何独立编写满足自己需求的MapReduce程序。 5.理解 HBase 中涉及的基本概念,掌握 HBase 的简单应用;让学生了解数据仓库的基础概念,熟 悉 Hive 与 HDFS 、 MapReduce 直接的关心。 6. 熟悉 Spark 和 RDD 的基本概念,熟悉spark 接口的使用,解决实战时的步骤及思路。 7. 明白 Hadoop 和 Storm 之间的差别,掌握对Storm 的使用。理解 Apex 的工作过程并能简单应用。 8.了解 Druid 的基本概念、应用场景以及集群架构,掌握批量数据加载、流数据加载的操作。 了解 Flink的重要概念和基本架构,掌握Flink简单的使用实例。 9.理解Elasticsearch的基本架构,掌握Elasticsearch的一些入门操作。了解并基本掌握怎样利用所学的工具对目标实例进行数据分析。 三、课程的内容 1.大数据概述

大数据技术与应用基础_教学大纲

《大数据技术与应用基础》教学大纲 学时:60 代码: 适用专业: 制定: 审核: 批准: 一、课程的地位、性质和任务 大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行动纲要》,还是《“十三五”规划》中都深刻体现了政府对大数据产业和应用发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统产业的融合还处于起步阶段,各行业对大数据分析和挖掘的应用还不理想。但随着市场竞争的加剧,各行业对大数据技术研究的热情越来越高,在未来几年,各领域的数据分析都将大规模应用。 本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复杂的基本情况,从初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式的各种系统和工具。考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域丰富广泛,在教学过程中应注重掌握大数据分析的实践操作。本课程通过丰富简单易上手的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。 二、课程教学基本要求 1. 了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。 2. 掌握Scrapy环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。 3. 深刻了解hadoop的基础理论,理解并掌握Hadoop单机及集群环境的部署方法。 4. 掌握HDFS的基本概念和HDFS在hadoop中的作用,理解并识记HDFS的使用,了解HDFS的JAVA API接口及数据流原理;让学生明白Map过程与Reduce过程这两个独立部分各自的原理及合作途径,知道如何独立编写满足自己需求的MapReduce程序。 5. 理解HBase中涉及的基本概念,掌握HBase的简单应用;让学生了解数据仓库的基础概念,熟悉Hive与HDFS、MapReduce直接的关心。 6. 熟悉Spark和RDD的基本概念,熟悉spark接口的使用,解决实战时的步骤及思路。 7. 明白Hadoop和Storm之间的差别,掌握对Storm的使用。理解Apex的工作过程并能简单应用。 8. 了解Druid的基本概念、应用场景以及集群架构,掌握批量数据加载、流数据加载的操作。了解Flink的重要概念和基本架构,掌握Flink简单的使用实例。 9. 理解Elasticsearch的基本架构,掌握Elasticsearch的一些入门操作。了解并基本掌握怎样利用所学的工具对目标实例进行数据分析。 三、课程的内容 1.大数据概述

《大数据导论》通识课教学大纲

第3章大数据硬件环境教 学目的与要求: 通过本章学习,要求学生达到:了解计算机系统的组成,包括图灵机模型与冯·诺依曼机模型,掌握计算机系统事物基本组成结构和组成原理;了解硬件计算设备包括超级计算机、小型机与工作站、桌上型计算机与笔记本计算机、平板计算机与掌上计算机、计算机化手机;了解检测系统的概念,传感器,自动化仪表和RFID无线射频识别。 第4章数据通信与计算机网络 教学目的与要求: 通过本章学习,要求学生达到:了解通信系统、调制解调技术、数据传输技术和数字信号的接收;掌握计算机网络的基本概念和网络硬件原理,了解I nternet目前的状态;了解未来网络发展趋势,包括全光网、云计算、网格计算、普适计算、物联网、无线传感器网。 第5章程序、软件与系统 教学目的与要求: 通过本章学习,要求学生达到:掌握程序的概念,计算机语言,软件的概念;掌握操作系统的基本功能,了解不同的操作系统;了解软件工程的基本概念,软件开发方法和软件开发工具;了解知识工程和数据工程的概念和区别,知识管理与数据管理的概念和区别,以及知件的概念。 第6章数据采集与存储 教学目的与要求: 通过本章学习,要求学生达到:了解数据采集的概念、数据前期处理、数据传送方式、数据清洗和ETL技术;掌握数据结构几种基本类型,了解离散数学中的一些基本概念。掌握数据库的概念、关系数据库,范式等,了解联邦数据库和数据仓库的概念。 第7章数据统计与分析 教学目的与要求: 通过本章学习,要求学生达到:了解概率与统计中的相关概念;了解数值分析和算法分析中的一些方法;了解数据挖掘基本方法和软件工具(包括商务智能和软件)。 第8章图形学、图像处理与可视化 教学目的与要求: 通过本章学习,要求学生达到:掌握图形学、数字图像处理和可视化的概念;了解其在计算机辅助设计、计算机视觉艺术、多媒体技术、虚拟现实、计算机仿真、医学成像中的应用。 第9章人工智能 教学目的与要求:

大数据导论教学大纲

大数据导论 教学大纲 20xx年xx月

前言 一、大纲编写依据 《大数据导论》是一门通识课程,也是数据科学与大数据专业的必要先修课程,面对大一学生开设。通过该课程学习,让学生了解大数据专业的内涵特点、大数据与社会经济发展的关系以及大数据的主要学科知识和课程体系。同时培养学生大数据处理问题的思维,引导学生认知大数据技术。要求学生了解学习大数据需要掌握的基础技术知识,熟悉海量数据处理的基本流程以及与之匹配使用的主要技术和工具。通过本课程的学习,加深学生对大数据的认识,并为后续专业课程打下良好基础。 二、课程目的 1、知识目标 通过课程学习让学生掌握大数据的概念和基本特征、理清大数据、云计算与人工智能的关系,了解大数据与社会各领域的应用关系。并就大数据硬件架构和处理流程及相关技术与工具介绍,让学生了解数据预处理,Hadoop、Spark、Strom、数据存储及数据分析等技术,为后续相关课程做铺垫,让不同专业学生可选择不同方向继续大数据的深入学习。 2、能力目标 (1) 实践能力 通过本课程的学习,培养自我学习和自我设计的意识和能力;培养数据搜集、加工处理和分析的能力;通过合作学习培养沟通交往、团队协作等能力。 (2) 创新能力 通过学习大数据产生促进新应用、新技术、新工具的产生,培养学生的创新精神,在什么情况下可以尽快抓住机会,促进学生将大数据与生活结合起来,培养使用大数据技术解决问题的思维。 三、教学方法 1、课堂教学 (1) 讲授 本课程的教学内容以讲授为主,讲授的主要内容有大数据的基本概念和基本特征、大数据行业必备基础知识、数据采集与预处理方法、大数据存储与管理、大数据计算框架、数据存储技术、数据分析技术,以及大数据与热门行业云计算和人工智能的结合。根据教学大纲的要求,突出重点和难点。 (2) 教师指导下的学生自学 指导学生自主学习大数据热门技术网络爬虫、Hadoop、Spark及Strom。教师通过给出一些相关的实例帮助学生理解和进行程序设计,并布置相应的习题让学生进行练习。 (3) 其它教学方法 尽可能运用动态演示手段进行多媒体辅助教学,解决好教学内容多、信息量大与学时少

《大数据技术及应用》教学大纲

二、课程的性质、目的和任务 《大数据技术及应用》是计算机相关专业大学本科生及研究生选修的一门专业课程,通过本课程学习,使学生能较系统地掌握大数据的基本知识、原理和方法,初步具备大数据的应用、开发的能力,为从事大数据分析、建模、可视化奠定基础。目的是让学生了解并掌握四个领域即大数据系统的起源及系统特征;大数据系统的架构设计及功能目标设计;大数据系统程序开发;企业大数据案例分析的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数据开发的实践能力; 本课程重点让学生掌握三个方面的内容: (1)基础篇:主要包括HDFS使用操作、MapReduce开发;、HBase数据库的开发; (2)核心篇:YARN架构、Spark集群计算、Spark机器学习、Hive数据仓库开发; (3)应用篇:医药大数据案例分析。 三、课程教学目标 (一)总体目标

掌握大数据分析的基本理论、技术,了解大数据分析的典型应用场景、掌握如何分析数据、解决问题、完成相关研究的方法,具有创新和独立思意识。(二)具体目标 通过本课程的学习,学生应达到如下目标: 1.知识与技能 (1)了解大数据平台搭建的步骤,掌握大数据的存储、分析的原理; (2)了解大数据分析的典型应用场景,例如文本挖掘、Web广告、聚类、推荐系统、Web链接分析、社交网络大数据分析、频繁项集; (3)理解大数据分析和挖掘的基本理论技术; (4)能获取、处理、分析和应用大数据资源。 2.过程与方法 (1)经过对大数据领域的探索,学会用大数据思维认识、分析和解决问题。 3.情感与态度 (1)通过探究活动,养成认真严谨的学习态度; (2)通过师生、生生互动交流,体验大数据的价值和魅力。 四、教学内容及教学基本要求 第一章大数据概述 (一)教学目的 通过本章的学习掌握大数据基本概念,理解大数据的处理流程,了解大数据在行业中的应用和未来趋势。 (二)教学要求 1、解释大数据基本概念; 2、分析大数据的分析处理流程; 3、知道大数据技术应用场景和前景。 (三)教学内容 第一节大数据的概述知识要点:大数据的定义和特征。 第二节大数据分析的过程、技术及工具知识要点:大数据的采集、存储方式、分析技术、展示及应用。 第三节大数据的价值和影响知识要点:大数据在各行各业的重大价值、挑战与风险。

《大数据开发基础》课程教学大纲(含目录)

课程名称:大数据开发基础 英文名称:Big Data Development Foundation 适用对象:计算机专业本科三年级以上的学生 课时:32课时 一、课程性质、目的和任务 1.本课程为计算机专业大学本科生及研究生选修的一门课程; 2.目的是让学生了解并掌握四个领域(即大数据系统的起源及系统特征、大数据系统的架构设计 及功能目标设计、大数据系统程序开发、企业大数据案例分析)的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数据开发的实践能力; 3.本课程重点让学生掌握五个方面的内容: (1)HDFS使用操作; (2)MapReduce开发; (3)HBase数据库的开发; (4)Hive数据仓库开发; (5)大数据案例分析; 二、教学内容及要求 第一章大数据概述 授课学时:1 基本要求: 1.了解大数据概念、特征、数据计量单位以及大数据的类型; 2.了解大数据系统的设计背景、以及当前大数据系统存在的不足; 3.了解大数据系统的设计思想、设计目标和设计原则; 4.了解大数据系统的整体逻辑架构设计及运行逻辑,了解当前大数据系统的主流架构; 第二章大数据应用开发思路和开发环境配置 授课学时:1 基本要求: 1.掌握大数据系统应用读写操作的开发流程; 2.掌握分析大数据开发技术及思路; 3.掌握大数据Java开发的环境配置、Plugin插件的安装,Hadoop环境配置;

第三章HDFS 分布式文件系统 授课学时:4 基本要求: 1.了解HDFS设计目标、基本概念; 2.掌握HDFS文件系统的命令操作; 3.掌握Java对HDFS的程序开发操作,包含目录管理、文件列表、读取、导入导出、文件压缩等开发; 4.真机实操训练(实验环节1); 第四章 MapReduce 分布式编程 授课学时:6 基本要求: 1.了解MapReduce的设计思想、基本概念; 2.了解MapReduce的系统架构、作业运行机制和关键技术; 3.掌握MapReduce的数据类型的自定义以及数据类型的使用; 4.掌握MapReduce开发,定制输入输出的数据格式; 5.掌握将HDFS文件系统中整个文件作为输入数据的开发; 6.掌握利用MapReduce完成小文件聚合成一个大文件的开发; 7.掌握压缩数据处理程序开发; 8.掌握任务组合过程,掌握迭代组合、并行组合及串行组合; 9.掌握任务的前后链式组合; 10.掌握多数据源连接的开发,包含Map端开发以及Reduce端开发; 11.掌握Hadoop全局参数的使用,全局文件的使用; 12.掌握与关系型数据库的访问连接; 13.真机实操训练(实验环节2); 第五章 HBase 分布式数据库 授课学时:4 基本要求: 1.了解HBase分布式数据库的设计目标、基本概念; 2.了解HBase逻辑架构以及物理架构; 3.掌握HBase分布式数据库Shell命令操作; 4.掌握HBase数据库系统的Java开发,包含创建表、删除表,查询所有表操作; 5.掌握HBase数据库系统的Java开发,包含插入记录、查询数据,组合查询、修改删除记录等开发; 6.真机实操训练(实验环节3);

大数据技术原理与应用教学大纲

大数据技术原理与应用教学大纲 课程概述 入门级大数据课程,适合初学者,完备的课程在线服务体系,可以帮助初学者实现“零基础”学习大数据课程。课程采用厦门大学林子雨老师编著的国内高校第一本系统性介绍大数据知识专业教材《大数据技术原理与应用》。课程紧紧围绕“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”的指导思想,对大数据知识体系进行系统梳理,做到“有序组织、去粗取精、由浅入深、渐次展开”。课程由国内高校知名大数据教师厦门大学林子雨副教授主讲。 授课目标 课程的定位是入门级课程,本课程的目标是为学生搭建起通向“大数据知识空间”的桥梁和纽带。本课程将系统梳理总结大数据相关技术,介绍大数据技术的基本原理和大数据主要应用,帮助学生形成对大数据知识体系及其应用领域的轮廓性认识,为学生在大数据领域“深耕细作”奠定基础、指明方向。 课程大纲 第1讲大数据概述 1.1 大数据时代 1.2 大数据概念和影响 1.3 大数据的应用 1.4 大数据的关键技术 1.5 大数据与云计算、物联网 本讲配套讲义PPT-第1讲-大数据概述 第1讲大数据概述章节单元测验 第2讲大数据处理架构Hadoop 本讲实验答疑-第2讲-大数据处理架构Hadoop 2.1 概述

2.2 Hadoop项目结构 2.3 Hadoop的安装与使用 2.4 Hadoop集群的部署和使用 本讲配套讲义PPT-第2讲-大数据处理架构Hadoop 大数据处理架构Hadoop单元测验 第3讲分布式文件系统HDFS 3.1 分布式文件系统HDFS简介 3.2 HDFS相关概念 3.3 HDFS体系结构 3.4 HDFS存储原理 3.5 HDFS数据读写过程 3.6 HDFS编程实践 本讲配套讲义PPT-第3讲-分布式文件系统HDFS 分布式文件系统HDFS单元测验 第4讲分布式数据库HBase 4.1 HBase简介 4.2 HBase数据模型 4.3 HBase的实现原理 4.4 HBase运行机制 4.5 HBase应用方案 4.6 HBase安装配置和常用Shell命令 4.7 HBase常用Java API及应用实例

相关文档
最新文档