机器学习理论(双语)-教学大纲
机器学习教学大纲

采样理论基础和方法
学习方法的比较
(六)贝叶斯学习(6学时)
贝叶斯公式的基本原理、先验概率,后验概率的概念。
Brute-Force贝叶斯概念学习的基本原理和贝叶斯法则的应用
MAP假设和一致学习器ຫໍສະໝຸດ 极大似然、最小描述长度准则和最小误差平方假设原理和应用
贝叶斯最优分类器原理和算法
朴素贝叶斯分类器算法和它在文本分类中的应用
可能学习近似正确假设:假设的错误率、PAC可学习性
有限假设空间的样本复杂度
无限假设空间的样本复杂度
VC维
(八)基于实例的学习(3学时)
基于实例的学习基本原理
k-近邻法算法及实现
距离加权最近邻算法
(九)增强学习(3学时)
增强学习基本原理:一个能够感知环境的自治agent,怎样学习选择能达到其目标的最优动作。
神经网络的基本原理和表示方法。
感知器的基本原理和训练法则(梯度下降和delta法则)的基本原理
反向传播算法(BP)和训练法则。
反向传播算法的其它问题:收敛性、局部极小值等。
(五)评估假设(3学时)
对假设的精度进行经验的评估是机器学习中的基本问题。它包含
估计假设精度(样本错误率、真实错误率、置信区间等)
《机器学习》教学大纲

《机器学习》教学大纲课程编号:课程名称:机器学习英文名称:Machine Learning先修课程:高等数学(数学分析)、线性代数(高等代数)、概率论与数理统计、程序设计基础总学时数:54学时一、教学目的本课程可作为计算机科学与技术、智能科学与技术相关本科专业的必修课,也可作为其它本科专业的选修课,或者其它专业低年级研究生的选修课。
本课程的教学目的是使学生理解机器学习的基本问题和基本算法,掌握它们的实践方法,为学生今后从事相关领域的研究工作或项目开发工作奠定坚实的基础。
具体来讲,要使学生理解聚类、回归、分类、标注相关算法并掌握它们的应用方法;理解概率类模型并掌握它们的应用方法;理解神经网络类模型并掌握它们的应用方法;理解深度学习模型并掌握它们的应用方法;理解距离度量、模型评价、过拟合、最优化等机器学习基础知识;掌握特征工程、降维与超参数调优等机器学习工程应用方法。
二、教学要求总体上,本课程的教学应本着理论与实践相结合的原则,深入浅出,突出重点,在重视基础理论的同时,注意培养学生独立思考和动手能力。
在内容设计上,应以示例入手,逐步推进,详尽剖析算法思想与基本原理。
在实施方法上,应采取启发式教学方法,在简要介绍算法思想和流程的基础上,引导学生自行运行并分析实现代码。
在教学手段上,应结合板书、多媒体、网络资源等多种传授方法,提高学生兴趣。
在实验教学上,应促进学生对讲授知识的理解,开拓眼界,提升实践能力。
三、教学内容本课程内容共分为八章。
(一)绪论(1学时)【内容】机器学习的基本概念,机器学习算法及其分类,课程内容介绍,编程环境及工具包。
【重点】机器学习的基本概念,机器学习算法分类。
(二)聚类(11学时,含4学时实验课)【内容】K均值聚类及其改进算法,聚类的任务,样本点常用距离度量,聚类算法评价指标,聚类算法分类,DBSCAN算法及其派生算法,AGNES算法。
【重点】距离度量,聚类算法评价指标,K均值算法,DBSCAN算法。
课程教学大纲_机器学习

《机器学习》教学大纲课程编号:120013B课程类型:□通识教育必修课□通识教育选修课□专业选修课□学科基础课总学时:48 讲课学时:32 实验(上机)学时:16学分:3适用对象:大数据专业先修课程:概率论、数理统计、统计软件(以上标题为黑体,四号字;内容为宋体,四号字)一、教学目标(黑体,小四号字)机器学习作为一门新兴的交叉学科,它涉及统计、数学和计算机等学科领域。
通过本课程的学习使学生了解、掌握机器学习的基本方法及原理,使学生能够比较系统和全面的了解当今新的适用于当今高维复杂数据的机器学习方法,使学生能够用所学的内容进行实例分析,提高学生解决实际问题的能力。
目标1:了解、掌握机器学习的基本方法及原理目标2:了解当今新的适用于当今高维复杂数据的机器学习方法目标3:学生能够用所学的内容进行实例分析,提高学生解决实际问题的能力。
正文(宋体,小四号字)二、教学内容及其与毕业要求的对应关系(黑体,小四号字)教学内容:首先简要概述机器学习的发展历史、特点和应用领域;然后讲授回归分析及其应用,重点讲授线性回归分析方法和部分非线性回归分析方法;再讲授分类方法及其应用,重点讲授参数方法、非参数方法和集成学习方法;然后讲授聚类分析方法,重点讲授混合模型、最近邻方法等。
对拟实现的教学目标所采取的教学方法、教学手段:采取课堂讲授与上机实验相结合的方式。
课堂讲授以演示文档为主、板书为辅;上机实验以老师示范为辅、学生实验为主。
对实践教学环节的要求:要求学生在实践中能够整理数据,并能根据数据自身特点和具体目的,选取恰当的方法分析数据,根据分析结果能够进一步的指导人们的生产生活。
对课后作业、学生自学要求:课后作业和上机实验要求学生提交电子版。
该课程从哪些方面促进了毕业要求的实现:三、各教学环节学时分配(黑体,小四号字)以表格方式表现各章节的学时分配,表格如下:(宋体,小四号字)教学课时分配四、教学内容(黑体,小四号字)以“章节”为单位说明本章节的教学内容、教学重点、难点、课程的考核要求和复习思考题等,各章节格式如下:正文(宋体,小四号字)第一章绪论(了解)考核要求:学生应了解机器学习的发展历程,了解学习本门课程所应具备的数学、统计和计算机知识。
《机器学习》课程教学大纲

《机器学习》课程教学大纲课程中文名称:机器学习课程英文名称:Machine Learning适用专业:计算机应用技术,管理科学与工程总学时:36 (讲课:28 ,实验:8 )学分:2大纲撰写人:大纲审核人:编写日期:一、课程性质及教学目的:本课程是面向计算机与信息工程学院研究生开设的专业基础课。
其教学重点是使学生掌握常见机器学习算法,包括算法的主要思想和基本步骤,并通过编程练习和典型应用实例加深了解;同时对机器学习的一般理论,如假设空间、采样理论、计算学习理论,以及无监督学习和强化学习有所了解。
二、对选课学生的要求:要求选课学生事先受过基本编程训练,熟悉C/C++或Matlab编程语言,具有多元微积分、高等代数和概率统计方面基本知识。
三、课程教学内容和要求(200字左右的概述,然后给出各“章”“节”目录及内容简介)1.决策论与信息论基础:a)损失函数、错分率的最小化、期望损失的最小化等b)相对熵、互信息2.概率分布:a)高斯分布、混合高斯分布、Dirichlet分布、beta分布等b)指数分布族:最大似然估计、充分统计量、共轭先验、无信息先验等c)非参数方法:核密度估计、近邻法3.回归的线性模型:a)线性基函数模型b)贝叶斯线性回归c)贝叶斯模型比较4.分类的线性模型:a)判别函数:二分类和多分类的Fisher线性判别b)概率生成模型:连续输入、离散特征5.核方法:a)对偶表示b)构造核函数c)径向基函数网络:Nadaraya-Watson模型d)高斯过程:高斯过程模型用于回归和分类、Laplace逼近、与神经网络的联系6.支持向量机:a)最大边缘分类器:历史回顾b)用于多分类和回归的支持向量机:几何背景、各种变种c)统计学习理论简介:Vapnik等人的工作7.图模型:a)贝叶斯网络b)Markov随机场:条件独立、因子分解c)图模型中的推断8.混合模型和期望最大化(Expectation Maximization,EM)算法(3学时):a)高斯混合模型的参数估计:最大似然估计、EM算法b)EM一般算法及其应用:贝叶斯线性回归9.隐Markov模型和条件随机场模型(3学时):a)隐Markov模型:向前-向后算法、Viterbi算法、Baum-Welch算法等b)条件随机场及其应用四、课程教学环节的学时安排和基本要求1.决策论与信息论基础(2学时):了解并掌握统计决策理论和信息论的基础知识。
(完整版)机器学习教学大纲

感知器的基本原理和训练法则(梯度下降和delta法则)的基本原理
反向传播算法(BP)和训练法则。
反向传播算法的其它问题:收敛性、局部极小值等。
(五)评估假设(3学时)
对假设的精度进行经验的评估是机器学习中的基本问题。它包含
估计假设精度(样本错误率、真实错误率、置信区间等)
可能学习近似正确假设:假设的错误率、PAC可学习性
有限假设空间的样本复杂度
无限假设空间的样本复杂度
VC维
(八)基于实例的学习(3学时)
基于实例的学习基本原理
k-近邻法算法及实现
距离加权最近邻算法
(九)增强学习(3学时)
增强学习基本原理:一个能够感知环境的自治agent,怎样学习选择能达到其目标的最优动作。
学习的任务:获得一个控制策略,以选择能达到目的的行为。
Q-学习算法的原理和实现
其它问题:Q函数的设计、算法的收敛性、实验策略等
四、考核
本课程种类考查课,可采取期末书面考查或论文撰写等形式。
五、实践环节(16学时)
实验内容:
利用java语言进行编程设计实现下面的算法
决策树算法的设计与实现
人工神经网络(BP算法的设计和实现)
三、教学要求
教学内容本着少而精的原则,突出重点,深入浅出,在重视基础理论的同时,注意培养学生独立思考的能力,同时注意引导学生用学到的理论来解决本方向中的一些实际的问题,达到为研究生开设这门课的意义和目的。
四、主要教学内容
本课程的讲授分为8章
(一)绪论(4学时)
机器学习的一般原理及相关概念
学习问题的标准描述
采样理论基础和方法
学习方法的比较
(六)贝叶斯学习(6学时)
《机器学习》课程教学大纲

《机器学习》课程教学大纲一、课程基本信息课程代码:21133600课程中文名称:机器学习课程英文名称:Machine Learning讲课学时/学分:32/2课内实验学时/学分: 8课外实验/科研实践学时:8课外研讨学时:课外素质拓展学时:课程类别:专业选修课课程性质:选修授课语种:中文适用专业:软件工程开设学期:第五学期先修课程:无责任单位:二、课程地位与作用《机器学习》课程是软件工程专业的专业选修课。
2017年7月8日国务院发布关于印发新一代人工智能发展规划的通知,宣布我国人工智能技术的战略目标:2025年人工智能基础理论实现重大突破,2030年人工智能理论、技术与应用总体达到世界领先水平。
2018年4月2日教育部发布关于印发《高等学校人工智能创新行动计划》的通知,指出加快机器学习等核心关键技术研究,形成新一代人工智能技术体系。
机器学习作为人工智能技术的基础,是一门多学科融合的技术,通过机器学习,使计算机系统具有从数据中“学习”经验的能力以便实现人工智能。
通过本课程的学习,学生将理解机器学习的原理,掌握常见机器学习方法中主要算法、较新的深度学习网络,通过实验提高机器学习算法编程和应用的能力,能够跟踪机器学习发展前沿,为学生将来从事人工智能相关工作或研究打下基础。
三、课程内容简介本课程涵盖了机器学习的大部分内容,从机器学习原理到实际应用,从传统机器学习方法到深度学习等该领域近年来较新的研究。
具体包括:机器学习基础、数据预处理、分类算法、决策树、支持向量机、回归分析、聚类分析、神经网络训练与深度学习、卷积神经网络、循环神经网络、图神经网络、生成对抗网络等内容。
四、课程目标及对毕业要求的支撑通过本课程的学习,应达到的目标及能力如下:目标1:掌握机器学习相关的专业术语,了解机器学习的发展动态,能够查阅该领域的中英文文献。
目标2:了解监督/无监督学习方法,了解回归任务和分类任务,了解人工神经网络的原理和基本结构。
(完整版)《机器学习》课程教学大纲

《机器学习》课程授课大纲课程中文名称:机器学习课程英文名称:Machine Learning适用专业:计算机应用技术,管理科学与工程总学时: 36(讲课:28 ,实验: 8)学分: 2大纲撰写人:大纲审察人:编写日期:一、课程性质及授课目标:本课程是面向计算机与信息工程学院研究生开设的专业基础课。
其授课重点是使学生掌握常有机器学习算法,包括算法的主要思想和基本步骤,并经过编程练习和典型应用实例加深认识;同时对机器学习的一般理论,如假设空间、采样理论、计算学习理论,以及无督查学习和增强学习有所认识。
二、对选课学生的要求:要求选课学生早先受过基本编程训练,熟悉C/C++ 或 Matlab 编程语言,拥有多元微积分、高等代数和概率统计方面基本知识。
三、课程授课内容和要求( 200 字左右的归纳,尔后给出各“章”“节”目录及内容简介)1.决策论与信息论基础:a)损失函数、错分率的最小化、希望损失的最小化等b)相对熵、互信息2.概率分布:a)高斯分布、混杂高斯分布、 Dirichlet 分布、 beta 分布等b)指数分布族:最大似然估计、充足统计量、共轭先验、无信息先验等c)非参数方法:核密度估计、近邻法3.回归的线性模型:a)线性基函数模型b)贝叶斯线性回归c)贝叶斯模型比较4.分类的线性模型:a) 鉴识函数:二分类和多分类的Fisher 线性鉴识b)概率生成模型:连续输入、失散特色5.核方法:a)对偶表示b)构造核函数c)径向基函数网络: Nadaraya-Watson 模型d) 高斯过程:高斯过程模型用于回归和分类、Laplace 逼近、与神经网络的联系6.支持向量机:a)最大边缘分类器:历史回顾b)用于多分类和回归的支持向量机:几何背景、各种变种c)统计学习理论简介: Vapnik 等人的工作7.图模型:a)贝叶斯网络b)Markov 随机场:条件独立、因子分解c)图模型中的推断8.混杂模型和希望最大化( Expectation Maximization , EM)算法( 3 学时):a) 高斯混杂模型的参数估计:最大似然估计、EM 算法b)EM 一般算法及其应用:贝叶斯线性回归9. 隐 Markov 模型和条件随机场模型( 3 学时):a)隐 Markov 模型:向前 -向后算法、 Viterbi 算法、 Baum-Welch 算法等b)条件随机场及其应用四、课程授课环节的学时安排和基本要求1.决策论与信息论基础( 2 学时):认识并掌握统计决策理论和信息论的基础知识。
(完整版)《机器学习》课程教学大纲

《机器学习》课程教学大纲课程中文名称:机器学习课程英文名称:Machine Learning适用专业:计算机应用技术,管理科学与工程总学时:36 (讲课:28 ,实验:8 )学分:2大纲撰写人:大纲审核人:编写日期:一、课程性质及教学目的:本课程是面向计算机与信息工程学院研究生开设的专业基础课。
其教学重点是使学生掌握常见机器学习算法,包括算法的主要思想和基本步骤,并通过编程练习和典型应用实例加深了解;同时对机器学习的一般理论,如假设空间、采样理论、计算学习理论,以及无监督学习和强化学习有所了解。
二、对选课学生的要求:要求选课学生事先受过基本编程训练,熟悉C/C++或Matlab编程语言,具有多元微积分、高等代数和概率统计方面基本知识。
三、课程教学内容和要求(200字左右的概述,然后给出各“章”“节”目录及内容简介)1.决策论与信息论基础:a)损失函数、错分率的最小化、期望损失的最小化等b)相对熵、互信息2.概率分布:a)高斯分布、混合高斯分布、Dirichlet分布、beta分布等b)指数分布族:最大似然估计、充分统计量、共轭先验、无信息先验等c)非参数方法:核密度估计、近邻法3.回归的线性模型:a)线性基函数模型b)贝叶斯线性回归c)贝叶斯模型比较4.分类的线性模型:a)判别函数:二分类和多分类的Fisher线性判别b)概率生成模型:连续输入、离散特征5.核方法:a)对偶表示b)构造核函数c)径向基函数网络:Nadaraya-Watson模型d)高斯过程:高斯过程模型用于回归和分类、Laplace逼近、与神经网络的联系6.支持向量机:a)最大边缘分类器:历史回顾b)用于多分类和回归的支持向量机:几何背景、各种变种c)统计学习理论简介:Vapnik等人的工作7.图模型:a)贝叶斯网络b)Markov随机场:条件独立、因子分解c)图模型中的推断8.混合模型和期望最大化(Expectation Maximization,EM)算法(3学时):a)高斯混合模型的参数估计:最大似然估计、EM算法b)EM一般算法及其应用:贝叶斯线性回归9.隐Markov模型和条件随机场模型(3学时):a)隐Markov模型:向前-向后算法、Viterbi算法、Baum-Welch算法等b)条件随机场及其应用四、课程教学环节的学时安排和基本要求1.决策论与信息论基础(2学时):了解并掌握统计决策理论和信息论的基础知识。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教学大纲《机器学习理论(双语)》教学大纲课程编号:111103A课程类型:□通识教育必修课□通识教育选修课□专业必修课■专业选修课□学科基础课总学时:48 讲课学时:32 实验(上机)学时:16学分:3适用对象:投资学专业先修课程:金融计算机语言、金融计量学、量化金融学(双语)一、教学目标当代投资学越来越多的采用人工智能技术解决复杂投资决策问题。
人工智能的理论和技术在当代投资中的地位越来越重要,甚至已有取代传统投资决策和方法技术之趋势,因此投资学专业学生需要系统的学习人工智能理论在金融投资中的应用。
人工智能的理论和技术主要来自于机器学习理论。
本课程系统的向学生讲授机器学习理论。
机器学习理论与计算机编程、统计学以及计量经济学有密切的联系,因此学生在学习本课程前需要有足够的背景知识。
本课程将通过介绍机器学习理论,让学生了解如何利用机器学习理论以及人工智能技术进行金融问题研究和进行量化投资决策。
该课程是专业必修课中的一门重要课程,是一门跨学科的复合型课程,因此需要学生对各先修学科有扎实的基础,本课程突出学习前沿人工智能理论知识与应用相结合,重点培养学生综合运用跨学科知识进行量化投资。
学生在学好本课程后,将对其后续课程以及毕业论文设计帮助巨大,也将增强学生在大数据人工智能时代的就业竞争优势。
目标1:掌握主流和前沿的机器学习理论目标2:熟练运用机器学习理论结合投资学知识解决具体问题目标3:融会贯通投资学、统计学、计量经济学、计算机编程以及机器学习理论,提升处理复杂投资决策问题的能力。
目标4:充分了解投资学发展的前沿,了解人工智能与投资学发展逻辑联系。
二、教学内容及其与毕业要求的对应关系(一)教学内容《机器学习理论》涉及三大板块知识。
即基础理论知识介绍、上机实习和综合运用。
在基础知识模块主要介绍和讲授机器学习理论的主要知识框架,包括:监督学习、无监督学习和强化学习,其中监督学习中的若干模型属于精讲内容,无监督学习属于细讲的内容,而强化学习属于粗讲的内容。
上机环节主要采用Python、Matlab以及R语言,结合学理论知识,熟练运用计算机语言调用相关理论模型。
因为这是一门跨学科复合型课程,在课程的后半段,教学内容将突出综合应用,采取在给定适当投资场景的前提下,以案例分析的形式,让学生构建模型,提升综合能力。
案例包括(但不限于):量化投资与智能选股、人工智能与衍生品定价、机器学习理论在股票预测中的应用、强化学习与投资决策、监督学习与信用风险识别等。
此外,课程还会从行业发展与产业经济学视角,引导学生了解智能投资以及科技金融行业发展前景与趋势,引导学生思考新兴智能技术对金融投资行业职业的道德操守伦理冲击等前沿前瞻型问题。
(二)教学方法与教学手段本课以课堂讲授为主,上机实习为辅,间之以案例教学、随堂练习和课后作业,使学生既能掌握理论,也能动手操作,切实做到理论与实践相结合。
课堂授课内容突出了前瞻性、前沿性,上机实习环节使得学生有机会提升动手能力,解决复杂问题的能力,突出了应用性人才培养的目标,切实做到理论与实践相结合。
(三)学习要求由于本课程实践性比较强,所以修读本课程须前期熟练掌握量化金融学(双语)、投资学、金融学、计量经济学等基础知识。
考虑到本课程理论性较强,所以本课程的随堂练习和课后作业相对较多。
学生须课前预习,课后复习。
任课老师不定期的安排随堂测验。
(四)实践环节要求为保证学生能深刻的理解理论知识,本课程安排了若干计算机编程与模型的实践环节,因此要求学生对先修课程《金融计算机语言》有熟练的掌握,需熟练使用Python、Matlab以及R语言,学生个人电脑中应安装这三种软件,便于完成随堂、课后作业。
(五)教学中应注意的问题因为本课程是理论性非常强的学科,因此要求学生对前期知识掌握熟练,有综合运用前期知识的能力,学生学习该课程最终优秀与否,取决于对前期课程知识的把握和熟练应用程度,因此在教学中任课老师因重点关注那些先修课程成绩不突出的学生,避免这些学生因为前期基础不扎实而掉队,失去上课的热情和积极性。
三、各教学环节学时分配以表格方式表现各章节的学时分配,表格如下:教学课时分配四、教学内容第一章导论第一节机器学习理论简介第二节机器学习理论的应用1.学习联合2.分类3.回归分析4.无监督学习5.增强学习本章是关于机器学习理论的导论章节,重点介绍了机器学习理论研究的重点以及机器学习理论目前主流的研究学派。
教学难点与重点:让学生了解机器学习理论研究的主要研究任务和主要的三大流派的研究方式、关注点是本章主要的讲授重点。
教学难点是让学生理解机器学习理论与统计学习理论的区别联系,以及和统计学、计量经济学的联系和区别。
课程的考核要求:复习思考题:1.什么是机器学习理论?其研究焦点是什么?2.简述机器学习理论和统计学习理论的区别和联系。
3.谈谈你对机器学习理论和计量经济学联系和区别的认识。
4.什么是监督学习?什么是无监督学习?什么是增强学习?第二章监督学习理论第一节监督学习的基本术语与概念第二节 Vapnik-Chervonenkis空间第三节正确学习的可能近似思想第四节机器学习模型中的噪音问题第五节多类学习问题第六节回归理论与监督学习理论第七节模型选择与一般化问题第八节监督学习模型的建模技巧监督学习作为机器学习理论中三大学习理论流派之一,有较为成熟的理论基础和完整的研究体系,因此本章是本课程教授的重点章节之一,学生只有充分的理解本章讲授的知识才可为以后的学习打下坚实的基础。
本章主要系统的讲授了监督学习的基本术语及相关概念,进而引入Vapnik-Chervonenkis空间,然后和学生介绍监督学习问题研究研究场景,基于特定的研究场景展开讨论。
教学难点与重点:本章主要是让学生了解和熟悉涉及监督学习理论的专业术语,并让学生掌握和理解这些专业术语的含义。
Vapnik-Chervonenkis空间的概念是教学的难点。
课程的考核要求:掌握复习思考题:1.什么是Vapnik-Chervonenkis空间?2.简述监督学习的研究场景。
3.用你自己的语言阐述在监督学习场景下,监督学习模型一般能帮你完成什么样的工作?4.什么是训练集?什么是测试集?5.简述监督学习模型的建模技巧。
第三章贝叶斯决策理论第一节贝叶斯统计导论第二节分类问题与贝叶斯决策第三节损失与风险第四节判别函数与关联准则本章是一章重要的理论课程章节。
因为主流的机器学习理论的理论分析框架是构建在贝叶斯决策理论分析框架下,因此有必要将贝叶斯理论较为系统和全面的介绍给学生,因此本章是整个课程的重点章节之一。
教学难点与重点:介绍贝叶斯决策理论是本章的重点,该章节有一定的理论难度,要求学生有较好的统计学背景,贝叶斯决策理论中的损失与风险是授课的难点,在教学中应做到理论与实际应用相结合,利用浅显的案例说明复杂的统计学理论思想,便于学生理解和掌握。
课程的考核要求:掌握复习思考题:1.简述贝叶斯决策理论的基本思想。
2.简述贝叶斯决策理论与分类问题的关系。
3.请用贝叶斯决策理论的思想简述什么是损失函数?第四章参数模型与方法第一节参数模型的基本思想第二节极大似然估计1.伯努力分布2.多元正态分布第三节偏差与方差在估计量评估中的应用第四节贝叶斯估计量第五节参数分类方法与原理第六节回归分析第七节模型复杂度研究第八节模型选择的步骤本章也是本课程需要重点讲授的章节之一,涉及大量的统计学以及计量经济学的概念,但是因为学生已修过数理统计和计量经济学相关课程,因此学生在接受本章节的知识时应不陌生。
可以认为本章是机器学习理论视角下人工智能科研人员对回归分析、参数估计等计量经济学知识的思考。
因此,本章的教学任务更多的是需要引导学生思考为何计量经济学和机器学习理论对同一模型(比如:回归模型)有不同的视角。
教学难点与重点:本章节重点讲授机器学习理论视角下的极大似然估计、贝叶斯估计、回归分析等模型。
本章的难点是引导学生思考计量经济学与机器学习理论的区别和联系。
课程的考核要求:掌握、应用复习思考题:1.什么是统计推论?什么是预测?2.你上学期已学习过了《计量经济学》,这学期在本课程中又学习了回归模型,谈谈这两门课讲授回归模型时的区别,以及你认为造成这种区别的原因是什么?3.什么是贝叶斯估计?4.什么是BLUE?第五章多元模型与方法第一节多元数据结构第二节多元参数估计第三节缺失数据问题第四节多元正态分布与多元分类问题第五节模型复杂度问题研究第六节离散特征与多元回归模型本章将上一章讨论的单元问题拓展到多元问题,重点讨论了多元参数估计问题、数据缺失问题、多元分类问题、模型复杂度问题和当被解释变量为离散变量时的分类问题。
教学难点与重点:重点讲授多元分类问题、模型复杂度问题等问题。
本章的难点主要是让学生理解模型复杂度的概念。
课程的考核要求:了解复习思考题:1.什么是模型复杂度?第六章降维技术第一节无监督学习导论第二节子集选择问题第三节主成份分析法第四节特征嵌入第五节因子分析第六节奇异值分解与矩阵因子分解第七节多维缩放比例模型第八节线性判别式分析第九节典型相关分析第十节 Isomap模型的原理与应用第十一节局部线性嵌入模型第十二节拉普拉斯特征图模型本章主要讲授了主流的数据榨取技术。
数据榨取技术是大数据时代分析海量数据重要的技术手段,该技术的核心思想是“降维技术”,学生首先需要理解降维技术的应用场景以及主要的算法和理论。
本章的第一和第二小节介绍了降维技术的基本概念和相关术语。
本章的第三至第十二节,共九节,每一节介绍了一种主流的降维算法。
教学难点与重点:该章要求学生有扎实的线性代数和数理统计学基础,本章节重点讲授九种降维技术。
教学的难点是本章算法多、数理统计知识和线性代数知识要求高,学生在学习中会有一定压力,因此授课老师应注重理论和实验相结合,帮助学习理解和掌握这九种降维算法。
课程的考核要求:掌握、应用复习思考题:1.什么是PCA?什么是SVD?2.简述PCA和LDA的区别。
3.什么是CCA?什么是偏最小二乘法?4.偏最小二乘法与PCA的区别和联系?5.什么是Isomap?什么是LLE?简述它们的区别和联系。
6.什么是因子分析法?它和《金融计量学》和《投资学》中讲授的因子分析是一样的吗?7.实证金融学中常提到的数据侦视(data scoping)概念和人工智能研究人员提到的数据挖掘(data mining)概念有什么区别和联系?8.什么是Laplacian Eigenmaps?第七章聚类分析第一节聚类分析导论第二节混合密度第三节 K-均值聚类分析第四节 EM算法入门第五节混合隐变量模型第六节谱分析视角下的聚类分析第七节分层聚类模型第八节聚类模型的优势与局限本章讲授聚类分析,该理论是无监督学习理论的重要组成部分,因此本章的知识是本课程的授课重点之一。