Python数据挖掘与机器学习实战 - 选题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Python数据挖掘与机器学习实战—选题大纲(一组一章,第一章除外)

或从下列选题中选择:(除第1讲)

选题名称内容结构内容要求

第1讲

机器学习与Python库(该讲不可选)解释器Python3.6与IDE:Anaconda/Pycharm

1.Python基础:列表/元组/字典/类/文件

2.numpy/scipy/matplotlib/panda

的介绍和典型使用

3.多元高斯分布

4.典型图像处理

5.scikit-learn的介绍和典型使用

6.多种数学曲线

7.多项式拟合

8.快速傅里叶变换FFT

9.奇异值分解SVD

10.Soble/Prewitt/Laplacian算子

与卷积网络

代码和案例实践

1.卷积与(指数)移动平均线

2.股票数据分析

3.实际生产问题中算法和特征的关系

4.缺失数据的处理

5.环境数据异常检测和分析

第2讲回归线性回归

1.Logistic/Softmax回归

2.广义线性回归

3.L1/L2正则化

4.Ridge与LASSO

5.Elastic Net

6.梯度下降算法:BGD与SGD

7.特征选择与过拟合

8.Softmax回归的概念源头

9.最大熵模型

10.K-L散度

代码和案例实践

1.股票数据的特征提取和应用

2.泰坦尼克号乘客缺失数据处理和存活率

预测

3.环境检测数据异常分析和预测

4.模糊数据查询和数据校正方法

5.PCA与鸢尾花数据分类

6.二手车数据特征选择与算法模型比较

7.广告投入与销售额回归分析

8.鸢尾花数据集的分类

第3讲

决策树和随机森林熵、联合熵、条件熵、KL散度、互信息

1.最大似然估计与最大熵模型

2.ID3、C4.5、CART详解

3.决策树的正则化

4.预剪枝和后剪枝

5.Bagging

6.随机森林

7.不平衡数据集的处理

8.利用随机森林做特征选择

9.使用随机森林计算样本相似度

10.异常值检测

代码和案例实践

1.随机森林与特征选择

2.决策树应用于回归

3.多标记的决策树回归

4.决策树和随机森林的可视化

5.社会学人群收入预测

6.葡萄酒数据集的决策树/随机森林分类

7.泰坦尼克乘客存活率估计

第4讲SVM 线性可分支持向量机

1.软间隔

2.损失函数的理解

3.核函数的原理和选择

4.SMO算法

5.支持向量回归SVR

6.多分类SVM

代码和案例实践:

1.原始数据和特征提取

2.调用开源库函数完成SVM

3.葡萄酒数据分类

4.数字图像的手写体识别

5.MNIST手写体识别

6.SVR用于时间序列曲线预测

7.SVM、Logistic回归、随机森林三者的

横向比较

第5讲聚类各种相似度度量及其相互关系

1.Jaccard相似度和准确率、召回率

2.Pearson相关系数与余弦相似度

3.K-means与K-Medoids及变种

4.AP算法(Sci07)/LPA算法及其应用

5.密度聚类DBSCAN/DensityPeak(Sci14)

6.谱聚类SC

7.聚类评价和结果指标

代码和案例实践:

1.K-Means++算法原理和实现

2.向量量化VQ及图像近似

3.并查集的实践应用

4.密度聚类的异常值检测

5.谱聚类用于图片分割

第6讲

隐马尔科夫模型

HMM 主题模型LDA

1.词潜入和word2vec

2.前向/后向算法

3.HMM的参数学习

4.Baum-Welch算法详解

5.Viterbi算法详解

6.隐马尔科夫模型的应用优劣比较

7.共轭先验分布

place平滑

9.Gibbs采样详解

代码和案例实践:

1.敏感话题分析

2.网络爬虫的原理和代码实现

3.LDA开源包的使用和过程分析

4.HMM用于中文分词

10.Metropolis-Hastings算法

11.MCMC

第7讲卷积神经网络卷积神经网络模型介绍

1.神经网络结构,滤波器,卷积,池化,激活

函数,反向传播

2.目标分类与识别、目标检测与追踪

l 经典AlexNet

3.高级卷积网络模型:VGG、ResNet、

GoogleLeNet、DenseNet

4.深度图片生成网络U-Net

5.物体检测:RCNN,Fast-RCNN,Faster-RCNN,

FPN系列

代码和案例实践:

1.如何搭建自己的卷积神经网络

2.迁移学习(Transfer Learning)

3.基于CNN的图像识别

4.实时人脸检测系统(视频流处理+识别+

定位 RCNN)

N文本分类

6.卷积神经网络调参经验分享

第8讲

循环神经网络RNN进阶

1.RNN基本原理

2.LSTM、GRU

3.注意力机制(Attention)

4.编码器与解码器结构

5.语言特征提取:word2vec

6.循环神经网络进阶模型

7.搭配CNN使用,组成CNN+LSTM模型

8.Bi-LSTM双向循环神经网络结构

9.Seq2seq模型

代码和案例实践:

1.如何搭建自己的循环神经网络

2.图片标注与图片问答

3.智能对话和阅读理解

4.循环神经网络调参经验分享

相关文档
最新文档