Python数据挖掘与机器学习实战 - 选题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Python数据挖掘与机器学习实战—选题大纲(一组一章,第一章除外)
或从下列选题中选择:(除第1讲)
选题名称内容结构内容要求
第1讲
机器学习与Python库(该讲不可选)解释器Python3.6与IDE:Anaconda/Pycharm
1.Python基础:列表/元组/字典/类/文件
2.numpy/scipy/matplotlib/panda
的介绍和典型使用
3.多元高斯分布
4.典型图像处理
5.scikit-learn的介绍和典型使用
6.多种数学曲线
7.多项式拟合
8.快速傅里叶变换FFT
9.奇异值分解SVD
10.Soble/Prewitt/Laplacian算子
与卷积网络
代码和案例实践
1.卷积与(指数)移动平均线
2.股票数据分析
3.实际生产问题中算法和特征的关系
4.缺失数据的处理
5.环境数据异常检测和分析
第2讲回归线性回归
1.Logistic/Softmax回归
2.广义线性回归
3.L1/L2正则化
4.Ridge与LASSO
5.Elastic Net
6.梯度下降算法:BGD与SGD
7.特征选择与过拟合
8.Softmax回归的概念源头
9.最大熵模型
10.K-L散度
代码和案例实践
1.股票数据的特征提取和应用
2.泰坦尼克号乘客缺失数据处理和存活率
预测
3.环境检测数据异常分析和预测
4.模糊数据查询和数据校正方法
5.PCA与鸢尾花数据分类
6.二手车数据特征选择与算法模型比较
7.广告投入与销售额回归分析
8.鸢尾花数据集的分类
第3讲
决策树和随机森林熵、联合熵、条件熵、KL散度、互信息
1.最大似然估计与最大熵模型
2.ID3、C4.5、CART详解
3.决策树的正则化
4.预剪枝和后剪枝
5.Bagging
6.随机森林
7.不平衡数据集的处理
8.利用随机森林做特征选择
9.使用随机森林计算样本相似度
10.异常值检测
代码和案例实践
1.随机森林与特征选择
2.决策树应用于回归
3.多标记的决策树回归
4.决策树和随机森林的可视化
5.社会学人群收入预测
6.葡萄酒数据集的决策树/随机森林分类
7.泰坦尼克乘客存活率估计
第4讲SVM 线性可分支持向量机
1.软间隔
2.损失函数的理解
3.核函数的原理和选择
4.SMO算法
5.支持向量回归SVR
6.多分类SVM
代码和案例实践:
1.原始数据和特征提取
2.调用开源库函数完成SVM
3.葡萄酒数据分类
4.数字图像的手写体识别
5.MNIST手写体识别
6.SVR用于时间序列曲线预测
7.SVM、Logistic回归、随机森林三者的
横向比较
第5讲聚类各种相似度度量及其相互关系
1.Jaccard相似度和准确率、召回率
2.Pearson相关系数与余弦相似度
3.K-means与K-Medoids及变种
4.AP算法(Sci07)/LPA算法及其应用
5.密度聚类DBSCAN/DensityPeak(Sci14)
6.谱聚类SC
7.聚类评价和结果指标
代码和案例实践:
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第6讲
隐马尔科夫模型
HMM 主题模型LDA
1.词潜入和word2vec
2.前向/后向算法
3.HMM的参数学习
4.Baum-Welch算法详解
5.Viterbi算法详解
6.隐马尔科夫模型的应用优劣比较
7.共轭先验分布
place平滑
9.Gibbs采样详解
代码和案例实践:
1.敏感话题分析
2.网络爬虫的原理和代码实现
3.LDA开源包的使用和过程分析
4.HMM用于中文分词
10.Metropolis-Hastings算法
11.MCMC
第7讲卷积神经网络卷积神经网络模型介绍
1.神经网络结构,滤波器,卷积,池化,激活
函数,反向传播
2.目标分类与识别、目标检测与追踪
l 经典AlexNet
3.高级卷积网络模型:VGG、ResNet、
GoogleLeNet、DenseNet
4.深度图片生成网络U-Net
5.物体检测:RCNN,Fast-RCNN,Faster-RCNN,
FPN系列
代码和案例实践:
1.如何搭建自己的卷积神经网络
2.迁移学习(Transfer Learning)
3.基于CNN的图像识别
4.实时人脸检测系统(视频流处理+识别+
定位 RCNN)
N文本分类
6.卷积神经网络调参经验分享
第8讲
循环神经网络RNN进阶
1.RNN基本原理
2.LSTM、GRU
3.注意力机制(Attention)
4.编码器与解码器结构
5.语言特征提取:word2vec
6.循环神经网络进阶模型
7.搭配CNN使用,组成CNN+LSTM模型
8.Bi-LSTM双向循环神经网络结构
9.Seq2seq模型
代码和案例实践:
1.如何搭建自己的循环神经网络
2.图片标注与图片问答
3.智能对话和阅读理解
4.循环神经网络调参经验分享