(含答案)机器学习第一阶段练习题
机器学习考试题目及答案

机器学习考试题目答案1.简描述机器学习概念?TomMitCheI1:"对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习J 我们遇到的大部分事情一般包括分类问题与回归问题。
如房价的预测,股价的预测等属于分类问题。
一般的处理过程是:首先,1)获取数据;2)提取最能体现数据的特征;3)利用算法建模;4)将建立的模型用于预测。
如人脸识别系统,首先我们获取到一堆人脸照片,首先,对数据进行预处理,然后提取人脸特征,最后用算法如SVM或者NN等。
这样,我们就建立了一个人脸识别系统,当输入一张人脸,我们就知道这张面孔是否在系统中。
这就是机器学习的整个流程,其次还包括寻找最优参数等。
机器学习主要分为:监督学习:数据集是有标签的,大部分机器学习模型都属于这一类别,包括线性分类器、支持向量机等等;无监督学习:跟监督学习相反,数据集是完全没有标签的,主要的依据是相似的样本在数据空间中一般距离是相近的,这样就能通过距离的计算把样本分类,这样就完全不需要IabeI,比如著名的kmeans算法就是无监督学习应用最广泛的算法;半监督学习:半监督学习一般针对的问题是数据量超级大但是有标签数据很少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的而有一部分是没有的;强化学习:一直激励学习的方式,通过激励函数来让模型不断根据遇到的情况做出调整;2.循环神经网络的基本原理?RNNS的目的是用来处理序列数据。
在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。
但是这种普通的神经网络对于很多问题却无能无力。
例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。
RNNS之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。
具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。
机器学习知到章节答案智慧树2023年三亚学院

机器学习知到章节测试答案智慧树2023年最新三亚学院第一章测试1.下面哪句话是正确的()参考答案:增加模型的复杂度,总能减小训练样本误差2.评估模型之后,得出模型存在偏差,下列哪种方法可能解决这一问题()参考答案:向模型中增加更多的特征3.以垃圾微信识别为例,Tom Mitchell的机器学习的定义中,任务T是什么?()参考答案:T是识别4.如何在监督式学习中使用聚类算法()?参考答案:在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征;首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法5.想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()?参考答案:对训练集随机采样,在随机采样的数据上建立模型;使用PCA算法减少特征维度;尝试使用在线机器学习算法6.机器学习兴起于()。
参考答案:1990年;1980年7.监督学习包括是()。
参考答案:分类;回归8.机器学习可以对电子商务产品评价进行好评与差评分类。
()参考答案:对9.机器学习必备知识包括数学基础、心理学基础、算法设计基础、商业模式基础。
()参考答案:错10.机器学习是一门多学科交叉专业,涵盖____、____、近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
参考答案:null第二章测试1.关于k-NN算法,以下哪个选项是正确的?参考答案:可用于分类和回归2.k-NN算法在测试时间而不是训练时间上进行了更多的计算。
参考答案:对3.假设算法是k最近邻算法,在下面的图像中,____将是k的最佳值。
参考答案:104.一个kNN分类器,该分类器在训练数据上获得100%的准确性。
而在客户端上部署此模型时,发现该模型根本不准确。
以下哪项可能出错了?注意:模型已成功部署,除了模型性能外,在客户端没有发现任何技术问题参考答案:可能是模型过拟合5.以下是针对k-NN算法给出的两条陈述,其中哪一条是真的?1、我们可以借助交叉验证来选择k的最优值2、欧氏距离对每个特征一视同仁参考答案:1和26.你给出了以下2条语句,发现在k-NN情况下哪个选项是正确的?1、如果k的值非常大,我们可以将其他类别的点包括到邻域中。
机器学习原理及应用习题答案

第一章的题目填空题1、常见的机器学习算法有_________、___________、___________(随意列举三个)答:逻辑回归、最大熵模型、k-近邻模型、决策树、朴素贝叶斯分类器、支持向量机、高斯混合模型、隐马尔可夫模型、降维、聚类、深度学习2、sklearn.model_selection中的train_test_split函数的常见用法为______,______,______,______ = train_test_split(data,target)(填写测试集和训练集名称,配套填写,例如x_train,x_test)答:x_train x_test y_train y_test3、根据机器学习模型是否可用于生成新数据,可以将机器学习模型分为_________和_________。
答:生成模型判别模型4、训练一个机器学习模型往往需要对大量的参数进行反复调试或者搜索,这一过程称为______。
其中在训练之前调整设置的参数,称为_________。
答:调参超参数5、根据样本集合中是否包含标签以及半包含标签的多少,可以将机器学习分为____________、____________和______________。
答:监督学习半监督学习无监督学习判断题1、根据模型预测输出的连续性,可以将机器学习算法适配的问题划分为分类问题和线性问题。
(F)(回归问题)2、决策树属于典型的生成模型。
(F)(判别模型)3、降维、聚类是无监督学习算法(T)4、当我们说模型训练结果过拟合的时候,意思是模型的泛化能力很强(F)(很差)5、训练误差和泛化误差之间的差异越小,说明模型的泛化性能越好。
(T)选择题1、以下属于典型的生成模型的是(D)A、逻辑回归B、支持向量机C、k-近邻算法D、朴素贝叶斯分类器2、以下属于解决模型欠拟合的方法的是(C)A、增加训练数据量B、对模型进行裁剪C、增加训练过程的迭代次数D、正则化3、构建一个完整的机器学习算法需要三个方面的要素,分别是数据、模型、(A)。
机器学习课后习题答案

第二章 模型评估与选择1.数据集包含1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。
一个组合问题,从500500正反例中分别选出150150正反例用于留出法评估,所以可能取法应该是(C 500150)2。
2.数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别(训练样本数相同时进行随机猜测),试给出用10折交叉验证法和留一法分别对错误率进行评估所得的结果。
10折交叉检验:由于每次训练样本中正反例数目一样,所以讲结果判断为正反例的概率也是一样的,所以错误率的期望是5050%。
留一法:如果留下的是正例,训练样本中反例的数目比正例多一个,所以留出的样本会被判断是反例;同理,留出的是反例,则会被判断成正例,所以错误率是100%。
3.若学习器A 的F1值比学习器B 高,试析A 的BEP 值是否也比B 高。
4.试述真正例率(TPR )、假正例率(FPR )与查准率(P )、查全率(R )之间的联系。
查全率: 真实正例被预测为正例的比例真正例率: 真实正例被预测为正例的比例显然查全率与真正例率是相等的。
查准率:预测为正例的实例中真实正例的比例假正例率: 真实反例被预测为正例的比例两者并没有直接的数值关系。
第一章 绪论(略)机器学习(周志华)参考答案9.试述卡方检验过程。
第三章线性模型2.试证明,对于参数w,对率回归(logistics回归)的目标函数(式1)是非凸的,但其对数似然函数(式2)是凸的。
如果一个多元函数是凸的,那么它的Hessian矩阵是半正定的。
3.编程实现对率回归,并给出西瓜数据集3.0α上的结果/icefire_tyh/article/details/520688444.选择两个UCI数据集,比较10折交叉验证法和留一法所估计出的对率回归的错误率。
/icefire_tyh/article/details/520689005.编程实现线性判别分析,并给出西瓜数据集3.0α上的结果。
机器学习原理与实战课后习题答案

机器学习原理与实战课后习题答案第1章填空题答案(1)前期(2)无(3)无关相关不强(4)验证集(5)分布漂移(Distribution Drift)第1章选择题答案(1)D(2)C(3)A(4)C(5)B(6)A(7)B(8)C(9)A(10)D第2章填空题答案(1)决定分点、列出频率分布表、绘制频率分布直方图(2)concat、merge、join(3)散点图、热力图、Pearson相关系数、判定系数(4)集中趋势度量离散程度度量(5)数据分布与趋势探查、数据清洗、和、数据合并第2章选择题答案(1)D(2)D(3)B(4)B(5)D(6)D(7)D(8)A(9)B(10)C第3章填空题答案(1)特征变换(2)标准化、函数转换离散化(3)L1正则化、L2正则化(4)过滤式选择、包裹式选择、嵌入式选择、或、字典学习(5)离差标准化、标准差标准化、和、小数定标标准化第3章选择题答案(1)D(2)C(3)A(4)A(5)C(6)D(7)D(8)C(9)D(10)D第3章操作题# 第(1)题from sklearn.datasets import load_irisiris_data = load_iris()import numpy as npimport pandas as pdcol_names = iris_data['feature_names'] + ['target']data = pd.DataFrame(data= np.c_[iris_data['data'],iris_data['target']], columns=col_names)data.head()# 标准差标准化def StandarScale(data):x = np.array(data)[:,:-1]y = np.array(data)[:,-1:]x_scale = (x-x.mean(axis = 0))/(x.std(axis = 0))return pd.DataFrame(np.concatenate((x_scale,y),axis = 1),columns = data.columns)data_s_scale = StandarScale(data)print('标准差标准化之前的前5行数据为:')data.head()print('标准差标准化之后的前5行数据为:')data_s_scale.head()data_s_scale.to_csv('../tmp/data_s_scale.csv')# 第(2)题from sklearn.datasets import load_bostonboston_data = load_boston()import pandas as pdimport numpy as npcol_names = list(boston_data['feature_names'])+['target']data =pd.DataFrame(np.c_[boston_data['data'],boston_data['target']],columns = col_names)x = boston_data['data']y = boston_data['target']# 过滤式选择,选择5个变量 SelectKBest,既可以用于分类变量,也可以用于连续性变量。
人工智能机器学习技术练习(习题卷9)

人工智能机器学习技术练习(习题卷9)第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]下面哪个/些超参数的增加可能会造成随机森林数据过拟合?A)树的数量B)树的深度C)学习速率答案:B解析:通常情况下,我们增加树的深度有可能会造成模型过拟合。
学习速率并不是随机森林的超参数。
增加树的数量可能会造成欠拟合。
2.[单选题]属于常见问题解答模块的主要技术的是( )。
[] *A问句相似度计算A)语料库的构建B)查询扩展C)模式匹配答案:A解析:3.[单选题]采样分析的精确性随着采样随机性的增加而(),但与样本数量的增加关系不大。
A)降低B)不变C)提高D)无关答案:C解析:采样分析的精确性随着采样随机性的增加而提高,但与样本数量的增加关系不大。
当样本数量达到某个值后,我们从新个体上得到的信息会越来越少。
4.[单选题]以下表达式书写错误的是A)year('2015-12-31 12:21')B)month(2015-10-31)C)day('2015-12-11')D)date_sub('2015-12-01',3)答案:B解析:5.[单选题]下列分类方法中不会用到梯度下降法的是( )A)感知机B)最小二乘分类器C)最小距离分类器D)Logistic回归答案:C解析:C)松弛变量可用来解决线性不可分问题D)支持向量机可用来进行数据的分类答案:B解析:7.[单选题]关于Logistic回归和SVM,以下说法错误的是?A)Logistic回归可用于预测事件发生概率的大小B)Logistic回归的目标函数是最小化后验概率C)SVM的目标的结构风险最小化D)SVM可以有效避免模型过拟合答案:B解析:Logit回归本质上是一种根据样本对权值进行极大似然估计的方法,而后验概率正比于先验概率和似然函数的乘积。
logit仅仅是最大化似然函数,并没有最大化后验概率,更谈不上最小化后验概率。
人工智能工程师(机器学习)试题及答案

人工智能工程师(机器学习)试题及答案1. 请解释机器研究是什么以及它在人工智能领域中的作用。
机器研究是一种人工智能分支,旨在使计算机系统能够通过从数据中研究和自动推断来改善性能。
它通过训练模型来识别和理解模式,并基于这些模式做出预测或做出决策。
在人工智能领域中,机器研究为解决复杂的问题提供了一种有效的方式,例如图像和语音识别、自然语言处理、推荐系统等。
2. 请简述监督研究和无监督研究的区别。
3. 请列举几个常用的机器研究算法,并简要描述它们的应用领域。
- 线性回归:应用于预测数值型结果的问题,如房价预测。
- 逻辑回归:常用于分类问题,如垃圾邮件过滤。
- 决策树:用于处理分类和回归问题,如客户信用评级。
- 支持向量机:适用于二元分类问题,例如图像分类和文本分类。
- 随机森林:可用于分类和回归问题,如医学诊断和股票市场预测。
- 集成研究:通过结合多个研究器来提高性能,如AdaBoost、Bagging等。
- 深度研究:用于复杂的模式识别和自然语言处理问题,如图像和语音识别。
4. 请解释过拟合和欠拟合,并提供避免过拟合的方法。
避免过拟合的方法包括:- 使用正则化技术,如L1或L2正则化,以减小模型复杂度。
- 使用交叉验证来选择合适的超参数和模型结构。
5. 请解释ROC曲线和AUC的含义,并说明它们在评估分类模型性能时的作用。
ROC曲线是一种用于评估二元分类模型的性能的可视化工具。
它以真阳性率(True Positive Rate,TPR)为纵轴,假阳性率(False Positive Rate,FPR)为横轴,绘制了分类模型在不同阈值下的表现。
ROC曲线越接近左上角,模型的性能越好。
AUC(Area Under the Curve)是ROC曲线下的面积,用于衡量二元分类模型的整体性能。
AUC值越接近1,模型的性能越好;而AUC值越接近0.5,模型的性能越差。
6. 请解释交叉验证是什么,以及其在机器研究中的作用。
机器学习原理及应用练习题答案

第一章机器学习概述1.机器学习研究什么问题,构建一个完整的机器学习算法需要哪些要素?机器学习主要研究如何选择统计学习模型,从大量已有数据中学习特定经验。
构建一个完整的机器学习算法需要三个方面的要素,分别是数据,模型,性能度量准则。
2.可以生成新数据的模型是什么,请举出几个例子可以生成新数据的模型是生成模型,典型的生成模型有朴素贝叶斯分类器、高斯混合模型、隐马尔可夫模型、生成对抗网络等。
3.监督学习、半监督学习和无监督学习是什么,降维和聚类属于哪一种?监督学习是指样本集合中包含标签的机器学习,无监督学习是无标签的机器学习,而半监督学习介于二者之间。
降维和聚类是无监督学习。
4.过拟合和欠拟合会导致什么后果,应该怎样避免?过拟合导致模型泛化能力弱,发生明显的预测错误,往往是由于数据量太少或模型太复杂导致,通过增加训练数据量,对模型进行裁剪,正则化的方式来缓解。
而欠拟合则会导致模型不能对数据进行很好地拟合,通常是由于模型本身不能对训练集进行拟合或者训练迭代次数太少,解决方法是对模型进行改进,设计新的模型重新训练,增加训练过程的迭代次数。
5.什么是正则化,L1正则化与L2正则化有什么区别?正则化是一种抑制模型复杂度的方法。
L1正则化能够以较大概率获得稀疏解,起到特征选择的作用,并且可能得到不止一个最优解。
L2正则化相比前者获得稀疏解的概率小的多,但得到的解更加平滑。
第二章逻辑回归与最大熵模型1.逻辑回归模型解决(B )A.回归问题B.分类问题C.聚类问题D.推理问题2.逻辑回归属于(B )回归A.概率性线性B.概率性非线性C.非概率性线性D.非概率性非线性3.逻辑回归不能实现(D )A.二分类B.多分类C.分类预测D.非线性回归4.下列关于最大熵模型的表述错误的是(B )A.最大熵模型是基于熵值越大模型越稳定的假设B.最大熵模型使用最大熵原理中一般意义上的熵建模以此缩小模型假设空间C.通过定义最大熵模型的参数可以实现与多分类逻辑回归相同的作用D.最大熵模型是一种分类算法5.下列关于模型评价指标的表述错误的是(C )A.准确率、精确率、召回率以及AUC均是建立在混淆矩阵的基础上B.在样本不平衡的条件下准确率并不能作为很好的指标来衡量结果C.准确率表示所有被预测为正的样本中实际为正的样本的概率D.一般来说,置信度阈值越高,召回率越低,而精确率越高6.简述逻辑回归的原理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
冷启动
在新用户对少的物品产生行为后, 不能立即对他进行个性化推荐,因 为用户相似度是离线计算的 新物品上线后一段时间,一旦有用 户对物品产生行为,就可以将新物 品推荐给其他用户
新用户只要对一个物品产生行为,就能推荐相关 物品给他,但无法在不离线更新物品相似度表的 情况下将新物品推荐给用户
推荐理 很难提供 由
1. 请写出通过条件概率公式和全概率公式推出贝叶斯公式的过程
分析:条件概率:
P( A | B )
P( AB ) ,P( B | A )
P( AB )
P( B )
P( A )
全概率: P( A )
P( A | Bi ) P( Bi )
i
贝叶斯公式: P( Bi | A )
P( A| Bi )P( Bi )
P( A | Bj )P( B j )
j
2. 请写出正态分布的概率密度函数、期望、以及方差
分析: 概率密度函数: f ( x )
( x μ)2
1 e 2σ2 ,σ 0 ;期望: E( x ) μ;方差: D ( x ) σ2 2πσ
三、简答题
1. 求函数 f ( x ) x x ,x R 的最小值
分析:令 t
C. 梯度下降法比牛顿法收敛速度快
D. 拟牛顿法不需要计算 Hesse 矩阵 分析:牛顿法需要二阶求导,梯度下降法只需一阶,因此牛顿法比梯度下降法更快收敛 4. 一般, k-NN 最近邻方法在( B)的情况下效果较好
A. 样本较多但典型性不好 B. 样本较少但典型性好
C. 样本呈团状分布
D. 样本呈链状分布
σX σY
q( x )
4. 若要对以下图案进行聚类分析需要采用哪种聚类方法,简述理由和该方法步骤
分析:该图案为非凸状的,因此不能使用基于距离的聚类算法(
k-means、k-medoids 等),
可选择密度聚类( DBSCAN等)、网格聚类( STING)等非距离的方法。
5. 简述 UserCF 和 ItemCF 算法的相同点与不同点
可以根据用户历史行为归纳推荐理由
分析: 项目 UserCF
ItemCF
性能
适用于用户较少的场合,如果用户 过多,计算用户相似度矩阵的代价 交大
适用于物品数明显小于用户数的场合,如果物品 很多,计算物品相似度矩阵的代价交大
领域
实效性要求高,用户个性化兴趣要 求不高
实时性 用户有新行为,不一定需要推荐结 果立即变化
长尾物品丰富,用户个性化需求强烈 用户有新行为,一定会导致推荐结果的实时变化
一、选择题
机器学习第一阶段练习题
1. 以下三阶泰勒展开式错误的一项是( B)
A. ex 1 x 1 x2 1 x3 2! 3!
B. ln( 1 x ) x 1 x2 1 x3 23
C. sin x x 1 x3 3!
1
D.
1 x x2 x3
1- x
分析: ln( 1 x ) x - 1 x 2 1 x3 23
x x , 两边取对数: lnt
1 x ln x, 两边对 t 求导: * t'
ln x
t
1
令 t ’ =0: lnx 1 0,那么: x e 1,则 t e e 即为 f(x) 最小值。
1 x* ,
x
2. 欠拟合和过拟合的原因分别有哪些?如何避免?
分析:
欠拟合的原因:模型复杂度过低,不能很好的拟合所有的数据,训练误差大;
n
| xi
i1
n
yi | ;欧氏距离: d( x, y ) ( | xi
i1
1
yi |p ) p ;
Jaccard 系数: J ( A ,B ) Nhomakorabea|A
B|
;余弦相似度:
cosθ
aT b
;
|A B|
| a| |b|
皮尔森系数: ρXY
COV ( X ,Y )
p( x )
;相对熵( K-L 距离): D( p || q ) E p( x ) log
避免欠拟合:增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等。
过拟合的原因:模型复杂度过高,训练数据过少,训练误差小,测试误差大;
避免过拟合:降低模型复杂度,如加上正则惩罚项,如
L1, L2 ,增加训练数据等。
3. 列举聚类算法有哪些相似性度量准则及公式(至少四个)
分析:曼哈顿距离: d( x, y )
分析: k 近邻算法对较多且典型不好的,团状,链状的样本不具有太大的优势
5. 机器学习中 L1 正则化和 L2 正则化的区别是?( A )
A. 使用 L1 可以得到稀疏的权值,使用 L2 可以得到平滑的权值 B. 使用 L1 可以得到平滑的权值,使用 L2 可以得到平滑的权值
C 使用 L1 可以得到平滑的权值,使用 L2 可以得到稀疏的权值
D.使用 L1 可以得到稀疏的权值,使用 L2 可以得到稀疏的权值
分析: L1 正则化偏向于稀疏,它会自动进行特征选择,去掉一些没用的特征,也就是将这 些特征对应的权重置为 0。L2 主要功能是为了防止过拟合, 当要求参数越小时, 说明模型越 简单,而模型越简单则,越趋向于平滑,从而防止过拟合。
二、公式推理题
2. 以下不属于凸函数一项的是( D )
A. y=-log x
B. y=x log x
C. y=||x|| p
分析: a 应该限定取值范围: a≥ 1 或 a≤0
D. y=e ax
3. 以下说法错误的一项是( C)
A. 负梯度方向是使函数值下降最快的方向
B. 当目标函数是凸函数时,梯度下降法的解是全局最优解