版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷1填空题(每空1分共20分)机器学习通常是指:为完成某种任务,给定训练集D,在性能测度P指导下,通过学习获得一个被称为模型的映射函数。获取模型参数是机器学习训练阶段的一个主要目的。机器学习根据训练集样本是否标注分为监督学习、弱监督学习和无监督学习。损失函数或代价函数是指在训练阶段基于训练集D,用来衡量模型预测值yn与真实值yn之间的差异性的一个关于模型参数原始数据样本集可能出现离群点、数据丢失和属性量纲不一致情况。不同于遵循奈奎斯特定理的采样,压缩采样则是采用低于奈奎斯特频率的采样。给定样本集D,估计概率密度函数px|ϑ的参数ϑ,通常有极大似然估计分类样本数量越多,近邻分类器复杂度越大。利用kd树可以省去对大部分样本的搜索,从而减少计算量加速近邻样本搜索。岭回归是在线性回归基础之上,增加了正则项,γw集成学习主要有装袋、提升和堆叠三类学习机制。ID3采用信息增益选择属性,而C4.5采用信息增益比选择属性。聚类算法中,确定类簇中心的方法主要有两种:基于均值的类簇中心和基于密度的类簇中心。从结构上,概率图模型可表示成有向概率图和无向概率图。人工神经元基本模型线性变换和激活模拟了神经元树突与上一级神经元突触的连接强度和动作电位。利用反向传播训练前馈神经网络需要计算两个梯度:∂L∂尺寸为5×4图像采用Convn,k,c,s,p,q选择题(每小题2分共20分)分界线正例反例图分界线正例反例图选择题2如右图的二类分类结果,计算检测正例的准确率(D)A.0.90;B.0.75;C.0.45;D.0.818处理量纲不一致问题通常利用属性值均值和(C)进行归一化。μ=1NμiC.σD.σ如果有10类,每类20个样本(每个样本的原始数据是1000维属性向量),采用PCA降维,降维后属性向量维度上限是(B)A.1000;B.199;C.10;D.19设有C个类别,Y=1,…,c,…,C,给定一个未知类别的样本xn和一种相似度度量。kc为以样本xnA.yn=argmaxc∈Ykc在原样本空间中线性不可分问题,SVM(C)。A.无法处理;B.在原空间中寻找线性函数划分数据;C.采用核函数将样本映射到核空间后,再进行分类,即KSVMD.在原空间中寻找非线性函数的划分数据;下列哪种不是决策树(A)A.KD树;B.CART树;C.ID3树;D.C4.5树在平面上两点:A0,0,B(4,3),A.4;B.3;C.5;D.7cabbbba(b)cabbba(b)(c)(d)结点类型caccbaA.(a);B.(b);C.(c);D.(d)Q-learning算法中,Q函数是是(A)A.状态-动作价值函数;B.状态函数;C.策略函数;D.奖励函数是非题(每小题1分共10分)最小二乘法因为通过列方程求解闭合解,所以适合于大数据集。(×)在样本表征值的空间分布上,类内距离越小和类间距离越大,越有利于实现模式分类。(√)加权最近邻分类器中的w1,w二分类超平面的梯度,∂fx;w∂SVM寻找具有最小边缘的超平面,也被称为最小间隔分类器。(×)表征学习主要目的是对属性向量进行降维,核方法则是对线性不可分的样本属性向量进行升维。(√)在Adaboost算法训练阶段,可以随机生成初始化权向量,不需要进行归一化处理。(×)前馈神经网络实际上是多隐含层的感知机。(√)在DQN中,求解Q(s,a)时采用的决略时优先采样(s,a),并通过采样值估计Q(s,a)。(√)Actor-Critic是一种以价值强化学习和基于策略强化学习为基础的结合体。(√)20214320214365871091211141316152443658710912111413161521436587109121114131615(10分)设有如右图所示的10张图像,请用PCA算法对其进行表征学习,列出其详细过程。参考答案:第一步,将二维图像一维化,x第二步,构建数据矩阵Z第三步,计算协方差矩阵S=第四步,对S进行奇异值分解,获得特征值和对应特征向量,λw第五步,保留前l个最大特征值对应的特征向量,构成映射矩阵,W=(8分)简答:说说层次聚类中的两种划分策略:自底向上的凝聚策略和自顶向下的分拆策略。答:凝聚策略初始时将每个样本点当做一个类簇,然后依据相似度准则合并相似度最大的类簇,直到达到终止条件。分拆策略初始时将所有的样本归为一个类簇,然后依据某种相似度准则找出簇中最不相似的两个样本xi和xSIDEGSIDEGIDIDSEGfffffIDSEGfff(10分)用错误驱动法学习用于实现与非门的单层感知机参数,y参考答案:213547681092135476810912111413请计算:(1)概率p6,左|5,p6,(2)当状态价值初始值为零时,计算第1次。解:(1)p6,左|5=0,(2)Vk=0,0.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.0设γ=1k=-1-1-10.0-1-1-1-1-10.0-1-1-1-1-1-1-1V
试卷2填空题(每空1分共20分)属性又称为特征,由特征值构成的向量描绘数据的特性,可以分为连续和离散两种。尽管机器学习任务多种多样,但机器学习还是可以归纳成分类和回归两种基本任务。目标函数是在代价函数基础之上,加上约束项而建立起来的关于模型参数的函数。表征学习的目的通常是将高维属性向量经某种变换映射成低维属性向量,要求:降维前后样本间的位置关系保持不变。重构稀疏信号的算法有匹配追踪、正交匹配追踪和基追踪等。与岭回归区别在于:Lasso回归用γw11代替对于近似线性可分类,SVM的超平面到决策平面的间隔称为软间隔。自助采样法每次从训练集D随机抽一个样本,然后放回去再抽取。CART决策树采用基尼指数划分属性。在聚类算法中,常用的距离测度是欧氏距离、曼哈顿距离、闵可夫斯基距离和值差异度量。隐马尔科夫模型和贝叶斯网络是属于有向概率图模型。概率无向图模型中,条件独立性有三种形式:全局马尔可夫性、局部马尔可夫性和成对马尔可夫性。y=sigmx=11+强化学习中有三个要素:状态、动作和奖励。时序差分学习TD(0)表示向前一个状态近似计算G选择题(每小题2分共20分)在多类分类任务,预测值通常通过softmax(y分界线正例反例图选择题分界线正例反例图选择题2A.0.90;B.0.818;C.0.85;D.0.105如果有10类,每类20个样本(每个样本的原始数据是1000维属性向量),采用LDA降维,降维后属性向量维度上限是(C)A.1000;B.199;C.9;D.19在表征学习算法中,(D)上被用来展示高维样本数据的分布情况。A.PCA;B.LDA;C.流形学习;D.t-SNE。压缩感知理论中,构建或学习字典是一个关键环节,其中学习算法很多,其中之一是(A)A.k-SVD;B.LDA;C.OMP;D.MP。设二类分类任务的超平面为w0+w1x1+wA.z=wxnx12C.z=x12+x22+⋯xd径向基函数(RadialBasisFunctions,RBF)的公式是(D)A.B.C.D.Adaboost算法中,通过下式计算对某样本关注度系数,β下列说法不正确的是(C)βt,n与弱分类器如果样本xn被性能优良的htxn如果样本xn被性能优差的htxn如果样本xn被性能优差的htxnx3x1x5xxxxxxx1x2x5xSwish激活函数的表达式(C)A.B.C.D.是非题(每小题1分共10分)在训练过程中,梯度消失和梯度爆炸都是应该尽量避免的现象。(√)学习率是一个可以动态调整的参数,所以不是超参数。(×)流形学习是一种非线性降维算法。(√)在SVM,位于边界的正类样本点为支持向量,而负类样本点则不是。(×)不增加模型参数,将训练样本属性向量从低维空间非线性映射到高维空间,然后在高维空间学习线性模型,这是核方法的基本思路。(√)决策树是一种具有树形结构的非参数监督学习,只能用于分类。(×)集成学习算法中,弱分类器数目越多,整体分类器性能越好。(×)召回率在聚类算法中用来衡量聚类的完整性。(×)感知机学习算法是一种错误驱动学习算法.(√)反向传播只能用于训练前馈神经网络,而不能训练卷积神经网络。(×)综合应用题(共50分)(12分)用四个等级衡量学生课后花在《机器学习》上的时间“很少(低于30小时)、较少(介于31-60)、正常(介于61-100)和热爱(大于100)”。属性变量x=很少,较少,正常,热爱,用《机器学习》课程考试2个等级作为类别表1考试情况表随机变量x很少较少正常热爱人数153424用功概率分布,P(x)0.010.530.420.04及格优秀及格优秀及格优秀及格优秀103023152704优秀类概率分布,P(x|0.000.430.500.07及格类概率分布,P(x|0.020.650.330.00八戒,属于较少花时间,P先验概率:Py=优秀P(12分)设有一个由13个样本点组成二维样本集,X={-试构建该样本集的kd树。(8分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度云南省高校教师资格证之高等教育心理学题库附答案(基础题)
- 2024年度云南省高校教师资格证之高等教育法规题库附答案(基础题)
- 2024年度云南省高校教师资格证之高等教育学模拟试题(含答案)
- 2024年硅酮结构密封胶项目投资申请报告代可行性研究报告
- 赣南师范大学《空间统计学》2022-2023学年第一学期期末试卷
- 赣南师范大学《传播学概论》2022-2023学年第一学期期末试卷
- 江西省宜春市上高二中2025届高三上学期10月月考试题 化学 含答案
- 阜阳师范大学《世界平面设计史》2022-2023学年第一学期期末试卷
- 2024年增韧剂项目资金申请报告代可行性研究报告
- 南京市2024-2025学年三年级上学期11月期中调研数学试卷二(有答案)
- 医用内窥镜冷光源产品技术要求深圳迈瑞
- 《将本土美食文化融入幼儿园课程的实践》 论文
- 直击本质:洞察事物底层逻辑的思考方法
- 火灾与触电现场处置方案
- 榴莲课件完整版
- 人事部岗位sop完整版
- 深圳某小学项目交通影响评价报告
- 2023年四川农信校园招聘笔试题库及答案解析
- 液压传动课程设计-专用铣床液压系统
- 评选最美传统文化代言人:二年级下册语文第三单元学习任务群设计
- YS/T 591-2006变形铝及铝合金热处理
评论
0/150
提交评论