【MOOC】大数据解析与应用导论-浙江大学 中国大学慕课MOOC答案_第1页
【MOOC】大数据解析与应用导论-浙江大学 中国大学慕课MOOC答案_第2页
【MOOC】大数据解析与应用导论-浙江大学 中国大学慕课MOOC答案_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【MOOC】大数据解析与应用导论-浙江大学中国大学慕课MOOC答案第一周作业第一周测验1、【单选题】下列场景适用于回归分析的是本题答案:【天气预报】2、【多选题】下列属于多元统计方法的为本题答案:【主元分析#回归分析】3、【多选题】多元统计分析的图表示法有本题答案:【轮廓图#雷达图#调和曲线图#散布图矩阵】4、【判断题】聚类分析也可以称为判别分析。本题答案:【错误】5、【判断题】多元统计分析不仅变量的波动,还要研究变量间的耦合性。本题答案:【正确】6、【判断题】完整的数据分析过程,包括数据采集、数据清洗和数据分析。本题答案:【正确】第二周作业第二周测验1、【单选题】下列哪种方法不是数据填补的手段本题答案:【均值标准化】2、【多选题】一般常见的缺失值处理的方法有本题答案:【替换填充法#最近邻插补填充法#回归填充法#插值填充】3、【多选题】一般常见的数据归一化的方法有本题答案:【最小最大规范化#零均值规范化】4、【判断题】少量的异常值完全不会影响数据分析。本题答案:【错误】5、【判断题】一般初步收集到的数据可能是带有异常值的。本题答案:【正确】6、【判断题】主成分分析可以降低数据维度。本题答案:【正确】第三周作业第三周测验1、【单选题】SVM的中文全称叫什么?本题答案:【支持向量机】2、【单选题】SVM算法的最小时间复杂度是O(n2),基于此,以下哪种规格的数据集并不适该算法?本题答案:【大数据集】3、【判断题】费舍尔判别分析通过不同类别数据投影后中心点间的距离来衡量类间分离程度。本题答案:【正确】4、【判断题】拉格朗日乘子法可用于线性可分SVM的模型求解。本题答案:【正确】5、【填空题】曼哈顿距离是各变量之差的()之和。本题答案:【绝对值】第四周作业第四周测验1、【单选题】最小二乘方法的拟合程度衡量指标是本题答案:【残差平方和】2、【多选题】最典型的两种拟合不佳的情况是本题答案:【欠拟合#过拟合】3、【判断题】岭回归适用于样本很少,但变量很多的回归问题。本题答案:【正确】4、【判断题】维数灾难是指当变量指标、特征逐步增加时导致计算量、计算难度成指数爆炸性增长,而模型准确性却在降低的情况。本题答案:【正确】5、【填空题】主元回归分析是基于()算法的结果进行后续回归建模分析。本题答案:【主成分分析】第五周作业第五周测验1、【多选题】闵可夫斯基距离是一组距离的定义,下列距离中属于闵可夫斯基距离的有本题答案:【欧式距离#切比雪夫距离#曼哈顿距离】2、【多选题】在利用EM算法估计高斯混合模型参数的时候,需要预先设定的参数有本题答案:【高斯元的均值#高斯元的方差#高斯元的权重系数#类别个数】3、【判断题】在区分某个算法是否是聚类算法时,往往可以通过该算法是否需要预先设定明确的类中心来判断本题答案:【正确】4、【判断题】如果两个变量的相关系数为0,则说明两个变量是独立的。本题答案:【错误】5、【判断题】样本的顺序会影响K均值聚类算法的结果。本题答案:【错误】6、【填空题】GMM模型是借助多个()分布的线性累加去估计任意的分布。本题答案:【高斯】7、【填空题】GMM模型需要预先设定高斯元个数去确定()个数。本题答案:【类别】第六周作业第六周测验1、【单选题】在Bootstrap自助采样法中,真实的情况是本题答案:【在每一次采样中,样本之间可能有重复;在完成n次采样之后,有些样本可能没有被采集到】2、【单选题】对于离散型随机变量X,它的熵取决于本题答案:【X取每个值的概率】3、【判断题】随机森林只能选择决策树作为基分类器。本题答案:【错误】4、【判断题】随机森林的各个基分类器之间是互相独立的,在训练的时候可以并行训练。本题答案:【正确】5、【判断题】决策树算法只能处理具有离散特征属性的数据集,对于连续特征属性的数据集无能为力。本题答案:【错误】第七周作业第七周测验1、【单选题】CCA算法在求解时,分别在两组变量中选取具有代表性的综合变量Ui,Vi,每个综合变量是原变量的线性组合,选择综合变量时的目标是本题答案:【最大化两者的相关系数】2、【单选题】相比于普通CCA算法,KernelCCA本题答案:【能分析两组随机变量之间的非线性关系】3、【多选题】关于典型相关分析CCA与主成分分析PCA,下面说法错误的是本题答案:【PCA可以视为一种降维技术,CCA不可以视为一种降维技术#是否进行归一化,都不影响分析结果】4、【判断题】典型相关分析适用于分析两组变量之间的关系本题答案:【正确】5、【判断题】对数据进行归一化操作会影响典型相关分析的结果本题答案:【错误】第八周作业第八周测验1、【单选题】关于卷积神经网络CNN,以下说法错误的是:本题答案:【由于卷积核的大小一般是3*3或更大,因此卷积层得到的特征图像一定比原图像小。】2、【多选题】相较于传统RNN,LSTM引入了独特的门控机制。以下哪些是LSTM中包含的门结构:本题答案:【输入门#输出门#遗忘门】3、【多选题】关于卷积神经网络CNN与循环神经网络RNN,下面说法正确的有:本题答案:【CNN适用于图像处理,而RNN适用于序列数据处理。#CNN和RNN都采用了权值共享机制以减少网络中的参数量。】4、【判断题】神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。它通过训练调整内部节点之间相互连接的关系,从而达到处理信息的目的。本题答案:【正确】5、【判断题】为了提高预测结果的精度,网络结构设置得越复杂越好,不必考虑训练网络时所花费的时间。本题答案:【错误】第九周作业第九周测验1、【单选题】关于去噪自编码器DAE,以下说法错误的是:本题答案:【DAE的Loss函数用于最小化预测结果与噪声数据间的误差】2、【多选题】在稀疏自编码器中,假设神经元采用tanh作为激活函数,则:本题答案:【当神经元的输出接近1的时候,认为它被激活。#当神经元的输出接近-1的时候,认为它被抑制。】3、【多选题】关于变分自编码器VAE,以下说法正确的有:本题答案:【VAE是一类生成模型,可用于训练出一个样本的生成器#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论