南开大学22年春学期《数据科学导论》在线作业-00002_第1页
南开大学22年春学期《数据科学导论》在线作业-00002_第2页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-本页为预览页PAGE13-本页为预览页-本页为预览页22春学期(高起本1709-1803、全层次1809-2103)数据科学导论在线作业-00002第1题. 聚类是一种()。选项A:有监督学习选项B:无监督学习选项C:强化学习选项D:半监督学习参考答案:B第2题. 一元线性回归中,真实值与预测值的差称为样本的()。选项A:误差选项B:方差选项C:测差选项D:残差参考答案:D第3题. 对于k近邻法,下列说法错误的是()。选项A:不具有显式的学习过程选项B:适用于多分类任务选项C:k值越大,分类效果越好选项D:通常采用多数表决的分类决策规则参考答案:C第4题. 某商品的产量(X,件)与单位成本(

2、Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。选项A:产量每增加一台,单位成本增加100元选项B:产量每增加一台,单位成本减少1.2元选项C:产量每增加一台,单位成本平均减少1.2元选项D:产量每增加一台,单位平均增加100元参考答案:C第5题. 哪一项不属于规范化的方法()选项A:最小-最大规范化选项B:零-均值规范化选项C:小数定标规范化选项D:中位数规范化参考答案:D第6题. 维克托?迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系

3、。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )选项A:K-means选项B:Bayes Network选项C:C4.5选项D:Apriori参考答案:D第7题. 在回归分析中,自变量为(),因变量为()。选项A:离散型变量,离散型变量选项B:连续型变量,离散型变量选项C:离散型变量,连续型变量选项D:连续型变量,连续型变量参考答案:D第8题. 层次聚类适合规模较()的数据集选项A:大选项B:中选项C:小选项D:所有参考答案:C第9题. BFR聚类是用于处理数据集()的k-means变体。选项A:大选项B:中选项C:小选项D:所有参考答案:A第10题. 手肘法的核心指标是()。选项

4、A:SES选项B:SSE选项C:RMSE选项D:MSE参考答案:B第11题. 层次聚类对给定的数据进行()的分解。选项A:聚合选项B:层次选项C:分拆选项D:复制参考答案:B第12题. 根据映射关系的不同可以分为线性回归和()。选项A:对数回归选项B:非线性回归选项C:逻辑回归选项D:多元回归参考答案:B第13题. 以下属于关联分析的是( )选项A:CPU性能预测选项B:购物篮分析选项C:自动判断鸢尾花类别选项D:股票趋势建模参考答案:B第14题. 在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。选项A:减小,减小选项B:减小,增大选项C:增大,减小选项D:增大,

5、增大参考答案:B第15题. 特征选择的四个步骤中不包括()选项A:子集产生选项B:子集评估选项C:子集搜索选项D:子集验证参考答案:C第16题. 利用最小二乘法对多元线性回归进行参数估计时,其目标为()。选项A:最小化方差#最小化标准差选项B:最小化残差平方和选项C:最大化信息熵参考答案:C第17题. 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。选项A:最优回归线选项B:最优分布线选项C:最优预测线选项D:最佳分布线参考答案:A第18题. BFR聚类用于在()欧氏空间中对数据进行聚类选项A:高维选项B:中维选项C:低维选项D:中高维参考答案:A第19题. Apriori算法的

6、加速过程依赖于以下哪个策略( )选项A:抽样选项B:剪枝选项C:缓冲选项D:并行参考答案:B第20题. 设X=1,2,3是频繁项集,则可由X产生()个关联规则。选项A:4选项B:5选项C:6选项D:7参考答案:C第21题. 系统日志收集的基本特征有()选项A:高可用性选项B:高可靠性选项C:可扩展性选项D:高效率参考答案:A,B,C第22题. 距离度量中的距离可以是()选项A:欧式距离选项B:曼哈顿距离选项C:Lp距离选项D:Minkowski距离参考答案:A,B,C,D第23题. Apriori算法的计算复杂度受()影响。选项A:支持度阈值选项B:项数选项C:事务数选项D:事务平均宽度参考答

7、案:A,B,C,D第24题. 下面例子属于分类的是()选项A:检测图像中是否有人脸出现选项B:对客户按照贷款风险大小进行分类选项C:识别手写的数字选项D:估计商场客流量参考答案:A,B,C第25题. 数据科学具有哪些性质()选项A:有效性选项B:可用性选项C:未预料选项D:可理解参考答案:A,B,C,D第26题. 聚类的主要方法有()。选项A:划分聚类选项B:层次聚类选项C:密度聚类选项D:距离聚类参考答案:A,B,C第27题. k近邻法的基本要素包括()。选项A:距离度量选项B:k值的选择选项C:样本大小选项D:分类决策规则参考答案:A,B,D第28题. 层次聚类的方法是()选项A:聚合方法

8、选项B:分拆方法选项C:组合方法选项D:比较方法参考答案:A,B第29题. 多层感知机的学习过程包含()。选项A:信号的正向传播选项B:信号的反向传播选项C:误差的正向传播选项D:误差的反向传播参考答案:A,D第30题. 什么情况下结点不用划分()选项A:当前结点所包含的样本全属于同一类别选项B:当前属性集为空,或是所有样本在所有属性上取值相同选项C:当前结点包含的样本集为空选项D:还有子集不能被基本正确分类参考答案:A,B,C第31题. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选选项A:对选项B:错参考答案:A第32题. 选择较小的k值,相当于用较小的邻域中的训练实例

9、进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。选项A:对选项B:错参考答案:A第33题. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。选项A:对选项B:错参考答案:B第34题. 平均减少的不纯度越大,则特征重要度越高。选项A:对选项B:错参考答案:A第35题. 使用SVD方法进行图像压缩不可以保留图像的重要特征。选项A:对选项B:错参考答案:B第36题. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。选项A:对选项B:错参考答案:B第37题. 关联规则可以用枚举的方法产生。选项A:对选项B:错参考答案:A第38题. 获取数

10、据的方式有多种,可以从网页、测量、数据库、传统媒体、监控等等方式选项A:对选项B:错参考答案:A第39题. 每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。选项A:对选项B:错参考答案:A第40题. 子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。选项A:对选项B:错参考答案:A第41题. 当特征为离散型时,可以使用信息增益作为评价统计量。选项A:对选项B:错参考答案:A第42题. 由不同的距离度量所确定的最近邻点是不同的选项A:对选项B:错参考答案:A第43题. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。选项A:对选项B:错参考答案:A第44题. sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。选项A:对选项B:错参考答案:B第45题. 分拆方法是自底向上的方法。选项A:对选项B:错参考答案:B第46题. 随着特征维数的增加,样本间区分度提高。选项A:对选项B:错参考答案:B第47

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论