浙江工业大学之江学院《数据分析开放实践》2021-2022学年第一学期期末试卷_第1页
浙江工业大学之江学院《数据分析开放实践》2021-2022学年第一学期期末试卷_第2页
浙江工业大学之江学院《数据分析开放实践》2021-2022学年第一学期期末试卷_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

站名:站名:年级专业:姓名:学号:凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。…………密………………封………………线…………第1页,共2页浙江工业大学之江学院

《数据分析开放实践》2021-2022学年第一学期期末试卷题号一二三总分得分一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在进行相关分析时,相关系数的取值范围是多少?()A.[-1,1]B.[0,1]C.(-∞,+∞)D.以上都不对2、在对某公司员工工资进行调查时,得到如下数据:高管平均工资为50000元,普通员工平均工资为8000元。如果要比较高管和普通员工工资的差异程度,应使用的统计量是()A.极差B.方差C.标准差系数D.平均差3、已知某总体的方差为169,从该总体中抽取一个样本量为25的样本,计算样本均值的标准误差约为多少?()A.2.6B.3.3C.4.2D.5.64、在计算样本方差时,如果样本量为n,样本均值为x̄,那么样本方差的计算公式是?()A.Σ(xi-x̄)²/nB.Σ(xi-x̄)²/(n-1)C.√Σ(xi-x̄)²/nD.√Σ(xi-x̄)²/(n-1)5、已知两个变量X和Y的协方差为20,X的标准差为4,Y的标准差为5,计算它们的相关系数约为多少?()A.0.5B.0.8C.1.0D.1.26、某地区的房价数据呈现右偏态分布,若要对其进行描述性统计,以下哪个指标不太适合用来反映数据的集中趋势?()A.均值B.中位数C.众数D.以上都适合7、在一项关于居民收入与消费关系的研究中,收集了100个家庭的收入和消费数据。计算得到收入与消费的相关系数为0.9。如果将收入和消费数据同时乘以2,则新的相关系数为()A.0.45B.0.9C.1.8D.无法确定8、在进行问卷调查时,为了保证数据的质量,对问卷的信度和效度进行了检验。以下关于信度和效度的说法,哪个是正确的?A.信度高,效度一定高B.效度高,信度一定高C.信度和效度没有关系D.以上都不对9、为分析股票价格的波动特征,计算了其收益率的自相关系数。如果自相关系数显著不为零,说明什么?()A.存在趋势B.存在季节性C.存在自相关D.数据异常10、为比较两种不同教学方法对学生成绩的影响,分别对采用不同教学方法的班级进行测试,得到两组成绩数据。要判断这两种教学方法是否有显著差异,应采用哪种统计方法?()A.t检验B.方差分析C.卡方检验D.回归分析11、在一项关于股票收益率的研究中,收集了过去5年的数据。若要预测未来一年的股票收益率,以下哪种统计方法可能最为适用?()A.时间序列分析B.多元回归分析C.判别分析D.主成分分析12、在对某公司员工的工资进行调查时,发现工资数据存在严重的右偏。为了更准确地描述数据的集中趋势,应该使用以下哪个指标?A.算术平均数B.中位数C.众数D.几何平均数13、为比较两个总体的离散程度,以下哪个统计量最为合适?()A.方差B.标准差C.变异系数D.极差14、在一项市场调查中,要了解消费者对不同品牌的偏好程度,收集的数据是顺序数据。应选用哪种统计量来描述数据的集中趋势?()A.均值B.中位数C.众数D.以上都可以15、对于一个非正态分布的数据,以下哪种描述统计量不太适用?()A.均值B.中位数C.四分位数D.众数16、在对时间序列进行预测时,如果数据呈现出明显的线性趋势,适合使用的预测方法是()A.移动平均法B.指数平滑法C.线性回归法D.季节指数法17、为了研究不同广告策略对产品销售额的影响,将市场分为三个区域,分别采用不同的广告策略,并记录销售额数据。这种实验设计属于?A.单因素方差分析B.多因素方差分析C.拉丁方设计D.正交设计18、对于一组包含异常值的数据,若要描述其集中趋势,以下哪种统计量受异常值影响较小?()A.算术平均数B.几何平均数C.中位数D.众数19、某股票的收益率在过去10个交易日的变化情况如下:5%,-2%,8%,-3%,10%,-1%,6%,-4%,7%,2%。计算这组数据的几何平均收益率约为多少?()A.2.5%B.3.0%C.3.5%D.4.0%20、为了研究教育程度与收入之间的关系,收集了大量样本数据。绘制散点图后发现,随着教育程度的提高,收入呈现出非线性的增长趋势。此时适合采用哪种回归模型?A.线性回归B.二次多项式回归C.对数线性回归D.以上都不合适二、简答题(本大题共4个小题,共40分)1、(本题10分)阐述支持向量机(SVM)的基本原理和应用场景,以一个实际的二分类问题为例,说明如何使用SVM进行建模和分类。2、(本题10分)在进行回归分析时,可能会出现多重共线性问题。请阐述多重共线性的含义、产生的原因、检测方法以及解决措施。3、(本题10分)在进行一项市场调研时,需要分析消费者的偏好结构。论述如何使用联合分析方法,并解释其原理和应用。4、(本题10分)对于一个含有虚拟变量的回归模型,如何解释虚拟变量的系数?请结合具体例子说明。三、案例分析题(本大题共2个小题,共20分)1、(本题10分)某城市的公共交通部门想要优化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论