云南工程职业学院《属性数据分析》2023-2024学年第二学期期末试卷_第1页
云南工程职业学院《属性数据分析》2023-2024学年第二学期期末试卷_第2页
云南工程职业学院《属性数据分析》2023-2024学年第二学期期末试卷_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

站名:站名:年级专业:姓名:学号:凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。…………密………………封………………线…………第1页,共1页云南工程职业学院

《属性数据分析》2023-2024学年第二学期期末试卷题号一二三四总分得分批阅人一、单选题(本大题共15个小题,每小题1分,共15分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、某地区的房价数据存在极端值,为了更稳健地描述房价的平均水平,应采用以下哪种统计量?()A.均值B.中位数C.众数D.几何平均数2、对一组数据进行分组,组距为5,第一组下限为10。如果数据中最小的值为8,那么应该将其归入哪一组?()A.第一组B.第二组C.第三组D.不归入任何组3、某工厂生产的灯泡寿命服从正态分布,平均寿命为1500小时,标准差为200小时。从该工厂生产的灯泡中随机抽取100个,那么这100个灯泡的平均寿命在1450小时到1550小时之间的概率约为()A.0.6826B.0.9544C.0.9974D.0.34134、在对一批产品进行质量检验时,规定不合格率不能超过5%。随机抽取100个产品进行检验,发现有8个不合格。在显著性水平为0.05下,这批产品是否合格?()A.合格B.不合格C.无法确定D.需要重新抽样5、在比较多个总体的均值是否相等时,如果数据不满足方差分析的前提条件,应该采用哪种非参数检验方法?()A.Kruskal-Wallis检验B.Wilcoxon秩和检验C.Friedman检验D.Mood中位数检验6、已知总体服从正态分布,总体方差未知,从总体中抽取样本量为25的样本,在进行假设检验时,应使用的统计量是()A.z统计量B.t统计量C.F统计量D.卡方统计量7、在对两个变量进行线性回归分析时,得到回归方程为y=3x+5,其中x为自变量,y为因变量。如果x的值增加2,那么y的估计值会增加多少?()A.3B.5C.6D.118、在一项社会调查中,要了解不同职业人群的幸福感是否存在差异。幸福感的测量采用了5点量表(非常幸福、幸福、一般、不幸福、非常不幸福)。应采用哪种统计方法进行分析?()A.方差分析B.卡方检验C.秩和检验D.以上都不对9、已知某变量的取值范围为0到100,将其分为5个组,组距为20。第一组的下限为0,上限为20。则第二组的下限和上限分别为()A.20,40B.21,40C.20,41D.21,4110、为比较三种不同生产工艺对产品质量的影响,随机选取了相同数量的产品进行检测。应该使用哪种方差分析?()A.单因素方差分析B.双因素方差分析C.多因素方差分析D.重复测量方差分析11、在一项关于城市居民消费水平的调查中,随机抽取了500个家庭。已知家庭月平均消费支出的均值为8000元,标准差为1500元。若从该样本中随机抽取一个家庭,其月消费支出在6500元至9500元之间的概率约为()A.0.68B.0.82C.0.95D.0.9912、在一个有1000个观测值的数据集里,变量X的取值范围是[0,100]。将其分为10个等宽的区间,绘制频率直方图。如果第3个区间的频率为0.2,那么该区间的频数大约是多少?()A.20B.200C.100D.5013、要研究不同地区、不同性别消费者的消费行为差异,应该采用哪种数据分析方法?()A.多因素方差分析B.多元线性回归C.对应分析D.以上都可以14、在一项关于股票价格波动的研究中,收集了过去一年中每天的收盘价。要分析价格的波动性,应该计算什么统计量?()A.均值B.方差C.标准差D.中位数15、在分析多个变量之间的关系时,发现变量之间存在非线性关系。此时,可采用以下哪种方法进行处理?()A.变量变换B.多项式回归C.分段回归D.以上都可以二、简答题(本大题共4个小题,共20分)1、(本题5分)解释什么是残差分析,说明残差分析在回归模型中的作用,以及如何通过残差分析来判断回归模型的合理性。2、(本题5分)解释什么是迁移学习,并说明其在统计学中的应用前景。以一个实际的数据应用为例,说明如何利用迁移学习解决数据稀缺或分布不一致的问题。3、(本题5分)详细说明如何运用统计方法进行变量筛选?阐述常用的变量筛选方法及其原理,举例说明在回归分析中的应用。4、(本题5分)假设检验是统计学中的重要内容,请详细解释假设检验的基本原理,并说明如何确定原假设和备择假设,以及如何根据检验结果做出决策。三、计算题(本大题共5个小题,共25分)1、(本题5分)某工厂生产的产品重量服从均匀分布,区间为[5,15]千克。随机抽取200个产品,计算产品重量的期望值和方差。2、(本题5分)某城市有2500家企业,固定资产投资额的平均数为500万元,标准差为100万元。随机抽取250家企业进行调查,求样本平均数的抽样分布,并计算抽样平均误差。若已知总体服从正态分布,求这250家企业的平均固定资产投资额在480万元到520万元之间的概率。3、(本题5分)某工厂生产一种电子产品,其性能指标服从正态分布,平均性能指标为80,标准差为10。从生产线上随机抽取64个电子产品进行检测,求这64个电子产品平均性能指标的抽样分布,并计算抽样平均误差。若规定产品性能指标在78到82之间为合格,求样本中合格产品的比例的抽样分布及概率。4、(本题5分)某公司的员工年龄分布如下:20-30岁的有50人,30-40岁的有80人,40-50岁的有60人,50岁以上的有10人。计算员工年龄的均值和中位数,并分析年龄结构的特点。5、(本题5分)某股票在过去30个交易日的收盘价(单位:元)如下:15、16、18、17、19、20、18、16……请计算该股票价格的日收益率,并绘制收益率的折线图,分析股票价格的波动情况。四、案例分析题(本大题共4个小题,共40分)1、(本题10分)某家具厂为了了解市场需求,对不同风格、价格和材质的家具销售情况进行了调查。调整产品结构,满足市场需求。2、(本题10分)一家连锁超市收集了多个门店的销售数据,包括各类商品的销售额、销售量以及不同时间段的业绩。分析怎样通过统计分析找出销售规律和潜在问题。3、(本题10分)某在线游

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论