北方民族大学《大数据统计模型实验》2021-2022学年第一学期期末试卷_第1页
北方民族大学《大数据统计模型实验》2021-2022学年第一学期期末试卷_第2页
北方民族大学《大数据统计模型实验》2021-2022学年第一学期期末试卷_第3页
北方民族大学《大数据统计模型实验》2021-2022学年第一学期期末试卷_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

装订线装订线PAGE2第1页,共3页北方民族大学《大数据统计模型实验》

2021-2022学年第一学期期末试卷院(系)_______班级_______学号_______姓名_______题号一二三总分得分一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、某地区的气温在一年中的变化情况可以用哪种统计图来直观展示?()A.直方图B.折线图C.饼图D.箱线图2、在一次关于大学生就业意向的调查中,收集了学生的专业、性别、期望薪资等信息。若要分析不同专业学生的期望薪资是否有显著差异,应采用哪种统计方法?A.独立样本t检验B.配对样本t检验C.单因素方差分析D.双因素方差分析3、已知某总体的均值为100,从该总体中抽取一个样本量为100的样本,计算样本均值的抽样分布的均值为多少?()A.100B.10C.1D.无法确定4、为了研究广告投入与销售额之间的关系,收集了多个企业的相关数据。如果销售额的增长速度大于广告投入的增长速度,那么两者之间的弹性系数是怎样的?A.大于1B.小于1C.等于1D.无法确定5、在进行假设检验时,如果原假设为真,但拒绝了原假设,这种错误被称为?()A.第一类错误B.第二类错误C.抽样误差D.非抽样误差6、已知某变量的概率分布函数为F(x),则其概率密度函数f(x)等于()A.F'(x)B.F(x)C.1-F(x)D.无法确定7、在一次关于大学生就业意向的调查中,共发放问卷1000份,回收有效问卷800份。在有效问卷中,有400人表示希望毕业后进入国有企业工作。以95%的置信水平估计大学生中希望毕业后进入国有企业工作的比例的置信区间为()A.(0.45,0.55)B.(0.47,0.53)C.(0.48,0.52)D.(0.49,0.51)8、在一项调查中,要了解不同职业人群的平均收入水平。如果职业种类较多,应该如何分组?()A.等距分组B.不等距分组C.单项式分组D.复合分组9、已知一组数据的均值为50,标准差为10。现将每个数据都加上10,则新数据的均值和标准差分别为()A.60,10B.60,20C.50,10D.50,2010、在对一批产品进行质量检验时,采用抽样方案(n,c),其中n表示样本量,c表示合格判定数。如果增加样本量n,同时保持合格判定数c不变,抽样方案的接收概率会怎样变化?()A.增大B.减小C.不变D.无法确定11、在分析两个变量之间的关系时,如果散点图呈现出曲线的趋势,应该采用哪种方法来拟合?()A.线性回归B.多项式回归C.逻辑回归D.岭回归12、在研究某一经济指标的长期趋势时,发现数据存在明显的周期性波动。为了分离出趋势和周期成分,应采用哪种方法?()A.移动平均法B.指数平滑法C.季节分解法D.以上都不对13、某研究想要分析不同年龄段人群对某种新产品的接受程度,以下哪种抽样方法能更好地保证样本的代表性?A.简单随机抽样B.分层抽样C.整群抽样D.系统抽样14、在对两个变量进行相关性分析时,得到相关系数为0.8。这意味着这两个变量之间存在怎样的关系?()A.强正相关B.强负相关C.弱正相关D.弱负相关15、在一次抽样调查中,样本容量为200,计算得到样本均值为50,样本标准差为10。若要估计总体均值的95%置信区间,应该使用哪种方法?()A.Z分布B.t分布C.F分布D.卡方分布16、在多元回归分析中,如果某个自变量的系数在5%的显著性水平下不显著,应该如何处理?A.直接从模型中删除该变量B.保留该变量,但在解释结果时谨慎对待C.增加样本量重新进行回归D.改变变量的度量方式17、为了比较两个总体的方差是否相等,可以使用以下哪种检验方法?A.F检验B.t检验C.卡方检验D.以上都不是18、对某批产品进行质量检验,随机抽取200个产品,其中不合格产品有20个。以95%的置信水平估计这批产品的不合格率,其置信区间为()A.(0.06,0.14)B.(0.07,0.13)C.(0.08,0.12)D.(0.05,0.15)19、在一项关于城市居民消费水平的调查中,随机抽取了500个家庭,记录了他们每月的消费支出。若要估计该城市所有家庭平均每月消费支出的95%置信区间,以下哪种抽样方法更合适?A.简单随机抽样B.分层抽样C.整群抽样D.系统抽样20、为研究不同年龄段人群对某种新产品的接受程度,随机抽取了三个年龄段的人群进行调查。如果要检验不同年龄段之间的接受程度是否有显著差异,应采用哪种方法?()A.单因素方差分析B.双因素方差分析C.多因素方差分析D.卡方检验二、简答题(本大题共4个小题,共40分)1、(本题10分)在进行一项实验研究时,如何控制混杂因素的影响?请列举至少两种方法。2、(本题10分)详细论述聚类分析的方法和步骤,说明聚类分析在数据挖掘和客户细分中的应用,举例说明如何进行聚类分析。3、(本题10分)如何利用统计方法评估两个分类变量之间的关联程度?4、(本题10分)对于一组含有缺失值的数据,如何处理这些缺失值?请介绍至少三种常见的处理方法及其优缺点。三、案例分析题(本大题共2个小题,共20分)1、(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论