暨南大学《大数据分析的Python基础》2021-2022学年第一学期期末试卷_第1页
暨南大学《大数据分析的Python基础》2021-2022学年第一学期期末试卷_第2页
暨南大学《大数据分析的Python基础》2021-2022学年第一学期期末试卷_第3页
暨南大学《大数据分析的Python基础》2021-2022学年第一学期期末试卷_第4页
暨南大学《大数据分析的Python基础》2021-2022学年第一学期期末试卷_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自觉遵守考场纪律如考试作弊此答卷无效密自觉遵守考场纪律如考试作弊此答卷无效密封线第1页,共3页暨南大学《大数据分析的Python基础》

2021-2022学年第一学期期末试卷院(系)_______班级_______学号_______姓名_______题号一二三四总分得分一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在对两个总体均值进行比较的假设检验中,已知两个总体的方差不相等。若样本量n1=20,n2=30,应该使用哪种检验统计量?()A.Z统计量B.t统计量,自由度为20C.t统计量,自由度为30D.t统计量,自由度为482、某公司为了解员工对新福利政策的满意度,随机抽取了200名员工进行调查。结果显示,满意的有120人,不满意的有80人。要检验员工的满意度是否超过50%,应采用哪种假设检验方法?()A.单侧Z检验B.单侧t检验C.双侧Z检验D.双侧t检验3、要检验一个骰子是否均匀,投掷了60次并记录每个点数出现的次数。应使用哪种统计检验方法?()A.单样本t检验B.单样本方差分析C.卡方拟合优度检验D.独立性检验4、在一项关于城市居民消费习惯的调查中,随机抽取了1000个家庭,记录了他们每月在食品、服装、娱乐等方面的支出。若要分析不同收入水平家庭在消费结构上的差异,以下哪种统计方法最为合适?()A.描述性统计B.推断统计C.相关分析D.方差分析5、在计算样本方差时,如果样本量为n,样本均值为x̄,那么样本方差的计算公式是?()A.Σ(xi-x̄)²/nB.Σ(xi-x̄)²/(n-1)C.√Σ(xi-x̄)²/nD.√Σ(xi-x̄)²/(n-1)6、某市场调查公司收集了消费者对某品牌的满意度评分(1-5分),想要了解评分的分布情况,以下哪种统计图形最合适?()A.柱状图B.茎叶图C.箱线图D.雷达图7、为研究某种农作物的产量与施肥量、种植密度之间的关系,进行了田间试验。这是一个什么类型的实验设计?()A.完全随机设计B.随机区组设计C.析因设计D.拉丁方设计8、某地区的气温在一年中呈现周期性变化,1月平均气温为5℃,7月平均气温为25℃。如果用正弦曲线来拟合气温的季节性变化,那么其振幅约为()A.10℃B.15℃C.20℃D.5℃9、某工厂生产的零件尺寸服从正态分布,根据以往经验,其标准差为0.1mm。现要使零件尺寸的均值估计误差不超过0.02mm,在置信水平为95%的情况下,至少应抽取多少个零件进行测量?()A.97B.196C.256D.40010、在一项关于不同品牌手机用户满意度的调查中,共收集了1000份有效问卷。其中品牌A的用户有300人,平均满意度为80分;品牌B的用户有500人,平均满意度为75分;品牌C的用户有200人,平均满意度为85分。计算这三个品牌用户的总体平均满意度约为多少?()A.78分B.79分C.80分D.81分11、在对一组数据进行非参数检验时,使用了Wilcoxon秩和检验。与参数检验相比,非参数检验的优点是?()A.对总体分布的假设要求宽松B.检验效率更高C.更适合小样本D.能提供更多的统计信息12、已知某时间序列数据的一阶自相关系数为0.6。现对该时间序列进行一次差分运算,得到新的时间序列。则新序列的自相关系数()A.减小B.增大C.不变D.无法确定13、在多元线性回归分析中,如果自变量之间存在较强的多重共线性,可能会导致()A.回归系数估计不准确B.决定系数增大C.残差平方和减小D.模型的拟合优度提高14、某研究收集了多个城市的空气质量数据,若要综合评价这些城市的空气质量,以下哪种方法较为合适?()A.计算算术平均值B.计算几何平均值C.计算加权平均值D.以上都可以15、某研究人员想比较三种不同治疗方法对某种疾病的疗效,将患者随机分为三组进行治疗。治疗一段时间后,测量患者的康复情况。应选用哪种统计方法来分析治疗方法的效果?()A.单因素方差分析B.双因素方差分析C.多因素方差分析D.重复测量方差分析二、简答题(本大题共3个小题,共15分)1、(本题5分)在统计分析中,如何选择合适的图表来展示数据?请举例说明不同类型数据适合的图表形式,并阐述其优缺点。2、(本题5分)在对一个总体的均值进行区间估计时,如何选择合适的置信水平?解释置信水平的含义和对估计结果的影响。3、(本题5分)论述如何使用倾向得分匹配法来控制观察性研究中的混杂因素,解释匹配的过程和评估匹配效果的方法,并举例应用。三、计算题(本大题共5个小题,共25分)1、(本题5分)某学校对学生的课外阅读时间进行统计,随机抽取了200名学生。样本学生的平均课外阅读时间为每周5小时,标准差为2小时。假设课外阅读时间服从正态分布,求该学校学生平均课外阅读时间的90%置信区间。2、(本题5分)对某地区的农作物产量进行统计,随机抽取了90个农户。样本农户的平均产量为5000千克,标准差为800千克。求该地区农作物平均产量的99%置信区间。3、(本题5分)某学校对学生的考试成绩进行分析,随机抽取了300名学生的试卷。样本学生的平均成绩为75分,标准差为15分。求该学校学生成绩的总体标准差的95%置信区间。4、(本题5分)某地区有6000名居民,月平均消费支出为2000元,标准差为400元。现随机抽取300名居民进行调查,求样本平均数的抽样分布,并计算抽样平均误差。若总体服从正态分布,求该地区居民月消费支出在1900元到2100元之间的概率。5、(本题5分)已知某产品的质量服从正态分布,其平均质量为100克,标准差为5克。从生产线上随机抽取25个产品进行检测,求这25个产品平均质量的抽样分布,并计算抽样平均误差。若规定产品质量在98克到102克之间为合格,求样本中合格产品的比例的抽样分布及概率。四、案例分析题(本大题共3个小题,共30分)1、(本题10分)某民宿预订平台收集了不同地区民宿的预订数据、用户评价和房东服务质量等,分析如何通过统计分析提高平台的服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论