北京邮电大学《统计机器学习及应用实践》2022-2023学年第一学期期末试卷_第1页
北京邮电大学《统计机器学习及应用实践》2022-2023学年第一学期期末试卷_第2页
北京邮电大学《统计机器学习及应用实践》2022-2023学年第一学期期末试卷_第3页
北京邮电大学《统计机器学习及应用实践》2022-2023学年第一学期期末试卷_第4页
北京邮电大学《统计机器学习及应用实践》2022-2023学年第一学期期末试卷_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自觉遵守考场纪律如考试作弊此答卷无效密自觉遵守考场纪律如考试作弊此答卷无效密封线第1页,共3页北京邮电大学

《统计机器学习及应用实践》2022-2023学年第一学期期末试卷院(系)_______班级_______学号_______姓名_______题号一二三总分得分批阅人一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在进行假设检验时,如果拒绝了原假设,但是实际上原假设是正确的,这种错误被称为?()A.第一类错误B.第二类错误C.抽样误差D.非抽样误差2、在一项关于消费者对某品牌满意度的调查中,共发放问卷1000份,回收有效问卷800份。其中表示非常满意的有200人,满意的有400人,不满意的有150人,非常不满意的有50人。计算消费者满意度的众数为()A.满意B.非常满意C.不满意D.非常不满意3、某班级学生的考试成绩服从正态分布,老师想根据成绩将学生分为优、良、中、差四个等级,应该使用哪种统计方法?()A.聚类分析B.判别分析C.因子分析D.分位数法4、对某城市的交通流量进行监测,连续记录了30天的数据。发现每天的平均车流量服从正态分布,均值为5000辆,标准差为800辆。若要以90%的置信区间估计该城市的日平均车流量,其区间宽度大约是多少?()A.300辆B.400辆C.500辆D.600辆5、在一项临床试验中,比较了新药物和传统药物对患者症状的缓解效果。如果要同时考虑药物效果和患者的年龄、性别等因素,应采用哪种统计分析方法?()A.方差分析B.协方差分析C.多元方差分析D.以上都不对6、为研究某种农作物的产量与施肥量之间的关系,进行了田间试验。设农作物产量为y,施肥量为x,如果两者之间的关系可以用线性回归方程表示,且回归系数为正,说明()A.施肥量越多,产量越高B.施肥量越多,产量越低C.施肥量与产量无关D.无法确定7、为研究某种药物的疗效,将患者随机分为实验组和对照组。实验组使用药物,对照组使用安慰剂。经过一段时间后,测量两组患者的症状改善情况。这种研究方法属于?()A.观察性研究B.实验性研究C.案例分析D.以上都不是8、在进行统计推断时,置信区间越宽,说明估计的什么越大?()A.准确性B.可靠性C.误差D.以上都不对9、已知某地区的人口增长率在过去5年分别为2%、3%、1%、4%、2%,采用几何平均法计算这5年的平均人口增长率约为()A.2.4%B.2.5%C.2.6%D.2.7%10、为了检验一批产品是否符合质量标准,从该批产品中随机抽取了一定数量进行检测。若设定显著性水平为0.05,在进行假设检验时,拒绝域的确定与以下哪个因素有关?A.样本容量B.总体方差C.检验统计量的分布D.以上都是11、对于一个二分类问题,以下哪种评估指标常用于衡量模型的性能?()A.准确率B.召回率C.F1值D.以上都是12、为检验一批产品是否符合质量标准,从这批产品中随机抽取一定数量进行检验,这种抽样方式被称为?()A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样13、在一项关于大学生就业意向的调查中,收集了学生的专业、成绩、实习经历等信息,并对就业意向进行了分类。若要分析哪些因素对就业意向有显著影响,应采用哪种统计方法?()A.因子分析B.聚类分析C.判别分析D.主成分分析14、在进行相关分析时,如果两个变量的变化趋势呈现非线性,应该如何处理?()A.对变量进行线性变换B.采用非线性相关分析方法C.忽略非线性关系D.重新收集数据15、在进行方差分析时,如果发现组间差异显著,接下来通常会进行什么操作?A.多重比较B.相关分析C.回归分析D.以上都不是16、在一个班级中,学生的数学成绩和语文成绩的相关系数为0.6。如果数学成绩提高10分,语文成绩大约会提高多少?()A.6分B.4分C.无法确定D.以上都不对17、在一项医学研究中,观察了某种药物对患者症状的改善情况,将患者分为轻度、中度和重度症状组。若要检验药物效果在不同症状组间是否有差异,应选择哪种统计方法?()A.方差分析B.秩和检验C.独立性检验D.配对t检验18、在一项关于城市居民消费水平的调查中,随机抽取了500个家庭,记录了他们每月的消费支出。若要估计该城市所有家庭平均每月消费支出的95%置信区间,以下哪种抽样方法更合适?A.简单随机抽样B.分层抽样C.整群抽样D.系统抽样19、在一个样本中,如果存在极端值,对样本均值和中位数的影响程度有何不同?()A.对均值影响大B.对中位数影响大C.影响程度相同D.无法确定20、在对一组数据进行正态性检验时,常用的方法有()A.直方图法B.Q-Q图法C.K-S检验D.以上都是二、简答题(本大题共4个小题,共40分)1、(本题10分)详细论述在回归分析中如何诊断异方差性,分析异方差性对回归结果的影响和相应的处理方法。2、(本题10分)详细阐述如何利用统计方法分析股票价格的波动特征?可以采用哪些指标和模型?3、(本题10分)如何利用统计方法分析数据的偏态和峰态?4、(本题10分)解释什么是生存函数和风险函数,它们在生存分析中的意义是什么?三、案例分析题(本大题共2个小题,共20分)1、(本题10分)某在线课程平台记录了学生的学习进度、学习资源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论