




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年统计学专业期末考试:数据分析计算题库与数据挖掘考试时间:______分钟总分:______分姓名:______一、描述统计计算要求:请根据以下给出的数据,完成以下描述统计计算。已知某班级学生的期末考试成绩如下(单位:分):70,82,75,60,68,95,88,90,72,65,78,85,76,89,93,77,64,80,67,91。1.计算这组数据的平均数。2.计算这组数据的众数。3.计算这组数据的极差。4.计算这组数据的中位数。5.计算这组数据的方差。6.计算这组数据的标准差。7.计算这组数据的四分位数Q1、Q2和Q3。8.计算这组数据的偏度。9.计算这组数据的峰度。10.将这组数据从小到大排序。二、概率论计算要求:请根据以下给出的条件,完成以下概率论计算。假设一个盒子里有5个红球和3个蓝球,随机从中取出两个球。1.计算取出的两个球都是红球的概率。2.计算取出的两个球中至少有一个红球的概率。3.计算取出的两个球都是蓝球的概率。4.计算取出的两个球中至少有一个蓝球的概率。5.计算取出的第一个球是红球,第二个球是蓝球的概率。6.计算取出的第一个球是红球,第二个球是红球的概率。7.计算取出的第一个球是蓝球,第二个球是红球的概率。8.计算取出的第一个球是蓝球,第二个球是蓝球的概率。9.计算取出的两个球都是同一种颜色的概率。10.计算取出的两个球中,红球和蓝球各取一个的概率。三、数据挖掘要求:请根据以下给出的数据,完成以下数据挖掘任务。某公司收集了以下顾客购买记录数据:顾客ID|商品ID|购买数量|购买时间---|---|---|---1|101|2|2021-01-011|102|1|2021-01-022|103|3|2021-01-032|104|2|2021-01-043|105|1|2021-01-053|106|2|2021-01-064|107|3|2021-01-074|108|1|2021-01-085|109|2|2021-01-095|110|1|2021-01-101.根据购买时间,对顾客进行聚类分析。2.根据购买数量,对商品进行聚类分析。3.根据顾客ID,分析顾客的购买行为。4.根据商品ID,分析商品的受欢迎程度。5.根据购买时间,分析顾客的购买趋势。6.根据购买数量,分析商品的销量情况。7.根据顾客ID,分析顾客的购买频率。8.根据商品ID,分析商品的购买概率。9.根据购买时间,分析顾客的购买习惯。10.根据购买数量,分析顾客的购买偏好。四、假设检验要求:根据以下假设检验问题,完成相应的计算。假设某产品合格率为95%,现从该产品中随机抽取10个产品进行检验,其中有2个不合格。请使用0.05的显著性水平进行假设检验,判断该产品合格率是否发生了显著变化。1.提出原假设和备择假设。2.计算检验统计量。3.确定拒绝域。4.计算p值。5.根据p值判断是否拒绝原假设。6.如果拒绝原假设,说明产品合格率发生了什么变化。7.如果不拒绝原假设,说明产品合格率是否保持不变。8.计算样本比例。9.计算样本比例的标准误差。10.计算置信区间。五、线性回归分析要求:根据以下线性回归数据,完成相应的分析。已知某地区居民收入(Y)与教育程度(X)的线性回归方程为:Y=5000+200X。其中,样本数据如下:居民收入(Y)|教育程度(X)---|---30000|1040000|1235000|1142000|1333000|101.计算回归系数b。2.计算回归系数a。3.计算R²值。4.计算F统计量。5.判断回归模型是否显著。6.计算教育程度对居民收入的影响。7.计算居民收入的标准误差。8.计算教育程度的预测值。9.计算预测值的标准误差。10.计算预测值的置信区间。六、时间序列分析要求:根据以下时间序列数据,完成相应的分析。某城市近5年的居民消费支出(单位:万元)如下:年份|居民消费支出---|---2016|8002017|8502018|9002019|9502020|10001.计算平均消费支出。2.计算消费支出的标准差。3.计算消费支出的自相关系数。4.计算消费支出的偏自相关系数。5.判断消费支出是否存在趋势。6.判断消费支出是否存在季节性。7.判断消费支出是否存在周期性。8.计算消费支出的移动平均。9.计算消费支出的指数平滑。10.预测2021年的居民消费支出。本次试卷答案如下:一、描述统计计算1.平均数=(70+82+75+60+68+95+88+90+72+65+78+85+76+89+93+77+64+80+67+91)/20=78.12.众数:由于每个数出现的次数都是1次,因此没有众数。3.极差=最大值-最小值=95-60=354.中位数:将数据从小到大排序后,位于中间的数是第10和第11个数的平均值,即(72+78)/2=755.方差=[(70-78.1)^2+(82-78.1)^2+...+(91-78.1)^2]/20=197.696.标准差=√方差=√197.69≈14.057.四分位数Q1=数据排序后第5个数=68,Q2(中位数)=75,Q3=数据排序后第15个数=898.偏度=(Σ[(xi-μ)^3]/n)/(σ^3)≈0.0169.峰度=(Σ[(xi-μ)^4]/n)/(σ^4)≈0.42810.排序后的数据:60,64,65,67,68,67,70,72,75,76,78,80,82,85,88,89,90,91,93,95二、概率论计算1.P(两个红球)=(5/8)*(4/7)=5/142.P(至少一个红球)=1-P(两个蓝球)=1-(3/8)*(2/7)=11/143.P(两个蓝球)=(3/8)*(2/7)=3/284.P(至少一个蓝球)=1-P(两个红球)=1-(5/8)*(4/7)=9/145.P(第一个红球,第二个蓝球)=(5/8)*(3/7)=15/566.P(第一个红球,第二个红球)=(5/8)*(4/7)=5/147.P(第一个蓝球,第二个红球)=(3/8)*(5/7)=15/568.P(第一个蓝球,第二个蓝球)=(3/8)*(2/7)=3/289.P(同一种颜色)=P(两个红球)+P(两个蓝球)=5/14+3/28=13/2810.P(红球和蓝球各一个)=P(第一个红球,第二个蓝球)+P(第一个蓝球,第二个红球)=15/56+15/56=15/28三、数据挖掘1.聚类分析:根据购买时间进行时间序列聚类,将顾客分为不同的购买周期。2.聚类分析:根据购买数量进行聚类,将商品分为不同的销量类别。3.购买行为分析:分析每个顾客的购买次数、购买频率和购买偏好。4.受欢迎程度分析:分析每个商品的购买次数、购买频率和购买偏好。5.购买趋势分析:分析购买时间的分布,识别购买高峰和低谷。6.销量情况分析:分析每个商品的购买数量,识别畅销和滞销商品。7.购买频率分析:计算每个顾客的平均购买频率,识别高频购买顾客。8.购买概率分析:计算每个商品的购买概率,识别购买概率高的商品。9.购买习惯分析:分析顾客的购买时间分布,识别购买习惯。10.购买偏好分析:分析顾客的购买商品组合,识别购买偏好。四、假设检验1.原假设H0:产品合格率仍为95%备择假设H1:产品合格率发生了变化2.检验统计量=(样本比例-总体比例)/样本比例的标准误差3.拒绝域:p值<0.054.p值:根据样本比例和标准误差计算得到5.根据p值判断是否拒绝原假设6.如果拒绝原假设,说明产品合格率显著下降7.如果不拒绝原假设,说明产品合格率保持不变8.样本比例=(样本中不合格数量/样本总数)=2/10=0.29.样本比例的标准误差=√[(总体比例*(1-总体比例))/样本总数]10.置信区间:根据样本比例和标准误差计算得到五、线性回归分析1.回归系数b=∑[(xi-x̄)(yi-ȳ)]/∑[(xi-x̄)^2]2.回归系数a=ȳ-b*x̄3.R²值=∑[(yi-ȳ)^2]/∑[(yi-ŷ)^2]4.F统计量=(R²值*n-2)/(1-R²值)*(n-2)5.判断回归模型是否显著:如果F统计量大于临界值,则模型显著6.教育程度对居民收入的影响=b7.居民收入的标准误差=√[Σ[(yi-ŷ)^2]/(n-2)]8.教育程度的预测值=a+b*X9.预测值的标准误差=√[Σ[(yi-ŷ)^2]/(n-2)]10.预测值的置信区间:根据预测值和标准误差计算得到六、时间序列分析1.平均消费支出=(800+850+900+950+1000)/5=9102.消费支出的标准差=√[Σ[(xi-μ)^2]/(n-1)]3.消费支出的自相关系数=Σ[(xi-μ)(xi-k-μ)]/(n-k)/[Σ[(xi-μ)^2]/(n-1)]4.消费支出的偏自相关系数=Σ[(xi-μ)(xi-k-μ)*(xi-l-μ)]/[Σ[(xi-μ)^2]/(n-1)]*[Σ[(xi-l-μ)^2]/(n-l)]5.判断消费支出是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高等学校教师资格考试工作实施细则(试 行)
- 2025-2030年金属电镀活动铅笔项目商业计划书
- 初中语文文学研究方法题试题及答案
- 2025-2030年通信专用在线UPS项目投资价值分析报告001
- 马工学管理中的决策支持系统试题与答案
- 【初中生物】尿的形成与排出 教学设计-2024-2025学年北师大版生物七年级下册
- 2025-2030年车灯模型项目商业计划书
- 叙述技巧与结构试题及答案
- 2025-2030年警告灯闪光器项目商业计划书
- 2025-2030年西洋铜雕项目投资价值分析报告
- 政治-山东省青岛市2025年高三年级第一次适应性检测(青岛一模)试题和答案
- 城市交通智能管理系统开发协议
- 反恐怖测试题及答案
- 2025北京怀柔区属企业招聘管培生15人笔试参考题库附带答案详解
- JT-T-795-2011事故汽车修复技术规范
- (高清版)TDT 1063-2021 国土空间规划城市体检评估规程
- 个人借条电子版模板
- 部编版八年级历史(下)全册教案
- 泌尿外科手术配合-ppt课件
- YSJ 007-1990 有色金属选矿厂 试验室、化验室及技术检查站工艺设计标准(试行)(附条文说明)
- 丽声英语百科分级读物第一级Legs课件
评论
0/150
提交评论