《探索性数据分析》2013测验试卷参考答案.docx_第1页
《探索性数据分析》2013测验试卷参考答案.docx_第2页
《探索性数据分析》2013测验试卷参考答案.docx_第3页
《探索性数据分析》2013测验试卷参考答案.docx_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

探索性数据分析测验试卷班级: 姓名: 学号: 1. (15分)你所知道的数据类型有哪些?请至少举出四种,并说明这 些数据类型的特点。2. (共15分)(1). 请叙述矩估计和极大似然估计的定义。(2). 设总体,为来总体的样本,求使的点的极大似然估计。解: 假设为标准正态分布的分布函数,则, 由已知可得,. 令为标准正态分布的上侧0.05分位数,则. 于是,由极大似然估计的不变性可知,的极大似然估计为,,其中, .(3). 矩估计唯一吗?是,请证明;否,请举反例。答: 矩估计不唯一,例如泊松分布均值的估计。具体的说,假设总体X服从参数为的泊松(Poisson)分布,由于,故由矩估计法知: ,都可作为参数的矩估计量, 然而样本均值是总体均值的无偏估计,且比样本二阶中心矩的阶数低,故优先选取样本均值作为参数的矩估计.3. (10分)设X和的方差都存在,证明 .解:(该题是证明相关系数介于-1,1之间的理论依据,所以其实严格来讲由相关系数的取值范围来推得这个命题的做法是错误的)。令,t为任一实数,则,由积分的性质可知,另一方面, 上式为t的二次函数,故,得证.4. (20分)已知与独立,且,设T与C的分布函数分别为F和G,已知,其中m(.)为已知函数,假设观察样本为,试证明:(1)(2)请用观察样本给出的一个合适估计。(1)证明: 利用条件期望的性质可得:(2)解: 由(1)可知 于是,我们可以用估计方程方法给出的一个估计。上式的样本类似为 令,由该方程解出来的估计称为估计方程估计,且在一些正则条件下,该估计是相合和渐近正态的.5. (15分,请附程序,否则不予评分)某航空公司为了解旅客对公司服务态度的满意程度,对50名旅客作调查,要求他们写出对乘机服务、机上服务和到达机场服务的满意程度。满意程度的评分从0到100,分数越大满意程度越高,收集到的数据如下表,要求:(1)对50名旅客关于乘机服务的满意程度数据作描述性统计分析 ;(2)对50名旅客关于机上服务的满意程度数据作描述性统计分析;(3)对50名旅客关于到达机场服务的满意程度数据作描述性统计分析;(4)对50名旅客关于这三方面服务的满意程度数据作一个综合比较的描述性统计分析。 表:50名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分 乘机服务 机上服务 到达机场服务 乘机服务 机上服务 达到机场服务71 49 58 72 76 3784 53 63 71 25 7484 74 37 69 47 1687 66 49 90 56 2372 59 79 84 28 6272 37 86 86 37 5972 57 40 70 38 5463 48 78 86 72 7284 60 29 87 51 5790 62 66 77 90 5172 56 55 71 36 5594 60 52 75 53 9284 42 66 74 59 8285 56 64 76 51 5488 55 52 95 66 5274 70 51 89 66 6271 45 68 85 57 6788 49 42 65 42 6890 27 67 82 37 5485 89 46 82 60 5679 59 41 89 80 6472 60 45 74 47 6388 36 47 82 49 9177 60 75 90 76 7064 43 61 78 52 72解:所谓描述性统计分析是指: 对有关数据做统计性描述,可以包括对数据的频数分析,数据的集中趋势分析(例如:均值,分位数,众数等),离散程度分析(例如:离差,方差等),数据的分布(例如:偏度,峰度,是否正态等),以及一些基本的统计图形(例如:直方图,茎叶图,箱线图等)。具体R语句请参考相关书籍。6. (15分,请附程序,否则不予评分)为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂,12辆车使用这两种添加剂每加仑汽油行驶里程数的检测结果如下:车辆 添加剂 车辆 添加剂 1 2 1 21 22.32 21.25 7 18.36 19.402 25.76 23.97 8 20.75 17.183 24.23 24.77 9 24.07 22.234 21.35 19.26 10 26.43 23.355 23.43 23.12 11 25.41 24.986 26.97 26.00 12 27.22 25.90 7.(10分,请附程序,否则不予评分)在一个24小时的试验中,以小时为单位记录实验室中的一群昆虫产卵的数量,要检验 : 24个产卵数量组成24个同分布随机变量的观测值备择假设: 产卵数量在下午2:15达到最小,逐渐增加直到凌晨2:15增大到最大值,再减少直到下午2:15.每小时产卵数量的记录如下时间 卵的数量 时间 卵的数量 时间 卵的数量上午9点 151 下午5点 83 凌晨1点 286上午10点 119 晚上6点 166 凌晨2点 235上午11点 146 晚上7点 143 凌晨3点 223中午12点 111 晚上8点 116

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论