应用统计分析复习要点_第1页
应用统计分析复习要点_第2页
应用统计分析复习要点_第3页
应用统计分析复习要点_第4页
应用统计分析复习要点_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习好资料欢迎下载 应用统计分析复习要点 应用统计学复习要点 (要求:每人携带具有幵方功能的计算器) 一、名词解释 1.统计学 收集、处理、分析、解释数据并从数据中得出结论的科学。 2. 方差分析 方差分析是通过分析数据的误差判断各总体均值是否相等,研究分类 型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。 3. 假设检验 假设检验是事先对总体参数或分布形式作出某种假设,然后利用样本 信息来判断原假设是否成立。分为参数假设检验和非参数假设检验。一般 采用逻辑上的反证法,依据统计上的小概率原理。 4. 置信区间 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学 中,

2、一个概率样本的置信区间(Con fide nee in terval)是对这个样本的某个 总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落 在测量结果的周围的程度。 5. 置信水平 置信水平是指总体参数值落在样本统计值某一区内的概率。 6. 抽样分布 抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本 的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基 础。 7. 方差分析 方差分析是通过分析数据的误差判断各总体均值是否相等,研究分类 型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。 8. 相关分析 相关分析(correlation a

3、nalysis),相关分析是研究现象之间是否存在某 种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度, 是研究随机变量之间的相关关系的一种统计方法。 9. 推断统计 推断统计是研究如何利用样本数据来推断总体特征的统计方法。包含 两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用 样本信息判断对总体的假设是否成立。 二、计算题 1. 计算120。 解答: 2. 某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方 式进行试验。为比较哪种排队方式使顾客等待的时间更短,两种排队方式 各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟, 标准差为1.97

4、分钟,第二种排队方式的等待时间(单位:分 (1) 计算第二种排队时间的平均数和标准差。 (2) 比较两种排队方式等待时间的离散程度。 如果让你选择一种排队方式,你会选择哪一种?试说明理由。 3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取 36人, 调查他们每天上网的时间(单位:小时),得到的数据如下: 求该校大学生平均上网时间的置信区间,置信水平分别为90%, 95% 和 99%。(注:z(0.1)、z(0.05)和 z(0.01)统计量值分别为 1.65、1.96 和 2.58) 4. 利用下面的信息,构建总体均值 卩的置信区间。 (1)总体服从正态分布,且已知a =500, n

5、=15, =8900,置信水平为95%。 (注:z统计量值为1.96) 总体不服从正态分布,且已知a =500, n=35, =8900,置信水平为 95%。(注:z统计量值为1.96) (4)总体不服从正态分布, a 未知,n=35, =8900, s=500,置信水平 为90%。(注:z统计 量值为1.65) (5)总体不服从正态分布, a 未知,n=35, =8900, s=500,置信水平 为99%。(注:z统计 量值为2.58) 5.对消费者的一项调查表明, 17%的人早餐饮料是牛奶。某城市的牛 奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法, 生产商随机抽取550人

6、的一个随机样本,其中115人早餐饮用牛奶。在a =0.05的显著性水平下,检验该生产商的说法是否属实?(注: z统计量值 为 1.96) 6. 项包括了 200个家庭的调查显示,每个家庭每天看电视的平均时 间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视 的平均时间是6.7小时。取显著性水平a =0.01,这个调查能否证明“如今 每个家庭每天收看电视的平均时间增加了”?(注: z统计量值为1.96) 7. 下面是7个地区2000年的人均国内生产总值 GDP (Y)和人均消费 水平(X)的统计数据 (1)计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消

7、费水平作因变量,利用最小二乘法求 出估计的回归方程, 并解释回归系数的实际意义。 (3) 计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性。(a =0.05) (5)如果某地区的人均 GDP为5千元,预测其人均消费水平。 某地区的人均GDP为5 000元,预测其人均消费水平为2278.10657 元 求人均GDP为5千元时,人均消费水平95%的置信区间和预测区间。 人均GDP为5 000元时,人均消费水平95%的置信区间为1990.74915, 2565.46399,预测 区间为1580.46315,2975.74999。 8. 随机抽取7家超市,得到其广告费支出

8、(X)和销售额(Y)数据如 下:(注:此题对应的t统计量值为2.57) 计算相关系数,说明二者之间的关系。 r = 63.86/(6.424*11.964)=0.831 广告费用支出作自变量,销售额作因变量,利用最小二乘法求出估 计的回归方程,并解释回归系数的实际意义。 计算判定系数和估计标准误差,并解释其意义。 检验回归方程线性关系的显著性。(a =0.05) 如果某超市的广告费用支出为 5万元,预测其销售额。 据此进行计算(x为广告费)=37.1364 求广告费用支出为5万元时,超市销售额95%的置信区间和预测 区间。 三、论述题 1. 简述样本量与置信水平、总体方差、估计误差的关系。 1

9、.估计总体均值时样本量 n为 n?(z?2)2?2 E2 其中:E?z? 2. 样本量n与置信水平1- a、总体方差、估计误差E之间的关系为 ?与置信水平成正比,在其他条件不变的情况下,置信水平越大,所 需要的样本量越大; ?与总体方差成正比,总体的差异越大,所要求的样本量也越大;?与 与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计 误差的平方越大,所需的样本量越小。 2.简述评价估计量的三个标准。(15分) 1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数 2、有效性:对同一总体参数的两个无偏点估计量,有更小标准差的 3、 估计量更有效 致性:随着样本量的增大时,点

10、估计量的值越来越接近被估总 体的参数。 3. 简要说明残差分析在回归分析中的作用。(15分) 残差是因变量的观测值 y与根据估计的回归方程求出的预测值之差, 它反映了用估计的回归方程去预测 y而引起的误差。 4.简要误差分解的概念和基本原理。(15分) 1.误差概念:精确值与近似值之差称为误差,也叫绝对误差。 2.产生误差的主要原因 模型误差:在解决实际问题时,在一定条件下抓住主要因素将现实 系统理想化的数学描述称为实际问题的数学模型,这种数学描述常常是近 似的,数学模型与实际系统之间存在误差,这种误差称为模型误差。 观测误差:数学模型中往往含有一些由观测得到的物理量(如温度、 电阻、长度)或由物理量估算出的模型参数,这些观测物理量或模型参数 常常与实际数据存在误差。这种由观察产生的误差称为观测误差。 截断误差:数值计算中用有限运算近似代替无穷过程产生的误差。 例如计算一个无穷次可微函数的函数值时,理论上只

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论