版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学─从数据到结论第五章总体参数的估计估计就是根据你拥有的信息来对现实世界进行某种判断。你可以根据一个人的衣着、言谈和举止判断其身份你可以根据一个人的脸色,猜出其心情和身体状况统计中的估计也不例外,它是完全根据数据做出的。如果我们想知道北京人认可某饮料的比例,人们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比例。从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。从数据得到关于现实世界的结论的过程就叫做统计推断(statisticalinference)。上面调查例子是估计总体参数(某种意见的比例)的一个过程。估计(estimation)是统计推断的重要内容之一。统计推断的另一个主要内容是下一章要引进的假设检验(hypothesistesting)。§5.1用估计量估计总体参数人们往往先假定某数据来自一个特定的总体族(比如正态分布族)。而要确定是总体族的哪个成员则需要知道总体参数值(比如总体均值和总体方差)。人们于是可以用相应的样本统计量(比如样本均值和样本方差)来估计相应的总体参数§5.1用估计量估计总体参数一些常见的涉及总体的参数包括总体均值(m)、总体标准差(s)或方差(s2)和(Bernoulli试验中)成功概率p等(总体中含有某种特征的个体之比例)。正态分布族中的成员被(总体)均值和标准差完全确定;Bernoulli分布族的成员被概率(或比例)p完全决定。因此如果能够对这些参数进行估计,总体分布也就估计出来了。§5.1用估计量估计总体参数估计的根据为总体抽取的样本。样本的(不包含未知总体参数的)函数称为统计量;而用于估计的统计量称为估计量(estimator)。由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个实现(realization)或取值,也称为一个估计值(estimate)。§5.1用估计量估计总体参数这里介绍两种估计,一种是点估计(pointestimation),即用估计量的实现值来近似相应的总体参数。另一种是区间估计(intervalestimation);它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。§5.2点估计用什么样的估计量来估计参数呢?实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。当然,统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。这样就出现了按照这些标准定义的各种名目的估计量(如无偏估计量等)。另一些估计量则是由它们的计算方式来命名的(如最大似然估计和矩估计等)。§5.2点点估估计最常用用的估估计量量就是是我们们熟悉悉的样样本均均值、、样本本标准准差(s)和(Bernoulli试试验的的)成成功比比例(x/n);人们用用它们们来分分别估估计总总体均均值(m)、总总体标标准差差(s)和成成功概概率(或总总体中中的比比例)p。这些些在前前面都都已经经介绍绍过,,大家家也知知道如如何通通过计计算机机(或或公式式)来来计算算它们们。§5.2点点估估计那么,,什么么是好好估计计量的的标准准呢??一种统统计量量称为为无偏估估计量量(unbiasedestimator)。所谓的的无偏性性(unbiasedness)就是::虽然然每个个样本本产生生的估估计量量的取取值不不一定定等于于参数数,但但当抽抽取大大量样样本时时,那那些样样本产产生的的估计计量的的均值值会接接近真真正要要估计计的参参数。。§5.2点点估估计由于一一般仅仅仅抽抽取一一个样样本,,并且且用该该样本本的这这个估估计量量的实实现来来估计计对应应的参参数,,人们们并不不知道道这个个估计计值和和要估估计的的参数数差多多少。。因此,,无偏偏性仅仅仅是是非常常多次次重复复抽样样时的的一个个渐近近概念念。随机样样本产产生的的样本本均值值、样样本标标准差差和Bernoulli试验验的成成功比比例分分别都都是相相应的的总体体均值值、总总体标标准差差和总总体比比例的的无偏偏估计计。§5.2点点估估计在无偏偏估计计量的的类中中,人人们还还希望望寻找找方差差最小小的估估计量量,称称为最最小方方差无无偏估估计量量。此因为为方差差小说说明反反复抽抽样产产生的的许多多估计计量差差别不不大,,因此此更加加精确确。评价一一个统统计量量好坏坏的标标准很很多;;而且且许多多都涉涉及一一些大大样本本的极极限性性质。。我们们不想想在这这里涉涉及太太多此此方面面的细细节。。§5.3区区间估计计当描述一个个人的体重重时,你一一般可能不不会说这个个人是76.35公公斤你会说这个个人是七八八十公斤,,或者是在在70公斤斤到80公公斤之间。。这个范围围就是区间间估计的例例子。§5.3区区间估计计在抽样调查查例子中也也常用点估估计加区间间估计的说说法。比如,为了了估计某电电视节目在在观众中的的支持率((即总体比比例p),某调查查结果会显显示,该节节目的“收收视率为90%,误误差是±3%,置信信度为95%”云云云。这这种种说法意味味着下面三三点§5.3区区间估计计1. 样本本中的支持持率为90%,即用用样本比例例作为对总总体比例的的点估计2. 估计计范围为90%±3%(±3%的误差差),即区区间(93%,87%)。3. 如用用类似的方方式,重复复抽取大量量(样本量量相同的))样本时,,产生的大大量类似区区间中有些些会覆盖真真正的p,而有些不不会;但其其中大约有有95%会会覆盖真正正的总体比比例。§5.3区区间估计计这样得到的的区间被称称为总体比比例p的置信度(confidencelevel)为95%的置信信区间(confidenceinterval)。。这里的置信信度又称置信水平或置信系数。。显然置信度度的概念又又是大量重重复抽样时时的一个渐渐近概念。。§5.3区区间估计计因此说“我我们目前得得到的区间间(比如上上面的90%±3%)以概率率0.95覆盖真正正的比例p”是个错误的的说法。这里的区间间(93%,,87%)是固定的,,而总体比比例p也是是固定的值值。因此只只有两种可可能:或者者该区间包包含总体比比例,或者者不包含;;在固定数值值之间没有有任何概率率可言。§5.3区区间估计计例5.1(noodle.txt)某某厂家生产产的挂面包包装上写明明“净含量量450克克”。在用用天平称量量了商场中中的48包包挂面之后后,得到样样本量为48的关于于挂面重量量(单位::克)的一一个样本::用计算机可可以很容易易地得到挂挂面重量的的样本均值值、总体均均值的置信信区间等等等。下面是是SPSS的输出::该输出给出出了许多第第三章引进进的描述统统计量。和和估计有关关的是作为为总体均点点估计的样样本均值,,它等于449.01;而总总体均值的的95%置置信区间为为(447.41,,450.61)§5.3区区间估计计我们还可以以构造两个个总体的均均值(或比比例)之差差的置信区区间。如想知道两两个地区学学生成绩的的差异,可可以建造两两个地区成成绩均值之之差m1-m2的置信区间间。如想比较一一个候选人人在不同阶阶段支持率率的差异,,那就可构构造比例之之差p1-p2的置信区间间。§5.3区区间估计计例5.2有有两个地区区大学生的的高度数据据(height2.txt)(a)我们们想要分别别得到这两两个总体均均值和标准准差的点估估计(即样样本均值和和样本标准准差)和各各总体均值值的95%置信区间间。(b)求两两个均值差差m1-m2的点估计和和95%置置信区间。。利用软件件很容易得得到下面结结果:§5.3区区间估计两个总体均值值估计量的样样本均值分别别为170.56和165.60,,样本标准差差分别为6.97857和7.55659;还还得到均值的的置信区间分分别是(168.5767,172.5433),(163.4524,167.7476)。可以得到两个个样本均值的的差(4.9600),,另外还给出出了两总体均均值差的95%置信区间间(2.073,7.847)。§5.4关关于置信区间间的注意点前面提到,不不要认为由某一样本数据得到总体体参数的某一个95%置信区区间,就以为为该区间以0.95的概率覆覆盖总体参数数。置信度95%仅仅描述用用来构造该区区间上下界的的统计量(是随随机的)覆盖总体参数数的概率;也就是说,无无穷次重复抽抽样所得到的的所有区间中中有95%包包含参数。§5.4关关于置信区间间的注意点但是把一个样样本数据带入入统计量的公公式所得到的的一个区间,,只是这些区区间中的一个个。这个非随机的的区间是否包包含那个非随随机的总体参参数,谁也不不可能知道。。非随机的数数目之间没有有概率可言。。§5.4关关于置信区间间的注意点置信区间的论论述是由区间间和置信度两两部分组成。。有些新闻媒体体报道一些调调查结果只给给出百分比和和误差(即置置信区间),,并不说明置置信度,也不不给出被调查查的人数,这这是不负责的的表现。因为降低置信信度可以使置置信区间变窄窄(显得“精精确”),有有误导读者之之嫌。在公布布调查结果时时给出被调查查人数是负责责任的表现。。这样则可以以由此推算出出置信度(由由后面给出的的公式),反反之亦然。§5.4关关于置信区间间的注意点一个描述性例例子:有10000个人人回答的调查查显示,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消防管理员培训
- 《眩光开头动画》课件
- 公务员面试培训课件
- 《电路参数及其提取》课件
- 《瓦锡兰柴油发电机》课件
- 3桂花雨 公开课一等奖创新教学设计
- 统编版四年级下册语文第八单元 习作故事新编 公开课一等奖创新教学设计
- 年产xxx低压配电箱项目可行性研究报告(立项说明)
- 年产xxx防爆物防护器材项目建议书
- 新建LOW-E镀膜玻璃基片项目立项申请报告
- 2024年移动通信设备项目规划申请报告模本
- 广州起义烈士陵园英文导游词
- 形容词比较级与最高级通用课件
- 预防艾滋病宣传讲座
- 2024年上海外服招聘笔试参考题库附带答案详解
- 《智能高分子材料》课程教学大纲
- 中队辅导员工作手册
- 《光学棱镜一》课件
- 《理想与责任班会》课件
- 三环六步式教学模式解读课件
- 游戏开发职业生涯规划总结
评论
0/150
提交评论