样本及抽样分布概述_第1页
样本及抽样分布概述_第2页
样本及抽样分布概述_第3页
样本及抽样分布概述_第4页
样本及抽样分布概述_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 样本及抽样分布本章转入入课程的的第二部部分数理统计计数理统计计的特点点是应用用面广,分支较较多。社社会的发发展不断断向统计计提出新新的问题题。从历史的的典籍中中,人们们不难发发现许多多关于钱钱粮、户户口、地地震、水水灾等等等的记载载,说明明人们很很早就开开始了统统计的工工作。但但是当时时的统计计,只是是对有关关事实的的简单记录录和整理理,而没有有在一定定理论的的指导下下,作出出超越这这些数据据范围之之外的推断。到了十九九世纪末末二十世世纪初,随着近近代数学学和概率率论的发发展,才才真正诞诞生了数数理统计计学这门门学科。数理统计计学是一一门应用用性很强强的学科科。它是研究究怎样以以有效的

2、方方式收集、整整理和和分析受随机影影响的数数据,并对所所考察的的问题作作出推断和预测,直至为为采取决决策和行行动提供供依据和建议。数理统计计不同于于一般的的资料统统计,它它更侧重重于应用用随机现现象本身身的规律律性进行行资料的的收集、整理和和分析。数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的、局部的资料,对所研究问题的整体, 尽可能地作出精确而可靠的结论。在数理统统计中,不是对对所研究究的对象象全体(称为总体)进行观察察,而是是抽取其其中的部部分(称为样本)进行观察察获得数数据(抽样),并通通过这些些数据对对总体进进行推断断。由于推断断是基于于抽样数数据,抽抽样数据据又不能能

3、包括研研究对象象的全部部信息。因而由由此获得得的结论论必然包包含不肯定性性。所以,在数理理统计中中必然要要用到概概率论的的理论和和方法。由此也可可以说:概率论是是数理统统计的基基础,而而数理统统计是概概率论的的重要应应用。但但它们是是并列的的两个学学科,并并无从属属关系。需要强调调说明一一点:统计方法法具有“部分推断断整体”的特征征 。因为我们们是从一一小部分分样本观察值去去推断该该全体对对象(总体)情况,即由部部分推断断全体。 这里里使用的的推理方方法是“归纳推理理”。这种归纳纳推理不不同于数数学中的的“演绎推理理”。它在作出出结论时时,是根根据所观观察到的的大量个个别情况况,“归纳”起来所

4、所得,而而不是从从一些假假设、命命题、已已知的事事实等出出发,按按一定的的逻辑推理去得出来来的。如果这一一切都建建立在可可靠的科科学基础础上,则则对总体体下结论论是可能能的也是是可靠的的。因因为这这里存在在着样品品(随机机抽取的的一个个个体)个个性(特殊性)和总体共共性(普遍性)之间的一一种内在在的、对对立统一一的辩证证关系。但此时还还应记住住毕竟是是由“局部”推断“整体”,因而而仍可能能犯错误,结论往往往又是是在某个个“可靠性水水平”之下得得出的。1.1随随机样样本1.总体与个个体一个统计问问题总有有它明确确的研究究对象。研究对象象的全体体称为总体(母母体),总体中每每个成员员称为个体。然而

5、在统统计研究究中,人人们关心心总体仅仅仅是关关心其每每个个体体的一项项(或几几项)数数量指标和该数量量指标在在总体中中的分布情况。这这时,每每个个体体具有的的数量指指标的全全体就是是总体。该批灯泡泡寿命的的全体就就是总体某品牌轿轿车百公公里耗油油量的全全体就是是总体某批灯泡的寿命某品牌轿车百公里耗油量由于每个个个体的的出现是是随机的的,所以以相应的的数量指指标的出出现也带带有随机机性。从从而可以以把这种种数量指指标看作作一个随随机变量量,因此此随机变变量的分分布就是是该数量量指标在在总体中中的分布布。这样,总体就可可以用一一个随机机变量及及其分布布来描述述。统计的任任务,是根据从从总体中中抽取

6、的的样本,去推断总总体的性性质。由于我们们关心的的是总体体中的个个体的某某项指标标(如人的身身高、体体重,灯灯泡的寿寿命,汽车的耗耗油量),所谓总体体的性质质,无非就是是这些指标值的的集体的的性质。而概率分布布正是刻划划这种集集体性质质的适当当工具。因此在在理论上上可以把总体与与概率分分布等同同起来。在数理统统计中,总体这这个概念念的要旨是:总体就是是一个概概率分布布。-500050010001500200005101520252.样本为推断总总体分布布及各种种特征,按一定定规则从从总体中中抽取若若干个体体进行观观察试验验,以获获得有关关总体的的信息,这一抽抽取过程程称为“抽样”,所抽抽取的部

7、部分个体体称为样本。样本中中所包含含的个体体数目称称为样本容量量。从某品牌轿车中抽5辆进行耗油量试验样本容量量为5容量为 n 的样本(也称为子样)可以看作 n 维随机变量:( X1 , X2 , , Xn )但是,一一旦取定定一组样样本,得得到的是是n个具体的的数(x1, x2, ,xn),称为为样本的的一次观观察值,简称样本观察察值。由于抽样样的目的的是为了了对总体体进行统统计推断断,为了了使抽取取的样本本能很好好地反映映总体的的信息,必须考考虑抽样样方法。最常用的的一种抽抽样方法法叫作“简单随机机抽样”,它要要求抽取取的样本本满足下下面两点点:1.代表性:X1, X2, ,Xn中每一个个与

8、所考考察的总总体有相相同的分分布。2.独立性:X1, X2, ,Xn是相互独独立的随随机变量量。由简单随随机抽样样得到的的样本(子样)称为简单随机机样本(子样)。用( X1, X2, ,Xn)表示。简单随机机样本是是应用中中最常见见的情形形,今后后,当说说到( X1, X2, ,Xn)是取自某某总体的的样本时时,若不不特别说说明,就就指简单随机机样本。3.总体、样样本、样样本值的的关系总体(理理论分布布)样本样本值总体分布布决定了了样本取取值的概概率规律律,也就就是样本本取到样样本值的的规律,因而可可以由样样本值去去推断总总体。2.2抽抽样分分布1.统统计量及及其抽样样分布由样本值值去推断断总

9、体情情况,需需要对样样本值进进行“加工”,这就就要构造造一些样样本的函函数,它它把样本本中所含含的(某某一方面面)的信信息集中中起来。这种不含任何何未知参参数的样样本的函函数称为为统计量。它是完完全由样样本决定定的量。统计量量的分布布称为抽样分布布。2.样样本均均值及其其抽样分分布样本均值值反映了总总体均值值的信息息分组样本本场合:其中k为组数;xi为第i组的组中中值;fi为第i组的频率率。定理: 设 是来自某总体的样本, 为 样本均值。若总体分布为 N( ,2), 则 的精确分布为 N(, 2/n ) ;若总体分布未知或不是正态分布,则 的渐近分布为 N(, 2/n ) ;样本方差差与样本本

10、标准差差它反映了了总体方方差的信息定理设总体X具有二二阶矩,EX=,DX=22t分布的密度函数关于x=0对称,且当n充分大时时,其图图形类似似于标准准正态分分布密度度函数的的图形。请看演示示t分布不难看到到,当n充分大时时,t分布近似似N(0,1)分布布。但但对于于较小的的n,t分布与N(0,1)分布布相差很很大。3、F分布定义: 设 X与Y相互独立,则称统计量服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 : F F ( n1 , n2 ) .Fisher由定义可可见, F ( n2, n1)若XF(n1,n2),X的概率密密度为X的数学期期望为:若n22即

11、它的数数学期望望并不依依赖于第第一自由由度n1.F分布演示分位数演演示例如:1.6452.326-2.3262.4469-2.446914.4491.237计算9.20 xy一般地,证:令:则xy=0.1605四、几个个重要的的抽样分分布定理理定理1(样本均值值的分布布)设X1, X2, , Xn 是取自正态总体的样本,则有: n取不同值时样本均值 的分布定理2(样本方差差的分布布)设X1, X2, , Xn 是取自正态总体的样本,分别为样本均值和样本方差,则有:说明:n取不同值时 的分布 定理3 设 X1,X2,Xn 是取自正态总体的样本,分别为样本均值和样本方差,则有:证明:独立定理4(两总体样样本均值值差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论