概率论与数理统计第六章样本与抽样分布_第1页
概率论与数理统计第六章样本与抽样分布_第2页
概率论与数理统计第六章样本与抽样分布_第3页
概率论与数理统计第六章样本与抽样分布_第4页
概率论与数理统计第六章样本与抽样分布_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计第六章样本与抽样分布第1页,课件共85页,创作于2023年2月第六章样本与抽样分布

本章主要内容§1总体与个体§2直方图与经验分布函数§3统计量及其分布第2页,课件共85页,创作于2023年2月

1.定义1:一个统计问题总有它明确的研究对象.一.总体与个体…研究某批灯泡的质量研究对象的全体称为总体(母体),总体中每个成员称为个体.总体

§6.1总体与个体第3页,课件共85页,创作于2023年2月2.有限总体和无限总体定义2:样本中所包含的个体数目n称为样本容量。注:当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体.总体容量有限的成为有限总体总体容量无限的称为无限总体

§6.1总体与个体第4页,课件共85页,创作于2023年2月

然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体

§6.1总体与个体第5页,课件共85页,创作于2023年2月

由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.

这样,总体就可以用一个随机变量及其分布来描述.统称总体X。

§6.1总体与个体注意第6页,课件共85页,创作于2023年2月

而概率分布正是刻划这种集体性质的适当工具.因此在理论上可以把总体与概率分布等同起来.

统计的任务,是根据从总体中抽取的样本,去推断总体的性质.

由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量…),所谓总体的性质,无非就是这些指标值的集体的性质.

§6.1总体与个体第7页,课件共85页,创作于2023年2月

例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体寿命X可用一概率分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).F(x)

§6.1总体与个体第8页,课件共85页,创作于2023年2月

类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.

统计中,总体这个概念的要旨是:总体就是一个概率分布.

§6.1总体与个体第9页,课件共85页,创作于2023年2月

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为

“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.二.样本从国产轿车中抽5辆进行耗油量试验样本容量为5

§6.1总体与个体第10页,课件共85页,创作于2023年2月

但是,一旦取定一组样本,得到的是n个具体的数(x1,x2,…,xn),称为样本的一次观察值,简称样本值

.

样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机变量.

§6.1总体与个体第11页,课件共85页,创作于2023年2月2.独立性:X1,X2,…,Xn是相互独立的随机变量.

由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.

最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1.代表性:X1,X2,…,Xn中每一个与所考察的总体有相同的分布.

§6.1总体与个体第12页,课件共85页,创作于2023年2月

由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn表示.

若总体的分布函数为F(x),则其简单随机样本的联合分布函数为三.样本的概率分布

§6.1总体与个体第13页,课件共85页,创作于2023年2月今后,若不特别说明,就指简单随机样本.

若连续总体的概率密度函数为f(x),则其样本的联合概率密度函数为

§6.1总体与个体

离散时,概率函数是指分布率p(x),则其样本的联合分布率为注意第14页,课件共85页,创作于2023年2月

事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值.四.总体、样本、样本值的关系

§6.1总体与个体第15页,课件共85页,创作于2023年2月总体(理论分布)?样本

样本值

统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.

总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁

§6.1总体与个体第16页,课件共85页,创作于2023年2月例1-1:已知总体X服从参数为的泊松分布,求样本的联合分布律.

§6.1总体与个体第17页,课件共85页,创作于2023年2月

§6.1总体与个体2023/8/2218第18页,课件共85页,创作于2023年2月一、直方图(自学)

当取得一组样本值后,一般先根据样本的取值作出频率直方图对总体的分布情况作一个几何直观上的粗略了解,然后再进行进一步的分析推断.直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。

§6.2直方图与经验分布函数第19页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第20页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第21页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第22页,课件共85页,创作于2023年2月[例2-1]

某工厂用自动包装机包装产品,为了考察每袋产品重量的波动情况,选取100袋产品测得其重量如下:(单位:kg),根据测得的数据作出频率直方图.97.8 94.6 98.9 100.9 99.8 102.7 97.998.797.195.5 99.0 101.1 99.6 102.9 97.7 95.799.3102.199.5 101.2 99.9 103.1 98.2 95.8 99.1100.398.8101.3 100.0 103.8 98.1 96.0 99.0 101.499.998.9100.1 98.3 96.3 99.2 101.5 100.2 104.599.8100.998.5 96.6 99.3 101.4 100.3 97.8 98.4102.299.896.7 99.4 101.1 100.4 96.9 99.5 101.098.8102.4100.1 98.5 97.0 99.1 101.2 100.2 98.0100.799.797.2 99.2 101.6 100.2 98.1 97.4 99.098.6100.1101.6 100.4 98.1 97.5 99.4 101.8 100.5 102.3100.6102.0 100.2 98.9 99.7 100.6 102.1100.899.698.8100.4

§6.2直方图与经验分布函数第23页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第24页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第25页,课件共85页,创作于2023年2月

§6.2直方图与经验分布函数第26页,课件共85页,创作于2023年2月二、经验分布函数

§6.2直方图与经验分布函数第27页,课件共85页,创作于2023年2月为由x1,x2,…,xn确定的经验分布函数.定义6设x1,x2,…,xn是总体X的样本值,称函数

§6.2直方图与经验分布函数第28页,课件共85页,创作于2023年2月经验分布函数与理论分布函数的关系

§6.2直方图与经验分布函数第29页,课件共85页,创作于2023年2月因此,我们可以用来近似

这也是利用样本来估计和判断总体的基本理论和依据.

§6.2直方图与经验分布函数

[例2-2]

从某总体中抽取容量为5的样本,其观测值依次为

-1.2,2.6,1.8,-0.7,1.8求经验分布函数,并画出的图形.解将数据由小到大排列得:-1.2,-0.7,1.8,1.8,2.6第30页,课件共85页,创作于2023年2月则经验分布函数为:

§6.2直方图与经验分布函数第31页,课件共85页,创作于2023年2月的图形见下图.

§6.2直方图与经验分布函数第32页,课件共85页,创作于2023年2月

由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.一、样本统计量定义;

设x1,x2,…,xn

为取自某总体的样本,若样本函数T=g(x1,x2,…,xn)中不含有任何未知参数。则称T为统计量。它是完全由样本决定的量.统计量的分布称为抽样分布。

§6.3统计量及其分布第33页,课件共85页,创作于2023年2月

为什么要引进统计量?为什么统计量中不能含有未知参数?

答:引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。

如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。

§6.3统计量及其分布第34页,课件共85页,创作于2023年2月

§6.3统计量及其分布第35页,课件共85页,创作于2023年2月

几个常见统计量★样本均值★样本方差它反映了总体均值的信息它反映了总体方差的信息★样本标准差

§6.3统计量及其分布第36页,课件共85页,创作于2023年2月★样本k阶原点矩★样本k阶中心矩

k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息

§6.3统计量及其分布第37页,课件共85页,创作于2023年2月

§6.3统计量及其分布第38页,课件共85页,创作于2023年2月上述五种统计量可统称为矩统计量,简称样本矩,他们都是样本的显函数,它们的观测值仍分别称为样本均值、样本方差、样本标准差、样本k阶(原点)矩、样本k阶中心矩.

§6.3统计量及其分布第39页,课件共85页,创作于2023年2月★顺序统计量将样本中的各分量按由小到大的次序排列成

§6.3统计量及其分布2023/8/2240第40页,课件共85页,创作于2023年2月二、统计量的分布

统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.

§6.3统计量及其分布第41页,课件共85页,创作于2023年2月

抽样分布就是通常的随机变量函数的分布.只是强调这一分布是由一个统计量所产生的.研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.抽样分布精确抽样分布渐近分布(小样本问题中使用)(大样本问题中使用)

§6.3统计量及其分布第42页,课件共85页,创作于2023年2月记为分布1、定义:设相互独立,都服从正态分布N(0,1),则称随机变量:

所服从的分布为自由度为

n

的分布.分布是由正态分布派生出来的一种分布.

§6.3统计量及其分布第43页,课件共85页,创作于2023年2月卡方分布是由英国统计学家KarlPearson(1857-1936)于1900年提出来的。

§6.3统计量及其分布第44页,课件共85页,创作于2023年2月

自由度(degreeoffreedom,df)在数学中是指能够自由取值的随机变量的个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。

§6.3统计量及其分布第45页,课件共85页,创作于2023年2月分布的密度函数为来定义.其中伽玛函数通过积分

§6.3统计量及其分布第46页,课件共85页,创作于2023年2月该密度函数的图像是一只取非负值的偏态分布

§6.3统计量及其分布第47页,课件共85页,创作于2023年2月性质1(此性质可以推广到多个随机变量的情形)

§6.3统计量及其分布第48页,课件共85页,创作于2023年2月性质2证明事实上,因

,故

§6.3统计量及其分布第49页,课件共85页,创作于2023年2月

§6.3统计量及其分布第50页,课件共85页,创作于2023年2月P304附表5=0.250.100.050.0250.010.005123456789101112131415161.3232.7734.1085.3856.6267.8419.03710.21911.38912.54913.70114.84515.98417.11718.24519.3692.7064.6056.2517.7799.23610.64512.01713.36214.68415.98717.27518.54919.81220.06422.30723.5423.8415.9917.8159.48811.07112.59214.06715.50716.91918.30719.67521.02622.36223.68524.99626.2965.0247.3789.34811.14312.83314.44916.01317.53519.02320.48321.92023.33724.73626.11927.48828.8456.6359.21011.34513.27715.08616.81218.47520.09021.66623.20924.72526.21727.68829.14130.57832.0007.87910.59712.83814.86016.75018.54820.27821.95523.58925.18826.75728.29929.89131.31932.80134.267分布表

§6.3统计量及其分布第51页,课件共85页,创作于2023年2月=0.9950.990.9750.950.900.75123456789101112131415160.0100.0720.2070.4120.6760.9891.3441.7352.1562.6033.0743.5654.0754.6015.1420.0200.1150.2970.5540.8721.2391.6462.0882.5583.0533.5714.1074.6605.2295.8120.0010.0510.2160.4840.8311.2371.6902.1802.7003.2473.8164.4045.0095.6296.2626.9080.0040.1030.3520.7111.1451.6352.1672.7333.3253.9404.5755.2265.8926.5717.2617.9620.0160.2110.5841.0641.6102.2042.8333.4904.1684.8655.5786.3047.0427.7908.5479.3120.1020.5751.2131.9232.6753.4554.2555.0715.8996.7377.5848.4389.29910.16511.03711.912?=3.816P304附表5分布表

§6.3统计量及其分布第52页,课件共85页,创作于2023年2月=0.250.100.050.0250.010.0051718192021222324252627282930313220.48921.60522.71823.82824.93526.03927.14128.24129.33930.43531.52832.62033.71134.80035.88736.97324.76925.98927.20428.41229.61530.81332.00733.19634.38235.56336.74137.91639.08740.25641.42242.58527.58728.86930.14431.41032.67133.92435.17236.41537.65238.88540.11341.33742.55743.77344.98546.19430.19131.52632.85234.17035.47936.78138.07639.36440.64641.92343.19444.46145.71246.97948.23249.48033.40934.80536.19137.56638.93240.28941.63842.98044.31445.64246.96348.27849.58850.89252.19153.48635.71837.15638.58239.99741.40142.79644.18145.55946.92848.29049.64550.99352.33653.67255.00356.328?=36.741分布表

§6.3统计量及其分布P304附表5第53页,课件共85页,创作于2023年2月应用中心极限定理可得,若

,则当n充分大时,若的分布近似标准正态分布.则可以求得,

E(X)=n,D(X)=2n若

§6.3统计量及其分布第54页,课件共85页,创作于2023年2月t的密度函数为:记为t~t(n).所服从的分布为自由度为n的t分布.2、t分布

定义:设X~N(0,1),Y~,且X与Y相互独立,则称变量)(2nc

§6.3统计量及其分布第55页,课件共85页,创作于2023年2月

§6.3统计量及其分布

学生t-分布可简称为t分布。其推导由威廉·戈塞(WilliamSealyGosset,1876.6.13-1937.10.16)于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了Student这一笔名。之后t检验以及相关理论经由罗纳德·费雪(SirRonaldAylmerFisher,FRS,1890.2.17-1962.7.29)的工作发扬光大,而正是他将此分布称为学生分布。(/view/1332600.htm)第56页,课件共85页,创作于2023年2月具有自由度为n的t分布的随机变量t的数学期望和方差为:

E(t)=0;D(t)=n/(n-2),(当n>2时)

当n充分大时,其图形类似于标准正态分布密度函数的图形.

t分布的密度函数关于x=0对称,且

§6.3统计量及其分布第57页,课件共85页,创作于2023年2月当n充分大时,其图形类似于标准正态变量概率密度的图形.

§6.3统计量及其分布第58页,课件共85页,创作于2023年2月性质1

设,则当n>2时有性质2

设,是t的分布密度,则此性质说明,当时,t分布的极限分布是标准正态分布。t

分布具有下列性质:

§6.3统计量及其分布第59页,课件共85页,创作于2023年2月由分布的对称性知

§6.3统计量及其分布第60页,课件共85页,创作于2023年2月=0.250.100.050.0250.010.005123456789101112131415161.00000.81650.76490.74070.72670.71760.71110.70640.70270.69980.69740.69550.69380.69240.69120.69013.07771.88561.63771.53321.47591.43981.41491.39681.38301.37221.36341.35621.35021.34501.34061.33686.31382.92002.35342.13182.01501.94321.89461.85951.83311.81251.79591.78231.77091.76131.75311.745912.70624.30273.18242.77642.57062.44692.36462.30602.26222.22812.20102.17882.16042.14482.13152.119931.82076.96464.54073.74693.36493.14272.99802.89652.82142.76382.71812.68102.65032.62452.60252.583563.65749.92485.84094.60414.03223.70743.49953.35543.24983.16933.10583.05453.01232.97682.94672.9208分布表

§6.3统计量及其分布P303附表4第61页,课件共85页,创作于2023年2月P303附表4=0.250.100.050.0250.010.005123456789101112131415161.00000.81650.76490.74070.72670.71760.71110.70640.70270.69980.69740.69550.69380.69240.69120.69013.07771.88561.63771.53321.47591.43981.41491.39681.38301.37221.36341.35621.35021.34501.34061.33686.31382.92002.35342.13182.01501.94321.89461.85951.83311.81251.79591.78231.77091.76131.75311.745912.70624.30273.18242.77642.57062.44692.36462.30602.26222.22812.20102.17882.16042.14482.13152.119931.82076.96464.54073.74693.36493.14272.99802.89652.82142.76382.71812.68102.65032.62452.60252.583563.65749.92485.84094.60414.03223.70743.49953.35543.24983.16933.10583.05453.01232.97682.94672.9208?=2.1315分布表

§6.3统计量及其分布第62页,课件共85页,创作于2023年2月由定义可见,3、F分布定义:设X与Y相互独立,则称统计量服从自由度为n1及n2的F分布,n1称为第一自由度,n2称为第二自由度,记作F~F(n1,n2).

§6.3统计量及其分布第63页,课件共85页,创作于2023年2月

为了彰显英国统计学家費雪对统计的贡献,美国统计学家斯內德克(GeorgeSnedecor,1881-1974)提出以費雪名字开头的字母,当作

分布的名称。

§6.3统计量及其分布第64页,课件共85页,创作于2023年2月即它的数学期望并不依赖于第一自由度n1.X的数学期望为:若n2>2若X~F(n1,n2),X的概率密度为

§6.3统计量及其分布第65页,课件共85页,创作于2023年2月(1)(2)

§6.3统计量及其分布第66页,课件共85页,创作于2023年2月

§6.3统计量及其分布第67页,课件共85页,创作于2023年2月分布表

§6.3统计量及其分布n1n2123456789101161.4199.5215.7224.6230.2234.0236.8238.9240.5241.9218.5119.0019.1619.2519.3019.3319.3519.3719.3819.40310.139.559.289.129.018.948.898.858.818.7947.716.946.596.396.266.166.096.046.005.9656.615.795.415.195.054.954.884.824.774.7465.995.144.764.534.394.284.214.154.104.0675.594.744.354.123.973.873.793.733.683.6485.324.464.073.843.693.583.503.443.393.3595.124.263.863.633.483.373.293.233.183.14104.964.103.713.483.333.223.143.073.022.98114.843.983.593.363.203.093.012.952.902.85124.753.893.493.263.113.002.912.852.802.75134.673.813.413.183.032.922.832.772.712.67P305附表52023/8/2268第68页,课件共85页,创作于2023年2月分布表

§6.3统计量及其分布n1n2123456789101161.4199.5215.7224.6230.2234.0236.8238.9240.5241.9218.5119.0019.1619.2519.3019.3319.3519.3719.3819.40310.139.559.289.129.018.948.898.858.818.7947.716.946.596.396.266.166.096.046.005.9656.615.795.415.195.054.954.884.824.774.7465.995.144.764.534.394.284.214.154.104.0675.594.744.354.123.973.873.793.733.683.6485.324.464.073.843.693.583.503.443.393.3595.124.263.863.633.483.373.293.233.183.14104.964.103.713.483.333.223.143.073.022.98114.843.983.593.363.203.093.012.952.902.85124.753.893.493.263.113.002.912.852.802.75134.673.813.413.183.032.922.832.772.712.67P305附表5第69页,课件共85页,创作于2023年2月

当总体为正态分布时,教材上给出了几个重要的抽样分布定理.这4个抽样分布定理很重要,要牢固掌握。三、正态总体样本均值与方差的分布

§6.3统计量及其分布第70页,课件共85页,创作于2023年2月

定理1(样本均值的分布)设X1,X2,…,Xn是取自正态总体的样本,则有

§6.3统计量及其分布第71页,课件共85页,创作于2023年2月n取不同值时样本均值的分布

§6.3统计量及其分布第72页,课件共85页,创

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论