




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章第六章 样本及抽样样本及抽样(chu yn)分布分布(约(约4学时)学时)1、(、(13节)随机样本节)随机样本直方图直方图统计量统计量. 1学时学时2、三大、三大(sn d)抽样分抽样分布布.1学时学时4、抽样分布、抽样分布.2学时学时重点:三大抽样分布定义、查找重点:三大抽样分布定义、查找(ch zho)分位数分位数正态总体样本均值、样本方差的主要性质正态总体样本均值、样本方差的主要性质难点:总体、样本、统计量难点:总体、样本、统计量第1页/共38页第一页,共38页。主要内容主要内容(nirng)(1学时)学时)一、总体与个体。一、总体与个体。二、随机样本(难点)。二、随机样本(难点
2、)。三、(频率三、(频率(pnl))直方图。)直方图。四、统计量(重点)。四、统计量(重点)。第1-31-3节 随机样本 直方图 统计(tngj)(tngj)量 第2页/共38页第二页,共38页。1、举例说明: 一、总体(zngt)与个体 例例 1企业为了解生产的灯泡平均企业为了解生产的灯泡平均(pngjn)使用寿命使用寿命. 使用寿命使用寿命是一个随机变量是一个随机变量X . 为求为求 E(X) , 从产品中抽取部分进行寿命测试,根据从产品中抽取部分进行寿命测试,根据测试数据对灯泡平均测试数据对灯泡平均(pngjn)使用寿命作出推断使用寿命作出推断. 例例 2 要了解某城市居民的日常生活消费
3、水平要了解某城市居民的日常生活消费水平. 消费水平是一个随消费水平是一个随机变量机变量, 设为设为 Y , 从居民中抽取一部分,进行消费水平调查,再根据调从居民中抽取一部分,进行消费水平调查,再根据调查数据查数据(shj)对所有居民的平均消费水平对所有居民的平均消费水平 E(Y) , 消费水平与均值的偏离消费水平与均值的偏离程度程度 D(Y) 作出推断作出推断. 例1的使用寿命、例2的消费水平即为总体。通过样本推断第3页/共38页第三页,共38页。2、总体与个体(gt)的概念 说明说明(shumng):总体:随机现象的某一数量指标的全体总体:随机现象的某一数量指标的全体(qunt)可能观测值。
4、可能观测值。个体:总体中的每一种可能观测值。个体:总体中的每一种可能观测值。(1)(1)总体是由许多具有共同性质的元素组成:总体是由许多具有共同性质的元素组成:数量指标、可相同数量指标、可相同(2)总体对应一随机变量总体对应一随机变量X, 每一个体是每一个体是X的一个可能取值的一个可能取值. 总体用字母总体用字母 X , Y, Z 表示表示. 总体的分布即总体的分布即X的分布的分布,不区分,不区分(3)(3)总体分类:总体分类:有限总体、有限总体、无限总体无限总体( (容量无限,或容量很大容量无限,或容量很大) )(4)(4)一个随机现象可能对应多个总体。一个随机现象可能对应多个总体。第4页/
5、共38页第四页,共38页。3、具体(jt)例子(2) (2) 某大学同学的健康状况(用身高某大学同学的健康状况(用身高(shn o)(shn o)、体重、血、体重、血型评价)。型评价)。血型血型(xuxng):总体:总体Z (A=1, B=2, AB=3, O=4) (3) (3) 上市公司经营绩效。上市公司经营绩效。每股收益:每股收益:总体总体X X 净资产收益率净资产收益率:总体:总体Y Y EPSEPS增长率:增长率:总体总体Z Z(1) (1) 某工厂生产的某工厂生产的灯泡寿命灯泡寿命:总体总体X X身高:总体X 体重:Y第5页/共38页第五页,共38页。1、样本(yngbn)及其容量
6、现实中,总体的分布一般未知,或者分布已知,但含有未知参数。现实中,总体的分布一般未知,或者分布已知,但含有未知参数。从总体中抽取从总体中抽取(chu q)(chu q)样本,根据样本信息推断总体的分布样本,根据样本信息推断总体的分布样本:从总体样本:从总体X中抽取的部分中抽取的部分(b fen)个个体。体。二、随机样本(难点)样本容量:样本中包含的个体个数。样本容量:样本中包含的个体个数。第6页/共38页第六页,共38页。2、简单(jindn)随机样本、样本观察值说明说明(shum(shumng)ng):1212,.,.,.nnXXXXXXX在在相相同同的的条条件件下下, ,对对总总体体X X
7、进进行行n n次次独独立立重重复复的的观观察察, ,将将n n次次观观察察结结果果按按试试验验次次序序分分别别记记为为则则称称为为来来自自总总体体 的的一一个个简简单单随随机机样样本本, ,简简称称样样本本. .X.12,.,nXXX样样本本与与总总体体服服从从相相同同的的分分布布( ( ) )F F( (x x) )1 1.12,.,nXXX样样本本相相( ( ) )互互独独立立2 2样本样本(yngbn)如何抽取样本?如何抽取样本? 无限总体:无限总体:不放回抽样不放回抽样。有限总体:放回抽样,nN时不放回。12,.,.nXXXXn样样本本是是相相互互独独立立并并与与总总体体 同同分分布布
8、的的 个个随随机机变变量量第7页/共38页第七页,共38页。1122,.,.,.nnxxxXXX样样本本观观测测值值: : 对对样样本本一一次次观观测测完完成成后后, , 观观测测结结果果称称为为样样本本 观观测测值值 例如:研究某工厂生产例如:研究某工厂生产(shngchn)(shngchn)的灯泡寿命(总体的灯泡寿命(总体X X)分)分布。布。12100,.,XXX( (n n= =1 10 00 0) ): :任任意意抽抽取取1 10 00 0只只灯灯泡泡, ,观观测测前前的的寿寿命命样样本本1211200100,.,.,xXxXxX: :对对进进行行一一次次观观测测结结果果记记为为样样
9、本本观观测测值值 121002000,1500, .,3000 xxx 例例()iXX观观测测前前有有理理由由认认为为与与 同同分分布布第8页/共38页第八页,共38页。3、样本(yngbn)的分布函数12111221(),(),(, .,(, .,)()(, .,)()nniiniinnFXFxfxxxFxfxxxxfxXXXX 设设 总总 体体的的 分分 布布 函函 数数 为为概概 率率 密密 度度 为为) )为为 总总 体体的的 一一 样样 本本 . .则则 样样 本本 的的联联 合合 分分 布布 函函 数数 联联 合合 概概 率率 函函 数数 统计推断的任务:统计推断的任务: 对从总体
10、对从总体(zngt)(zngt)抽取的简单随机样本进行适当整理,抽取的简单随机样本进行适当整理,由样本的分布规律近似地推断总体由样本的分布规律近似地推断总体(zngt)(zngt)的分布规律的分布规律. . 第9页/共38页第九页,共38页。 0 /12101210110103( ),( ),.,. (1),.,(2),.,10,10 xexXef xXXXXXXXXX 例例 设设总总体体其其概概率率密密度度为为其其它它是是来来自自 的的样样本本求求的的联联合合概概率率密密度度. .设设为为块块独独立立电电路路板板寿寿命命 求求块块板板寿寿命命均均大大于于2 2概概率率. . 1210:(1)
11、,.,( ) (1,2,.,10)iXXXXei 解解独独立立同同分分布布,且且 1012101(,.,)()iif xxxf x 0 10/11011,.,0iixexx 其其它它1i10min 0 ( 101110)10iixiex 其其 它它第10页/共38页第十页,共38页。 1210(2)2,2,.,2.P XXX 为为所所求求概概率率/1021()xedx 12102 2. 2P XP XP X 1012P X /10220/()ee 第11页/共38页第十一页,共38页。三、(频率(pnl))直方图为分析样本数据的统计规律为分析样本数据的统计规律(gul),将样本数据整理,频率直
12、,将样本数据整理,频率直方图方图基本方法:样本分组、确定组距、确定组限、统计基本方法:样本分组、确定组距、确定组限、统计(tngj)频率、直方图频率、直方图4 例例 为为研研究究某某厂厂工工人人生生产产某某种种产产品品的的能能力力, ,随随机机调调查查了了2 20 0位位工工人人某某天天生生产产的的该该种种产产品品的的数数量量, ,数数据据如如下下: :1 16 60 0 1 19 96 6 1 16 64 4 1 14 48 8 1 17 70 0 1 17 75 5 1 17 78 8 1 16 66 6 1 18 81 1 1 16 62 2 1 16 61 1 1 16 68 8 1
13、16 66 6 1 16 62 2 1 17 72 2 1 15 56 6 1 17 70 0 1 15 57 7 1 16 62 2 1 15 54 4. .建建立立该该批批数数据据的的频频数数频频率率分分布布表表. .过程:过程:(1)确定样本分组数)确定样本分组数k通常组数通常组数5-10组,组数主要取决于样本容量。组,组数主要取决于样本容量。样本容量样本容量n50,组数增加。,组数增加。本例本例k=5第12页/共38页第十二页,共38页。(2)确定)确定(qudng)各组组各组组距距d各组区间长度:组距。一般各组组距相同各组区间长度:组距。一般各组组距相同(xin tn)(也可(也可不
14、同)不同)组组距距d d ( (样样本本最最大大观观测测值值- -样样本本最最小小观观测测值值) )/ /组组数数k kmaxmin1961489.65xxdk本本例例 = =方便方便(fngbin)起见起见,取取d=10(3)确定每组组限)确定每组组限1(, (1,2,., )iia aik即即各各组组区区间间端端点点1iiaad0minmax5:, (0)dkaxax一一般般要要求求05:147, 197aa本本例例取取分组区间:分组区间:(147,157,(157,167 ,(167,177 ,(177,187,(187,1970 kaadk= =精精确确第13页/共38页第十三页,共3
15、8页。(4)统计)统计(tngj)频数频率频数频率统计样本数据统计样本数据(shj)落入各区间的个数落入各区间的个数(频数频数),计算相应区间的,计算相应区间的频率频率组序分组区间组中值频数频率累计频率(%)12345(147,157(157,167(167,177(177,187(187,197152162172182192485210.20.40.250.10.0520608595100合计201组中值组中值=(组上限组上限+组下限组下限)/2: 近似代表近似代表(dibio)该组的变量取值该组的变量取值第14页/共38页第十四页,共38页。作法作法(zu f):横坐标代表:横坐标代表X取
16、值区间、纵坐标表示频率取值区间、纵坐标表示频率(或或频数)频数)频数频率频数频率(pnl)直方图演示直方图演示(5)频率)频率(pnl)直方图直方图( )( )nAnnRAp An 由由伯伯努努里里大大数数定定律律, , 第15页/共38页第十五页,共38页。1、统计(tngj)量样本是统计推断的基础。但在应用时,一般不直接用样本本身样本是统计推断的基础。但在应用时,一般不直接用样本本身推断总体的分布,而是利用推断总体的分布,而是利用(lyng)(lyng)样本构造适当的函数样本构造适当的函数( (统统计量计量) ),通过统计量对总体的分布进行统计推断。,通过统计量对总体的分布进行统计推断。四
17、、统计(tngj)量(重点)g()g()g()1212121212,.,.,.,.,.,nnnnnXXXXXXXXXXXXXXXX设设为为总总体体的的一一样样本本, ,为为样样本本的的函函数数, ,如如果果中中不不含含未未知知参参数数, ,则则称称为为一一统统计计量量. .g()12,.,nXXX说说明明: :( (1 1) )统统计计量量不不仍仍为为含含未未随随知知参参数数, ,机机变变量量. .211,.,.,)nnxx xxx( (2 2) )若若为为样样本本观观测测值值, ,g g( (为为统统计计量量观观测测值值则则第16页/共38页第十六页,共38页。2、常用(chn yn)统计量
18、(1 1)样本均值)样本均值: :.121212, ., ., .,nnnXXXXxxxXXX设设为为 总总 体体的的 一一 样样 本本 , ,为为样样 本本的的 观观 测测 值值 a ()()(),(),()PD XE XE XD XXE Xn 性性质质: :1)1( niiXXn 随随机机变变量量1: 1 ()niixxn 样样本本观观测测值值实实数数 b ()(),)nD XXN EXXn L L不不管管总总体体 服服从从什什么么分分布布第17页/共38页第十七页,共38页。(2 2)样本)样本(yngbn)(yngbn)方差及标方差及标准差准差: : 22()(.()E SD XSD
19、X 性性质质: :即即为为总总体体方方差差的的无无偏偏估估计计2211()() 1niiSXXn 样样本本方方差差: : 随随机机变变量量2211(): )1( niisxxn 样样本本方方差差观观测测值值实实数数211() ()1niiSXXn 样样本本标标准准差差: : 随随机机变变量量211: () ()1niisxxn 样样本本标标准准差差观观测测值值实实数数第18页/共38页第十八页,共38页。(3 3)样本)样本(yngbn)k(yngbn)k阶矩、阶矩、k k阶中心矩阶中心矩: :P ) 1(.1)(kknkkkiiAE XAXE Xn 性性质质: :即即为为的的无无偏偏估估计计
20、1()1 nkkiiAXn 样样本本k k阶阶( (原原点点) )矩矩: : 随随机机变变量量1)()1( nkkiiBXXn 样样本本k k阶阶中中心心矩矩: : 随随机机变变量量11 1,2,.().nkkiiaxkn 样样本本k k阶阶矩矩观观测测值值: : 实实数数, ,11() 2,3,. ) .(.nkkiibxxkn 样样本本k k阶阶中中心心矩矩观观测测值值: : 第19页/共38页第十九页,共38页。5 例例 某某工工厂厂生生产产轴轴承承中中随随机机地地取取1 10 0只只, ,测测得得其其重重量量( (以以k kg g计计) )为为: :2 2. .3 36 6 2 2.
21、.4 42 2 2 2. .3 38 8 2 2. .3 34 4 2 2. .4 40 0 2 2. .4 42 2 2 2. .3 39 92 2. .4 43 3 2 2. .4 43 3 2 2. .3 39 9 2 2. .3 37 7. .求求样样本本均均值值, ,样样本本方方差差, ,样样本本标标准准差差. .11 niixxn 解解: :样样本本均均值值 1(2.362.42.2.37)2.39()10kg 2211()1: niisxxn 样样本本方方差差222221(2.362.42.2.3710*2.39 0.0008222()10 1kg 2211()1niixnxn
22、2: ss 样样本本标标准准差差0.00082220.02867()kg 第20页/共38页第二十页,共38页。本节重点本节重点(zhngdin)总结总结一、随机样本。一、随机样本。二、常用二、常用(chn yn)统计统计量。量。第21页/共38页第二十一页,共38页。第二节第二节 三大三大(sn d)抽样分布抽样分布1、 分布分布(fnb)2、t分布分布(fnb)3、F分布分布(fnb)2 第22页/共38页第二十二页,共38页。说明(shumng): 统计统计(tngj)量是样本的函数,是随机变量,有量是样本的函数,是随机变量,有其概率分布,统计其概率分布,统计(tngj)量的分布称为抽样
23、分布量的分布称为抽样分布. 要求要求: 了解了解 分布分布、t 分布、分布、F 分布的定义,及来自分布的定义,及来自正态总体正态总体X的样本均值的分布等常见统计量的分布。的样本均值的分布等常见统计量的分布。 会会查查 分布分布、t 分布、分布、F 分布的上分布的上 分位数分位数。2 2 第23页/共38页第二十三页,共38页。一、卡方分布(fnb)( )12,(0 ,1)niXXXXN( (1 1) ) 独独立立同同分分布布, ,且且2 分布分布221221222222,(0 , ).( )1,nnXXXXXXNnn 设设是是来来自自标标准准正正态态总总体体的的一一 个个样样本本,令令则则称称
24、服服从从自自由由度度为为的的分分布布记记为为1、定义、定义(dngy)(重点)(重点)说明说明(shumng):22212,(,),(0,1),) ()(niiiXXXXNXnNX n ni=1i=1(2) (2) 如如果果独独立立同同分分布布, ,且且 则则此此时时第24页/共38页第二十四页,共38页。2211222( ) 0( )0 0nnnyyeyf yy 2 2分分布布的的概概率率密密度度为为.,)(其其值值可可以以查查表表求求得得函函数数称称为为其其中中 2n2、概率密度及其图形、概率密度及其图形(txng)( )f y1 n4 n10 nyO5 10 15 202 分布图形:分布
25、图形:第25页/共38页第二十五页,共38页。2222( ),(), ()2EnDnn ( (2 2) ) 若若则则 2222121,.,(0,1)nniXXXXNXX 证证明明: :. .其其中中独独立立, ,且且(0,1) ()0, ()1iiiXNE XD X 由由22()() ()1iiiE XD XE X 22()inE XEn 244/212()xiE Xxedx 22/2123xxedx 22()inD XD 422()() 2iin E XE Xn23 ()3iE X3、主要、主要(zhyo)特征:特征:2221212(),(),),(,XnYnXXYnnY ( (1 1) )
26、可可加加性性: : 如如果果并并且且相相则则 互互独独立立第26页/共38页第二十六页,共38页。221245:2( )(21 ,1). (:(0,1)( )(21)nznnNnzNn 似似2 2近近( (3 3) )当当时时, 费费歇歇证证明明故故上上分分位位点点) )4、上侧分位数(重点、上侧分位数(重点(zhngdin))2222( ) ( )( )XnP Xnn 设设, ,对对给给定定的的正正数数( (0 0 1 1) ), ,称称满满足足条条件件: :的的点点为为分分布布的的上上分分位位点点. .说明说明(shumng):22( )( ).nn (2)(2)上上分分位位点点可可查查分
27、分布布表表求求得得2( )Xn ( (1 1) )即即随随机机变变量量落落在在点点右右侧侧的的概概率率等等于于 的的点点. .( )f yyO)(2n 第27页/共38页第二十七页,共38页。2220.10.010.05(25),(30),(50)(6), : ()0.025XAP XA 2 22 2 例例1 1 ( (1 1) )求求分分布布上上分分位位点点: : ( (2 2) )求求 使使得得:20.1: (25): =0.1, 25,n 解解20.1:(25)34.382 查查表表20.01(30)50.892 20.05(50): 5045n 0.051.645z 210.050.0
28、52(50)(2*501)z 12(1.64599)67.221 (2) ()10.0250.975P XA 20.975(6)A 1.237 第28页/共38页第二十八页,共38页。212101021,.,(0,0.3 )1.44iiXXXNPX 例例2 2 设设为为总总体体的的一一个个样样本本, ,求求21210,.,(0,0.3 )XXXN解解: : :10211.44iiPX 1012(0,1), , .,0.30.30.30.3iXXXXN且且相相 互互 独独 立立 . .:102222101211()(). ()0.30.30.30.09iiXXXyX 令令2(10)y 则则 :1
29、0211.440.0910.09iiPX 16 0.1P y 第29页/共38页第二十九页,共38页。二、t分布(fnb)(student分布(fnb))1、定义、定义(dngy)(重点)(重点)2(0 ,1),( ), ( )./XYXNYnntXTnTtY n 设设随随机机变变量量与与相相互互独独立立,且且则则称称统统计计量量服服从从自自由由度度为为的的 分分布布 记记作作112222()( )( )(1) ()nnnxnnf xxR 概概率率密密度度: :2/212: lim () (xnf xexR 可可以以证证明明即即n充分充分(chngfn)大时,大时,t分布以标准正态分布为极限分
30、布分布以标准正态分布为极限分布.第30页/共38页第三十页,共38页。( )f tOt10 n4 n1 n321123. (1)图形)图形(txng)特特征征. ( ),af t概概率率密密度度是是偶偶函函数数 关关于于纵纵轴轴对对称称. 45, (0,1)bntN 近近似似当当时时分分布布2、主要、主要(zhyo)特征:特征:(2)数字)数字(shz)特特征征( )0, ( ), ( )22nE tDttnntn 若若则则 第31页/共38页第三十一页,共38页。3、上侧分位点(重点、上侧分位点(重点(zhngdin))说明说明(shumng):( )(45, (4).)ntntztn (
31、(2 2) )上上分分位位点点可可查查 分分布布表表 附附时时表表( )( )( ),(01),P ttt nttntn 设设对对给给定定的的正正数数称称满满足足: :的的点点为为 分分布布的的上上 分分位位点点. . )(tfOt )(nt ( )ttn ( (1 1) )即即随随机机变变量量 落落在在点点右右侧侧的的概概率率等等于于 的的点点. .1 ( )( )tnntt ( (3 3) )由由 分分布布图图形形的的对对称称性性: :第32页/共38页第三十二页,共38页。0.050.010.1(25),(45),(50).(10), ,: ()0.05,()0.95ttttttA BP tAP tB 例例3 3 ( (1 1) )求求 分分布布上上分分位位点点: : ( (2 2) )求求使使得得:0.05: (25): =0.05, 25,tn 解解0.05:(25)1.708t 查查表表0.01(45)2.4121t 0.05(10)1.8125At (10), ()0.95ttP tB :0.050.025.B 为为的的双双侧侧分分位位数数, ,或或= =的的上上分分位位数数0.10.1(50)1.29(1.298tz 真真实实值值: :) )(10), ()0.05ttP tA(2)(2) :0.0520.025(10)(10)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论