第四章统计推断_第1页
第四章统计推断_第2页
第四章统计推断_第3页
第四章统计推断_第4页
第四章统计推断_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 统计推断统计推断2第一节第一节 总方差、组内方差与组间方差总方差、组内方差与组间方差32005年南京市企业主要岗位高级别工资指导价位(万元)年南京市企业主要岗位高级别工资指导价位(万元) 求:所有岗位工资之间的差别程度求:所有岗位工资之间的差别程度4一、总方差一、总方差22222(1)(xx )n(xx ) ffpp在标志值的条件下:在相对数的条件下522212.5112.512123.59x(xx )n(x)如果去年各主要岗位之间的工资差别程度为如果去年各主要岗位之间的工资差别程度为10,则说明今年各岗位之间的工资差别更大了则说明今年各岗位之间的工资差别更大了6理工类理工类管理

2、类管理类求:管理类内部各岗位、理工类内部各岗位求:管理类内部各岗位、理工类内部各岗位之间工资的差别程度,并求平均差别程度之间工资的差别程度,并求平均差别程度7二、组内方差二、组内方差 讨论分组标准对数据有无影响。讨论分组标准对数据有无影响。步骤步骤u第一步:分别计算各组的平均数、方差。第一步:分别计算各组的平均数、方差。)1 ( ,2iiiiiippffp在成数的条件下:在标志值的条件下:i ii i2 2i ii i2 2i ii ii ii ii if ff f) )x x(x x,f ff fx xx x8u第二步:计算全部组别的平均方差。第二步:计算全部组别的平均方差。iiiff22

3、计算公式均为:,无论是标志值还是成数9管理类管理类22111917.005(xx )115.85x 10222221214.57(xx )理工类理工类210.007x 11计算全部组别的平均方差。计算全部组别的平均方差。22 17.005 9 14.57 129 12iii ff =15.61求:管理类内部各岗位、理工类内部各岗位求:管理类内部各岗位、理工类内部各岗位之间工资的平均差别程度为之间工资的平均差别程度为15.6112例题例题求两试验田的组内方差。求两试验田的组内方差。11230 400120150280802222iiiff13理工类理工类管理类管理类求:管理类岗位与理工类岗位之间

4、工资的差求:管理类岗位与理工类岗位之间工资的差别程度别程度14三、组间方差三、组间方差 ii2iii2iffppffxx)(在成数的条件下:)(在标志值的条件下:22分析组与组之间的差异分析组与组之间的差异15212.51912.51128.362iii22xxff 在标志值的条件下:()(15.85)(10.007) =12+9 求:管理类岗位与理工类岗位之间工资的差求:管理类岗位与理工类岗位之间工资的差别程度为别程度为8.3616例题例题求两试验田之间的组间方差。求两试验田之间的组间方差。9261 400120497350280)497560()(497400120350280560222

5、2)(iiiiiiffxxffxx17综合例题综合例题222,求求 ,并证明三者之间的关系。,并证明三者之间的关系。18 75.124200205 .19205 .205 .752001007610075129, 76 120 , 75 2222222211xx fffxfxxffxxiii如前计算,解:解:19222222222 75.12425. 05 .12425. 02001001005 .1242001001201001295 .75765 .7575ffxxffiiiiii2043. 72 8 . 6122 13 25.182222122121)( nxxnxxxxxxifi)xx

6、(2例题例题21)()( 222222222 69.19 17. 7 85.26 69.19 12725.18225)18.2513( 17. 712743. 758 . 6 iiiiiffiffxx22n总方差一般多用于简单随机抽样分析;组内总方差一般多用于简单随机抽样分析;组内方差用于等距离抽样与类型抽样;组间方差方差用于等距离抽样与类型抽样;组间方差用于整群抽样分析。用于整群抽样分析。222222:总方差、 :组内方差的平均数、:组间方差 23作业 P88-1724一、一、误差的构成误差的构成登记性登记性误差误差抽抽样样中中的的误误差差代表性代表性误差误差实际误差实际误差抽样平均误差抽样

7、平均误差抽样抽样误差误差系统性系统性误差误差第二节第二节 抽样误差抽样误差25(一)抽样误差(一)抽样误差(Sampling error)p抽样误差抽样误差是由于抽样的随机性而产生的样本指标是由于抽样的随机性而产生的样本指标(如样本平均数)与总体指标(如总体平均数)(如样本平均数)与总体指标(如总体平均数)之间的代表性误差。如:样本平均数之间的代表性误差。如:样本平均数-总体平均数总体平均数p由于总体参数未知,无法计算其实际抽样误差。由于总体参数未知,无法计算其实际抽样误差。只能从所有可能样本的角度,根据样本估计量的只能从所有可能样本的角度,根据样本估计量的抽样分布来计算其抽样分布来计算其抽样

8、的平均误差程度。抽样的平均误差程度。p在计算抽样误差时常常假设不存在登记性误差和在计算抽样误差时常常假设不存在登记性误差和系统误差。系统误差。26(二)抽样误差大小的影响因素(二)抽样误差大小的影响因素n 总体各单位标志值的变异程度。总体各单位标志值的变异程度。在其他条件不变在其他条件不变的情况下,总体各单位标志值的变异程度愈大,的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则愈小。抽样误差也愈大,反之则愈小。n 样本单位数的多少。样本单位数的多少。在其他条件不变的情况下,在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈大。样本单位数愈多,抽样误差就愈小,反之则

9、愈大。n 抽样方法。抽样方法。抽样方法不同,抽样误差也不同。抽样方法不同,抽样误差也不同。n 抽样的组织形式。抽样的组织形式。选择不同的抽样组织形式,也选择不同的抽样组织形式,也会有不同的抽样误差。会有不同的抽样误差。27二、抽样误差的度量二、抽样误差的度量 u抽样实际误差抽样实际误差u抽样平均误差抽样平均误差xXRxl抽样实际误差抽样实际误差是指在某一次抽样中,由随机是指在某一次抽样中,由随机因素引起的样本指标与总体指标之间的数量因素引起的样本指标与总体指标之间的数量差异,常用差异,常用R表示。表示。 平均数的实际误差平均数的实际误差成数的实际误差成数的实际误差pPRp28三、抽样平均误差三

10、、抽样平均误差 (一)抽样平均误差(一)抽样平均误差是根据随机原则抽样时,所有是根据随机原则抽样时,所有可能出现的可能出现的样本平均数的标准差样本平均数的标准差。l 它反映样本平均数它反映样本平均数(样本成数样本成数)与总体平均数与总体平均数(总体总体成数成数)的平均误差程度,常用的平均误差程度,常用表示。表示。29只需记住抽样平均误差的结论即可12112212222nnnkixxxxxxxxxxXxxxxxXK在对某一总体进行抽样调查时,在总体中可以抽取一系列的抽样总体进行综合观察,每一抽样总体包含n个样本单位,如下:第一次抽样: 、 、第二次抽样: 、 、第K次抽样: 、 、( - )根据

11、抽样平均误差30Xx 2Xx 31样本平均数样本平均数的平均数的平均数抽样平均抽样平均误差误差 110161760NxXXE2800022.3616xXN321221ixxxXK但在实际计算中,出现两个问题:、在实际工作中从全及总体中一般只抽取一个样本总体,不可能抽取一系列样本总体,故K为12、如果只抽取一个样本总体,则X=( - )所以上述无法计算22222(),1xinnxxxn此时只能根据一个样本总体的所有样本单位的标志值进行计算,根据抽样统计理论,有: (重置抽样时)其中 为样本总体中所包含的样本单位数,为样本总体的方差为样本平均数33注意:注意:抽样误差抽样误差平均抽样误差平均抽样误

12、差34(二)抽样平均误差的两种形式(二)抽样平均误差的两种形式 (1)nxxPxnPPP(1)在重置抽样条件下:样本平均数误差 样本成数误差 x:样本总体标准差n:样本个数35 1n(1)(1)nnNPPnPN(2)在非重置抽样条件下:样本平均数误差 样本成数误差 其中, :总体标准差; N:总体单位数; n:样本单位数 p: 样本成数修正因子修正因子36 22212222212222222222111nnxXxXXXXnXnxnxxxxxnnn重置条件下的平均抽样误差重置条件下的平均抽样误差37非重置条件下的平均抽样误差非重置条件下的平均抽样误差jijiinnniiiXxXxEXxEnXxX

13、xXxEnnXXXnxxxEXxExExEXXnnXXXnxExExEnxEXXNPXxE2221221222111)(111138111111222222222121221NXnnXnnXxXxEXXEnNXNNXNXxXxEXNXXXXXXXXXXLijiijiNjjNjjNjjLkLk代入上述公式得:又由于3922211111111nXXnNnnNnNXNnnNNNnnNNnN 当时,40例例某公司出口一种名茶,规定每包规格重量不某公司出口一种名茶,规定每包规格重量不低于低于150g,现用简单随机抽样方法抽取其中,现用简单随机抽样方法抽取其中1%进行检验,结果如下:进行检验,结果如下:试

14、求平均抽样误差?试求平均抽样误差?410 0. .0 08 87 7g gN Nn n1 1n n: :非非重重置置0 0. .0 08 87 7g g1 10 00 00 0. .8 87 7n n: :重重置置0 0. .8 87 7g gf ff f) )x x( (x x1 15 50 0. .3 3g gf fx xf fx xx xx x2 2421000010025设要检验件某产品的质量,现随机抽取件,发现其中有件废品,求抽样平均误差。例题例题2pp25 p0.25100 p1p0.25 0.75 0.18750.1875n 10.994.3100npN解: ()43 补充补充:

15、置信度与置信区间:置信度与置信区间 置信度置信度也称为置信水平,它是指总体参数也称为置信水平,它是指总体参数真值落在样本估计值某一区间内的真值落在样本估计值某一区间内的概率概率(把握性程度)。它反映的是抽样推断(把握性程度)。它反映的是抽样推断的的可靠性程度可靠性程度。如:以如:以100%的概率保证统计学考试成绩在的概率保证统计学考试成绩在(0分分 - 100分)分) 以以5%的概率保证英语六级考试成绩在的概率保证英语六级考试成绩在(80分分 - 90分)分)44 置信区间置信区间指的是样本估计值的指的是样本估计值的波动范围波动范围,置,置信区间反映的是信区间反映的是抽样的精确性抽样的精确性程

16、度。程度。45置信区间越大置信区间越大置信度越高置信度越高抽样推断的精确度就越低抽样推断的精确度就越低(0分分 100分)分)100%精确度为精确度为046四、抽样的极限误差四、抽样的极限误差l抽样极限误差是指样本指标和总体抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。指标之间抽样误差的可能范围。l表达式表达式xxppXxtPpt 4768.27xxx1tx)(xpxxXxt 482xx245.95)(xp2t)(xpx33x3t73.9949常用常用置信度置信度与与t值值表表 50 xtxxxxxX( )()xxXxt xxxxxxxxxx x x0.6828 t 1 xx0.9

17、545 t222 xx0.9973 t 333XXXX ( t)(t) 概率概率度() ()()51第三节第三节 参数估计参数估计l参数估计就是以所计算的参数估计就是以所计算的样本指标样本指标来估计相来估计相应的应的总体指标总体指标。参数估计有点估计和区间估。参数估计有点估计和区间估计两种形式。计两种形式。l用样本平均数、方差或标准差估计总体平均用样本平均数、方差或标准差估计总体平均数、方差或标准差数、方差或标准差 。222()xXxxSn如:52x分分布布趋趋向向正正态态分分布布大大样样本本的的抽抽样样 3 30 0n nn nx一、参数估计的优良标准一、参数估计的优良标准l 无偏性无偏性l

18、 有效性有效性l 一致性一致性53 无偏性无偏性:样本估计量的平均数等于被估计的总:样本估计量的平均数等于被估计的总体参数。体参数。 即:即:E(样本估计量)(样本估计量)= 总体参数真值总体参数真值 如:如:E( ) = 就是就是 的无偏估计量的无偏估计量xxxx54)(xpx无偏有偏x55有效性有效性:在所有无偏估计量中,具有最小方差的:在所有无偏估计量中,具有最小方差的那个样本估计量是有效的。那个样本估计量是有效的。即:即:D(样本估计量(样本估计量1)D(样本估计量(样本估计量2)则则“样本估计量样本估计量1”就为总体参数真值的有效估计就为总体参数真值的有效估计量量 如: 22()1.

19、57()XeD xD Mnnx就为 的有效估计量56xx 均值的抽样分布)(xp57一致性一致性:随着样本容量随着样本容量n增大,样本估计量会增大,样本估计量会越来越接近被估计的总体参数真值。越来越接近被估计的总体参数真值。lim()1np xXxX如:则 就为 的已知一致估计量58xx 的抽样分布的抽样分布较大样本容量较大样本容量 的抽样分布的抽样分布较小样本容量较小样本容量)(xp59二、点估计和区间估计二、点估计和区间估计l 当总体参数不清楚时,用一个特定值(一当总体参数不清楚时,用一个特定值(一般用样本统计量)对其进行估计,称为点估般用样本统计量)对其进行估计,称为点估计。如:用计。如

20、:用样本均值样本均值代替代替总体均值总体均值,用,用样本样本离差离差 ( )代替代替总体方差总体方差( )l点估计从总体抽取一个样本,根据该样本的点估计从总体抽取一个样本,根据该样本的观察值对总体指标作出一个数值点的估计观察值对总体指标作出一个数值点的估计 。 (一)点估计(一)点估计2S260(二)区间估计(二)区间估计l 区间估计就是根据样本估计量以一定区间估计就是根据样本估计量以一定可靠程度可靠程度推断推断总体参数所在的区间范围。总体参数所在的区间范围。 如:如:l 特点特点:考虑了估计量的分布,所以它能给出估计精:考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度(置

21、信度)。度,也能说明估计结果的把握程度(置信度)。xxX在区间 x- x+6112n x , x , , x计算步骤设是一组样本观察值。 1. xxfxnf计算或62xxxxxx2. ( ) xx x x0.6827 t1 xx0.9545 t222 tF ttXXX对给定 的置信度 ,查分布表的 值。( t)(t) 概率概率度( ) 即:F(1)=68.28% ( )即:F(2)=95.45% (xxxx0.9973 t333X) 即:F(3)=99.73%633. t 计算极限误差:4. X: xxt xtnn置信区间:即:,64设设要要检检验验1 10 00 00 00 0件件某某产产品

22、品的的质质量量,现现随随机机抽抽取取1 10 00 0件件,发发现现其其中中有有2 25 5件件废废品品,要要求求用用重重置置抽抽样样 的的方方式式以以9 99 9. .7 73 3置置信信度度(概概率率)对对该该批批产产品品的的合合格格率率进进行行区区间间估估计计。例题例题652pppp75 p0.75 p(1-p)0.75 0.25 0.18751000.1875 0.0433 4.3100 t0.9973 t3 0.0433 3 0.13 p p 0.62 0.ppnFtPP 解:( )又的区间为: , : 0.75-0.13 0.75+0.13在区间,88 66 概概率率。合合格格率率

23、的的范范围围及及相相应应的的下下,试试求求该该批批产产品品的的不不. .8 8的的条条件件,在在极极限限误误差差不不超超过过6 6发发现现其其中中有有1 13 3件件废废品品0 0件件,检检验验,现现随随机机抽抽取取1 10 0对对某某批批产产品品的的质质量量进进行行例题例题672pppp13 n100 p0.13 100 p(1-p)0.130.870.11310.1131 0.034 3.41006.8 t t2 3.4 20.9545 P:p- p ppnF解: ( ), 6.2 P19.8 即68例题例题 某纱厂某时期内生产了某纱厂某时期内生产了1010万个单位的纱,按纯万个单位的纱,

24、按纯随机抽样方式抽取随机抽样方式抽取20002000个单位检验,检验结果个单位检验,检验结果合格率为合格率为95%95%,废品率为,废品率为5%5%,试以,试以95%95%的把握程的把握程度,估计全部纱合格品率的区间范围及合格品度,估计全部纱合格品率的区间范围及合格品数量的区间范围?数量的区间范围?69合格品数量范围 94060,95940p pppppn n1 1N Nn np 1pp 1pn n 1 1nNnN0.95 0.0520000.95 0.052000 10.48% 10.48%20001000002000100000tt1.96 0.48%0.94%1.96 0.48%0.94

25、%94.06% P95.94%94.06% P95.94%70第四节第四节 抽样调查的组织方式及其误差的抽样调查的组织方式及其误差的计算计算一、简单随机抽样n对总体中每一个单位对总体中每一个单位, ,都按具有同等的都按具有同等的互相互相独立独立的被选中机会的方式进行抽样的被选中机会的方式进行抽样( (对总体对总体不分组、排序等不分组、排序等) ),这种抽样方式就称为简,这种抽样方式就称为简单随机抽样。单随机抽样。n基本表达式为:基本表达式为: n分为重置抽样与非重置抽样抽样。分为重置抽样与非重置抽样抽样。Nn711101072(一)简单随机抽样的抽样过程(一)简单随机抽样的抽样过程l掌握所有总

26、体单位的名册、编号,可根掌握所有总体单位的名册、编号,可根据抽签、随机数表、计算机产生随机数据抽签、随机数表、计算机产生随机数值抽取样本。值抽取样本。特点特点u最符合最符合随机随机原则,是其它抽样方式的基础。原则,是其它抽样方式的基础。u有时无法使用该方式。有时无法使用该方式。u有时抽样效果不好。有时抽样效果不好。73 平均抽样误差:平均抽样误差: (二)简单随机抽样的计算与分析步骤(二)简单随机抽样的计算与分析步骤计计算算内内容容总体参数区间估计总体参数区间估计总体成数区间估计总体成数区间估计总体均值区间估计总体均值区间估计xxpP74 12x(xx) x iiiiiiffff)样本均值指标

27、, (1)标志值条件下的计算与分析)标志值条件下的计算与分析 2) n 1xNnn平均抽样误差或75x( )68.28%,1( )95%,1.96 3 ( )95.45%,2( )99.73%,3xF ttF tttF ttF tt ) 极限误差 4) Xxx区间估计:76例例 某县共有某县共有400个自然村,从中任意抽取个自然村,从中任意抽取15个个村,各村的耕牛头数分别是村,各村的耕牛头数分别是7、11、20、9、34、16、15、7、11、16、13、11、25、9、15。试。试计算抽样平均数的平均误差。计算抽样平均数的平均误差。 解:解:22221514.652.6835n1n52.6

28、83515 12.063615400ixnxxnxxxxnnN头头77(2)成数条件下的计算与分析)成数条件下的计算与分析1 (1)pfpfpp)样本均值指标的计算782) 1pppnNnn平均抽样误差3 ppt ) 极限误差4) P pp区间估计:79综合例题综合例题从从10001000名学生中按理论抽样法抽取名学生中按理论抽样法抽取100100人进行分析,人进行分析,资料如下:资料如下:求:(求:(1 1)样本成绩的平均抽样误差。)样本成绩的平均抽样误差。 (2 2)以)以F F(1.961.96)=95%=95%的置信度估计全部学生的置信度估计全部学生的平均成绩。的平均成绩。 (3 3)

29、以)以F F(2 2)=95.45%=95.45%的置信度估计全部学生中的置信度估计全部学生中8080分以上学生所占的比重。分以上学生所占的比重。 f) x(x280386. 0214. 0 086. 0043. 01 21. 0, 3 . 0 )3( 04.7796.72: 037. 2 )2( 039. 11 95.10)(,75 12PtNnnpXxXtNnnffxxfxfx,)解:(81练习 P175-2题、3题82二、等距抽样二、等距抽样n 也称系统抽样或机械抽样。它是简单随机抽样的也称系统抽样或机械抽样。它是简单随机抽样的变形。一般用非重置方式变形。一般用非重置方式计算抽样平均误差

30、。计算抽样平均误差。n 步骤步骤将总量的所有个体按一定顺序排列。将总量的所有个体按一定顺序排列。计算抽样距离。距离是由总体数目与样本数目决计算抽样距离。距离是由总体数目与样本数目决定定:K:KN/nN/n将总体将总体N N划分为划分为n n个单位相等的部分。从第一部分个单位相等的部分。从第一部分顺序为顺序为1 1,2 2,i,ki,k单位中随机抽取第单位中随机抽取第i i个单位,个单位,第二部分抽取第第二部分抽取第i+Ki+K个单位,第个单位,第n n部分抽取第部分抽取第i+(n-i+(n-1)k1)k单位,共单位,共n n个单位组成一个样本,样本间隔为个单位组成一个样本,样本间隔为k k。8

31、3计算过程与简单随机抽样相同计算过程与简单随机抽样相同84例例 将某企业职工按工资高低顺序排队,然后将某企业职工按工资高低顺序排队,然后每隔每隔20人抽人抽1人,共抽取人,共抽取110人,得知他们的人,得知他们的月平均工资是月平均工资是800元,样本标准差元,样本标准差244元,试元,试计算职工月平均工资的抽样平均误差。计算职工月平均工资的抽样平均误差。 解解:已知,已知,n=110, = 800元,元,=244元,元,x24411122.6820110 xnNn201Nn85三、类型抽样三、类型抽样u在对全及总体进行分组的基础上,对所有在对全及总体进行分组的基础上,对所有各组各组分别按简单随

32、机抽样抽取样本,通过分别按简单随机抽样抽取样本,通过对样本指标的计算,对总体参数进行推断对样本指标的计算,对总体参数进行推断的一种抽样方式。的一种抽样方式。 u关键关键(1)对所有组都要进行调查对所有组都要进行调查 (2)每一组抽取部分样本进行调查)每一组抽取部分样本进行调查 86表达式:表达式:nnnnNNNNi21i2187所有上市公司可分为以下几类:所有上市公司可分为以下几类: 信息技术业信息技术业 制造业制造业 农、林、牧、渔业农、林、牧、渔业 综合类综合类 交通运输、仓储业交通运输、仓储业 批发和零售贸易批发和零售贸易 房地产业房地产业 传播与文化产业传播与文化产业 电力、煤气及水的

33、生产和供应业电力、煤气及水的生产和供应业 建筑业建筑业 88899091000004 *ST国农600721 S*ST百花000672 S*ST铜城000010 SST华新600767 ST运盛000693 *ST聚友000993 *ST闽电600852 *ST中川92(一)等比例下的计算与分析步骤(一)等比例下的计算与分析步骤2xf xf2( xx)f fiiiiiiiii( 1 ) 各 类 样 本 的 均 值 计 算1. 标志值条件下的计算与分析标志值条件下的计算与分析222x f x fiiiiiiff( )全部样本的均值计算93 1nNnn(3)平均抽样误差或 t (4)极限误差 Xx

34、 (5)区间估计:94例例 从某市近郊区和远郊区的农户中按从某市近郊区和远郊区的农户中按10%的比例各的比例各抽抽540户和户和1200户,作农户年收入调查,这两个样户,作农户年收入调查,这两个样本的平均年收入分别是本的平均年收入分别是5100元和元和4300元,标准差元,标准差分别是分别是1100元和元和1250元,试计算年收入的平均误元,试计算年收入的平均误差。差。 解解:据题意有:据题意有:N=5400+12000=17400户,户, 样本容量样本容量 f=f1+f2=540+1200=1740 448.145310322iiiff42.2710111740448.145310312Nn

35、nx关键:判断是何种抽样方式关键:判断是何种抽样方式952. 成数条件下的计算与分析成数条件下的计算与分析2i221 (1)2 p, 3 14 5 iiiiiiiiipiifpppfp ffffffnNnntPp ()各组样本的成数的计算( ) 全部样本成数的计算( )平均抽样误差( )极限误差( )样本估计:96例例 某工厂有新旧两条鼠标生产线,对某月产某工厂有新旧两条鼠标生产线,对某月产品按品按5%的比例抽查的比例抽查100只和只和125只,各有只,各有3只不合格,求全月鼠标合格率的只不合格,求全月鼠标合格率的抽样平均抽样平均误差。误差。解解: p1=0.97 p2=0.976%06. 1

36、 51 225125024. 0976. 010003. 097. 0 1n 1 2p2iNnffppffpiiiiii97例例 某地一万住户,按城乡比例不重复抽取一千户,进行彩电拥某地一万住户,按城乡比例不重复抽取一千户,进行彩电拥有量调查,结果如下。试以有量调查,结果如下。试以95.45%的概率推断该地彩电拥有户的概率推断该地彩电拥有户比率的范围。比率的范围。14. 0100070085. 015. 03002 . 08 . 0)1 (2i2iiiiiiffppff%5 .34100070015. 03008 . 0:iiiffpP解%12. 11Nnnp%24.2tpp%74.36%26

37、.32 :PpPp即98综合例题综合例题现从4000亩地块按10%抽样,资料如下:求(1)样本亩产的平均抽样误差。 (2)以F(2)=95.45%置信度估计全部地块的平均亩产。 (3)以F(3)=99.73%置信度估计高产田在全部地块中所占的比重。99解:解:26.111374.111176. 0) 2(38. 01654001508015060100505 .1112400150110015012001001000122XtNnnffffxxiiiiii)(10022222(3)30.2491 0.40.24160 0.44000.16 1000.2491 1500.24

38、 150 400 0.2234 10.02240.0672 0.33280.4673AABBCCiiipppPffntNnP ,101作业 P176-6题102四、整群抽样四、整群抽样l整群抽样整群抽样是指将总体划分为若干个(互不相是指将总体划分为若干个(互不相交又穷尽)的群,然后对群进行抽样并对中交又穷尽)的群,然后对群进行抽样并对中选群进行全面分析的一种抽样方式。选群进行全面分析的一种抽样方式。l分群标准要求:群间异质性低分群标准要求:群间异质性低, ,群内异质性群内异质性高。高。l本质本质是以群为单位的简单随机抽样。是以群为单位的简单随机抽样。l表达式表达式:N-RrN-Rr,意思:全及

39、总体共有意思:全及总体共有N N个单位,可以分为个单位,可以分为R R个个群体,再从群体,再从R R个群体中抽取个群体中抽取r r个样本群体个样本群体l形式形式:群内单位数目相等与不等两种方式。:群内单位数目相等与不等两种方式。103所有上市公司可分为以下几类:所有上市公司可分为以下几类: 信息技术业信息技术业 制造业制造业 农、林、牧、渔业农、林、牧、渔业 综合类综合类 交通运输、仓储业交通运输、仓储业 批发和零售贸易批发和零售贸易 房地产业房地产业 传播与文化产业传播与文化产业 电力、煤气及水的生产和供应业电力、煤气及水的生产和供应业 建筑业建筑业 制造业制造业 综合类综合类 批发和零售贸

40、易批发和零售贸易 104105批发和零售贸易批发和零售贸易 批发和零售贸易-零售业600721 S*ST百花批发和零售贸易-零售业000670 *ST天发批发和零售贸易-零售业000672 S*ST铜城批发和零售贸易-商业经纪与代理业600773 *ST雅砻批发和零售贸易-商业经纪与代理业000010 SST华新批发和零售贸易-商业经纪与代理业000578 S*ST数码1061. 标志值条件下的计算与分析步骤标志值条件下的计算与分析步骤22 1x, x (xx) iiiiiixfixnfr()样本均值r:被抽取的群数组间方差:107r2 1rxR( ) 抽样平均误差: t F txx ( 3)

41、 极 限 误 差 :如 :() =95.45%t=24 xxX ( )总体均值区间估计:1082. 成数条件下的计算与分析步骤成数条件下的计算与分析步骤ii221 () iipfpiffpfppr()样本均值指标的计算第 个样本群体的成数(如合格品率);所有样本群体的成数抽样成数的组间方差:1092 1pprRr( )平均抽样误差pp3 t ( )极限误差p4 Pp ( )总体成数估计:110 57202018071.9695F某 工 厂 大 量 连 续 生 产 , 为 掌 握 某 月 份 某 种 产 品 一 级 品 比 率 ,确 定 抽 取 的 产 品 , 即 在 全 月 连 续 生 产 的

42、小 时 中每 隔小 时 抽 取 小 时 的 全 部 产 品 进 行 检 查 , 调 查 结 果 为 :一 级 品 率 , 群 间 方 差 为 , 试 以 () 的置 信 度 给 出 一 级 品 率 的 置 信 区 间 。例题例题关键:判断是何种抽样方式关键:判断是何种抽样方式2pppp720 r720 536 7r0.0736 1) 1 0.043 36720r 0.043 1.96 0.084 8.4 P p 71.6 P 88.4RRt解: ():即111例例 从某镇从某镇80个自然村中随机抽取个自然村中随机抽取5个自然村个自然村作农民家庭年收入调查,各自然村中年收作农民家庭年收入调查,各

43、自然村中年收入在入在5000元以上的农户所占比重依次是元以上的农户所占比重依次是41%,63%,47%,53%,66%,试计算,试计算成数的平均误差。成数的平均误差。 解:解:R=80, r=5%54rppi00888. 050444. 022rppip0411. 012)(Rrrpp112例例 某校有班级某校有班级180个,第个,第11周周一除周周一除30个班个班去外地实习外,其余都在上课。教务处抽查去外地实习外,其余都在上课。教务处抽查了了5个班,学生到课比例为:个班,学生到课比例为:100%、91%、88%、90%、70%。试求该项抽查的平均误。试求该项抽查的平均误差。差。解解:已知:已知 R=150,r=510.910.880.90.787.88%5i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论