平均数抽样分布(正式)_第1页
平均数抽样分布(正式)_第2页
平均数抽样分布(正式)_第3页
平均数抽样分布(正式)_第4页
平均数抽样分布(正式)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 概率与理论分布概率与理论分布第三节第三节 平均数抽样分布平均数抽样分布研究总体与从中抽取的样本之间的关系是统计学的中心内容 。对这种关系的研究可从两方面着手:(1)抽样分布:从总体到样本 ,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布; (2)统计推断: 从样本到总体,这就是统计推断(statistical inference)问题。 统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对样本的抽样分布有所了解。 我们知道,由总体中随机地抽取若干个体组成样本,

2、即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同而有所不同,因而样本统计量也是随机变量, 也有其概率分布。我们把统计量的概率分布称为抽样分布。 由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。 复置抽样:指每次抽出一个个体后,这个个体应返回原总体;不复置抽样:指每次抽出的个体不返回原总体。对于无限总体,返回与否都可保证各个体被抽到的机会相等。对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。 一、抽样的目的一、抽样的目的gogo二二、样本平均数及其分布、样本平均数及其分布gogo三、样本平均数差数及其三、样本平均数差数及其分

3、布分布gogo 四、四、t分布分布gogo导言一、抽样的目的一、抽样的目的 运用样本推断总体运用样本推断总体试验测定所得 样本数据样本数据; 试验目的 获得总体信息总体信息因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息总体信息总体总体 1x2x3xkx导言总体总体 1x2x3xkx二、样本平均数及其分布:二、样本平均数及其分布:iXiX 许多许多 Si 形成形成样本样本标准差抽样分布。标准差抽样分布。 许多许多 形成形成样本平均数抽样分布。样本平均数抽样分布。由样本平均数构成由样本平均数构成的总体称为的总体称为样本平均数的抽样总体。样本平均数的抽样总体。和一个标准差和一个标准

4、差Si 。每一个样本有一个样本平均数每一个样本有一个样本平均数样本平均数样本平均数 抽样分布抽样分布iX二、样本平均数及其分布:二、样本平均数及其分布: 抽样分布总体与原总体有什么关系抽样分布总体与原总体有什么关系? 与与 ? 与与 ?抽样分布总体与原总体关系如下抽样分布总体与原总体关系如下:1、样本平均数分布的平均数等于原总体、样本平均数分布的平均数等于原总体平平2、样本平均数分布的标准差等于原总体标、样本平均数分布的标准差等于原总体标即即x x= = ,n nx x = =n n(标准误)(标准误)准差准差除以除以均数,即均数,即ixis标 准 误标 准 误(平均数抽样总体的标准差) 的大

5、小反映样本平均数 的抽样误差的大小,即精确性的高低 。 标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明各样本平均数 间的差异程度小 , 样本平均数的精确性高。 的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体抽样 ,因为是一常数 ,所以只有增大样本含量才能降低样本平均数 的抽样误差。 x x = =n nX XX XxxX XX X 注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于: 样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1 ,x2 ,xn,变 异 程 度大小的一个指标,它的大小说明了 对 该

6、 样本代表性的强弱。 样本标准误是样本平均数 , , 的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。X X1x2xkx 对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 S,用以说明所考察性状或指标的优良性与稳定性。 对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 , 用 以表示 所考察性状或指标的优良性与 抽样误差的大小。 X XX XxX XX Xx3、若原分布为正态分布,平均数分布亦为正态、若原分布为正态分布,平均数分布亦为正态分布。分布。若原分布是非正态分布,当若原分布是非正态分布,当n增大时,平均数分增大时,平均数分布亦趋

7、向正态分布。布亦趋向正态分布。所以所以n30时,可以认为新分布符合正态分布。时,可以认为新分布符合正态分布。例例3-4,某品种葡萄总体,果穗长,某品种葡萄总体,果穗长=30cm,=10.8cm, 随机抽随机抽50个果穗,个果穗,所得样本平均数与所得样本平均数与相差不超过相差不超过3cm的概率是多少?的概率是多少?解:已知解:已知U= 查附表查附表3得得UUUU 以上做法对不对以上做法对不对 不对不对!分析:已知分析:已知、,求,求 | -|3cm的概率,求样本平均数的信息,算的概率,求样本平均数的信息,算U值须用值须用 ,上面的解答错用,上面的解答错用 。x -x -3 3= = 0 0. .

8、2 28 81 10 0. .8 8?x正确做法正确做法:从样本均数分布规律入手从样本均数分布规律入手样本均数分布样本均数分布解:解: U=UUUU x x = =, ,x x = =n nx53. 1508 .10 x xx xx -x -3 3=1.96=1.961.531.53若题目改为某葡萄品种总体,果穗长若题目改为某葡萄品种总体,果穗长=30cm,=10.8cm,若从其中抽取,若从其中抽取50个穗,个穗,问问50 穗中,长度与穗中,长度与相相差不超过差不超过3cm的果穗共有多少穗?的果穗共有多少穗?解:解:U= P=0.22=22%500.22=11(穂)(穂)x-x-= 0.28=

9、 0.28例例3-5 某枇杷单果重某枇杷单果重=30g, =9.6g, 今从今从中抽取中抽取5050个个分析:已知总体分布分析:已知总体分布=30,=9.6, 问问解:解:的概率是多少?的概率是多少?x x9 9. .5 5 = = = =1 1. .3 36 6n n5 50 0 x xx x - -2 29 9- -3 30 01 1U U = = = = = 0 0. .7 74 41 1. .3 36 61 1. .3 36 6x29g的概率的概率P?样本中样本中果,其平均单果重果,其平均单果重x29g查附表查附表3得两尾概率得两尾概率0.46,那么单尾概率,那么单尾概率=0.46/2

10、=0.23,所所以平均单果重小于等于以平均单果重小于等于29g的概率为的概率为0.23。若将是题目改成:某枇杷品种平均单果重若将是题目改成:某枇杷品种平均单果重=30g,=9.6g,问单果重小于问单果重小于29g的概率是多少的概率是多少?解:解:U=P(29X1), (df2) (4-27) t分布密度曲线如图4-13 所示,其特点是: 212)1()2/(2/)1(1)(dfdftdfdfdftf)2/(dfdft图4-13 不同自由度的t分布密度曲线 1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大

11、值。 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t 分布与标准正态分布完全一致。 t分布的概率分布函数为: (4-28) 因而t在区间(t1,+)取值的概率右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-,-t1)取值的概率也为1-F t (df)。 于是 t 分布 曲线 下由-到- t 1和由t 1到+ 两 个 相 等 的 概 率 之和两尾概率为2(1-F t (df)。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表4,即t分布表。 1)()(1)(tdftdttfttPF 例如,当df=15时,查附表4得两尾概率等于0.05的临界t值为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论