第五章抽样分布ppt课件_第1页
第五章抽样分布ppt课件_第2页
第五章抽样分布ppt课件_第3页
第五章抽样分布ppt课件_第4页
第五章抽样分布ppt课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学-从典型案例到问题和思想 经济管理类“十三五规划教材主讲人:朱芳芳. 典型案例【6】 第一节 抽样分布根本概念 第二节 几个常见的抽样分布 第五章 抽样分布.【典型案例6】如何决议能否购买一批苹果? 俗话说“一日一苹果,医生远离我。假设如今面对一批苹果,人们如何了解它们口感的均值和差别值,以便作出能否购买这批苹果的更好决策呢? 众所周之,不能够经过将一切的苹果都咬一口品味来处理这个问题,由于这样做苹果就全部报废了,对买卖双方都毫无益处!人们常用作法:从这批苹果中随机挑出几个品味后,得出这几个苹果口感的均.值和差别值,以此作为这批苹果口感的均值和差别值,从而作出能否购买这批苹果的更好决策。

2、从统计学角度来讲,挑出的这几个苹果口感的均值和差别值就是样本平均数 和样本方差 ,这批苹果口感的均值和差别值是总体平均数 和总体方差 。【典型案例6】如何决议能否购买一批苹果? 这种用商质量量数据的样本平均数 、样本方差 作为总体平均数 、总体方差. 的作法,是人们购买商品时常用的有效估计方法,其实际根据是本章将要学习的内容。【典型案例6】如何决议能否购买一批苹果?.第一节 抽样分布根本概念一、样本容量和样本个数 二、参数和统计量三、抽样分布四、抽样分布的数字特征. 总体是研讨的一切个体构成的集合,其中的个体的数目常用 表示。 从中随机抽取部分个体构成一个样本,构成样本的个体的数目,常用 表示

3、,称为样本容量,也称样本量。 例如,典型案例6中,一批苹果有400个,从中抽取8个进展品味,那么 ,而 。显然,从中可以得到很多个样本。 从一个含有N个个体的总体中,随机第一节 抽样分布根本概念.抽取样本容量为n的样本,可得到很多个样本,此即样本的个数。例如,从一个含有5个个体的总体中,随机抽取样本容量为2的样本假设采取反复抽样方式,那么可以得到52=25个样本。 典型案例6中,将400个苹果编号,那么随机抽取的样本能够是由编号为18的这8个苹果构成,也能够是由编号为101108的8个苹果构成等等。第一节 抽样分布根本概念. 参数是用来描画总体数量特征的,如总体均值 、总体比例 、总体方差 等

4、; 统计量是用来描画样本数量特征的,是由样本构造的函数,如样本均值 、样本比例 、样本方差 等。 由于总体是独一的、固定不变的,故参数往往是一个未知的常数;而样本不唯一,且一旦抽取出来,就成为知,故统计量是随机变量,其取值随着样本的变化第一节 抽样分布根本概念.而改动。 抽样的目的就是要根据样本统计量去估计或推断总体参数。 比如,常用样本均值 去推断总体均值 、用样本比例 去推断总体比例 、用样本方差 去推断总体方差 。 以上做法的实际根据就是样本统计量的抽样分布。第一节 抽样分布根本概念. 统计量是随机变量。抽样分布就是统计量的概率分布。 如样本均值的概率分布、样本比例的概率分布、样本方差的

5、概率分布等都称为抽样分布。 以下将以样本均值为例阐明统计量的抽样分布。第一节 抽样分布根本概念. 【例5-1】设有一个总体,含有5个个体:10、20、30、40、50,即 。采取反复抽样的方式从中抽取样本容量为2的样本,即 。 试写出样本均值 的抽样分布。 解:由于 =5, =2,从总体中采取重复抽样的方式抽取样本,那么样本共有 =52=25个。计算出这25个样本的均值 ,其结果如表5-1所示。第一节 抽样分布根本概念.样本序号样本个体样本均值样本均值的概率110,1010125210,2015225310,3020325410,4025425510,5030525620,1015720,20

6、20820,3025920,40301020,50354251130,10201230,2025表5-1 n=2时样本均值的抽样及其取值情况样本序号样本个体样本均值样本均值的概率1330,30301430,40351530,50403251640,10251740,20301840,30351940,40402040,50452252150,10302250,20352350,30402450,40452550,5050125.表5-2 =2时样本均值 的抽样分布从而,样本均值 的概率分布如表5-2所示。第一节 抽样分布根本概念. 在例5-1中,假设样本容量n=4,那么样本共有 =54=625

7、个,并且例5-1中的总体是一个非常小的总体,现实世界中,我们面对的总体往往很大,进而样本数目将很可观,不能够将一切的样本都抽取出来。 因此抽样分布本质上是一种实际分布。它能够是准确的某知分布,也能够是以某知分布为极限的极限分布。第一节 抽样分布根本概念. 抽样分布实际在推断统计中具有重要的作用,它是后续参数估计和假设检验的实际根据和根底。第一节 抽样分布根本概念.在例5-1中,样本均值的平均数总体均值 样本均值的方差 总体方差 由于n =2,从而验证了5.1的正确性。第一节 抽样分布根本概念. 由式5.1可知: 的平均数为 ,方差为 。随着 的增大,其方差越来越小,从而 的取值越来越向着 靠拢

8、,故用 去估计 实际根据成立。 由此可见,典型案例6中,人们用挑选出的几个苹果口感的均值去估计这批苹果口感的均值的做法是站得住脚的。第一节 抽样分布根本概念. 以上结论均建立在反复抽样情形下,假设是在反复抽样情形下,方差需求用系数 进展修正,从而样本均值的数字特征为:5.2可见:用 去估计 实际根据同样成立。第一节 抽样分布根本概念. 比例:总体或样本中具有某种属性的个体数与全部个体数之比,总体比例记为 。 现有 ,采取反复抽样的方式从中抽取独立同分布的样本: , 。样本中变量值1出现次数记为 ,那么变量值1出现次数所占的比例为 ,即 为样本比例。二样本比例的数字特征第一节 抽样分布根本概念.

9、 根据数学期望和方差的性质,可推出样本比例 的数学期望、方差与总体的平均数、方差之间的关系:5.3 由式5.3可知: 的平均数为总体比例 ,方差为 。随着 的增大,方差越来越小,从而 的取值越来越向 靠拢,故用 去估计 实际根据成立。第一节 抽样分布根本概念. 以上结论均建立在反复抽样情形下,假设是在不反复抽样情形下,当样本容量很大时,方差需求用系数进展修正,从而样本比例的数字特征为:5.4可见:用 去估计 实际根据同样成立。第一节 抽样分布根本概念. 设总体 的方差为 ,采取反复抽样的方式,从中抽取独立同分布的样本: , , 。根据数学期望和方差的性质,可推出样本方差的数学期望、方差与总体的

10、方差之间的关系为:5.5三样本方差的数字特征第一节 抽样分布根本概念. 由式(5.5)可知:样本方差的平均数为 ,方差为 ,随着 的增大,其方差越来越小,从而 的取值越来越向着 靠拢,故用 去估计 实际根据成立。 由此可见,典型案例6中,人们用挑选出的几个苹果口感的差别值去估计这批苹果口感的差别值的做法是站得住脚的。第一节 抽样分布根本概念. 以上结论均建立在反复抽样情形下,假设是在不反复抽样情形下,方差需求用系数进展修正,从而样本方差的数字特征为:5.6可见:用 去估计 实际根据同样成立。第一节 抽样分布根本概念. 统计量抽样分布的规范差,称为统计量的规范误,也称规范误差。 规范误可用于阐明

11、抽样误差的大小。抽样误差是指由抽样的随机性引起的样本结果与总体的真实值之间的差别,它描画的是一切样本能够的结果与总体真值之间的平均性差别。假设总体规范差未知,可用样本规范差替代,此时的规范误称为估计规范误。四规范误第一节 抽样分布根本概念. 样本比例的规范误为 。当总体比例 未知时,可用样本比例替代,此时得到的规范误称为估计规范误。 样本方差的规范误为 。当总体规范差未知时,可用样本规范差替代,此时得到的规范误称为估计规范误。 样本均值的规范误为 。当总体规范差未知时,可用样本规范差替代,此时得到的规范误称为估计规范误。第一节 抽样分布根本概念.一、样本均值的抽样分布二、样本比例的抽样分布三、

12、样本方差的抽样分布四、t分布和F分布第二节 几个常见的抽样分布. 抽样分布即统计量的概率分布。本节将分别对样本均值、样本比例以及样本方差的抽样分布作详细的讨论。 如无特别阐明,本章中的抽样方式均指反复抽样。第二节 几个常见的抽样分布. 样本均值的抽样分布,就是采取反复抽样的方式,选取容量为 的一切样本,由样本均值一切能够的取值构成的概率分布。它是推断总体均值 的实际根底。 以下分两种情况来讨论样本均值 的抽样分布类型。第二节 几个常见的抽样分布.正态分布:假设 的概率密度函数为 5.7图5-1 正态分布概率密度函数图其中, 和 都是常数,且 ,那么称 服从参数为 和 的正态分布,记作 。其概率

13、密度函数图像见图5-1。第二节 几个常见的抽样分布. 特别地,当参数 =0, =1时,这样的正态分布为规范正态分布,记为 ,其概率密度函数为:第二节 几个常见的抽样分布. 正态分布的再生定理:假设总体变量 ,从这个总体中抽取容量为 的样本,那么样本均值 。 一总体服从正态分布第二节 几个常见的抽样分布. 独立同分布中心极限定理阐明:无论总体服从何种分布,只需其平均数和方差存在,那么从中抽取的独立同分布样本 , ,其均值在当 很大时,就会近似服从正态分布 。 实践运用中,普通取 ,此时的样本称为大样本。假设为小样本,且总体分布不是正态分布,此时不能按照正态分布来处置,要运用小样本的相关实际来讨论

14、。 第二节 几个常见的抽样分布.图5-2 样本均值的抽样分布图大样本小样本正态分布非正态分布总体 非正态分布正态分布第二节 几个常见的抽样分布. 根据本章第一节,在不反复抽样情形下,样本均值的抽样分布为:5.8第二节 几个常见的抽样分布. 【例5-2】假设在一个饭店门口等待出租车的时间是服从左偏分布的,均值为12分钟,规范差为3分钟。现从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,调查100名顾客的平均等待时间的抽样分布。第二节 几个常见的抽样分布. 解:依题意,总体均值 =12, =3,根据中心极限定理可知:样本均值100名顾客的平均等待时间的抽样分布为:第二节 几个常见的抽样分

15、布,即 。. 【例5-3】人口普查发现,某地域成年男子的身高服从正态分布N(175, 62),采取反复抽样的方式从该地域抽取64名成年男子构成样本,求样本均值的平均数和方差。 解:依题意,总体服从正态分布,且 =175, =62。根据正态分布的再生定理,样本均值 ,即样本均值的平均数 =175,样本均值的方差 。第二节 几个常见的抽样分布. 样本比例 的抽样分布,就是采取重复抽样的方式,选取容量为 的一切样本,由样本比例 的一切能够的取值构成的概率分布。它是推断总体比例 的实际根底。第二节 几个常见的抽样分布. 可以看到,样本比例是一种特殊的样本均值。从而,根据样本均值的抽样分布实际可得样本比

16、例的抽样分布。 普通地,假设能同时满足 和 ,就可以以为样本容量很大。 样本比例 的抽样分布为:在满足条件的情况下,即当样本容量很大时5.9第二节 几个常见的抽样分布. 在不反复抽样情形下,当样本容量很大时,样本比例的抽样分布为:5.10 阐明:在不反复抽样情形下,对于无限总体也可以按反复抽样来处置,即方差不用修正;对于有限总体,要用修正系数修正,另外,假设此时 很大而抽样比 时,修正系数趋于1,方差可以按反复抽样情形时即不用修正的公式计算。第二节 几个常见的抽样分布. 样本方差 的抽样分布,就是采取重复抽样的方式,选取容量为 的一切样本,由样本方差 的一切能够的取值构成的概率分布。它是推断总

17、体方差 的实际根底。第二节 几个常见的抽样分布. 设总体的均值为 ,方差为 , , 为来自该总体的样本,那么样本方差 的抽样分布为:5.11称 服从自在度为 的 分布卡方分布。第二节 几个常见的抽样分布. 卡方分布:设 , 为来自于标准正态总体N0,1的样本,那么 服从自在度为 的 分布,记为 ,读作卡方分布。第二节 几个常见的抽样分布.图5-3 卡方分布的概率密度函数图第二节 几个常见的抽样分布.卡方分布的数字特征为: 假设 ,那么总体平均数 ,方差 。由卡方分布的数字特征,可得:5.12 在不反复抽样情形下,方差为 。第二节 几个常见的抽样分布.一 t分布 设 且 与 相互独立,那么称随机变量 服从自在度为 的t分布,记作 。第二节 几个常见的抽样分布.图5-4 分布的概率密度函数图第二节 几个常见的抽样分布. 分布概率密度函数曲线是以纵轴为对称轴的单峰对称图形,其与规范正态分布曲线类似, 分布曲线顶部略低,两尾部稍高而平。自在度 越大, 分布越趋近于规范正态分布,当 时, 分布与规范正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论