《应用统计cha》ppt课件_第1页
《应用统计cha》ppt课件_第2页
《应用统计cha》ppt课件_第3页
《应用统计cha》ppt课件_第4页
《应用统计cha》ppt课件_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计应用统计第六章:抽样与抽样分布第六章:抽样与抽样分布第第 6 章章 统计量及其抽样分布统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.6 两个样本平均值之差的分布两个样本平均值之差的分布6.7 关于样本方差的分布关于样本方差的分布 6.1 统计量统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充

2、分统计量常用的总体参数常用的总体参数 总体参数总体参数 总体平均值总体平均值 总体方差总体方差 总体规范差总体规范差 总体比率总体比率iXN 2211NiiXN 211NiiXN 统计量统计量(statistic)设设X1,X2,Xn是从总体是从总体X中抽取的容量为中抽取的容量为n的一个样本,假设由此样本构造一个函数的一个样本,假设由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,不依赖于任何未知参数,那么称函数那么称函数T(X1,X2,Xn)是一个统计量是一个统计量样本均值、样本比例、样本方差等都是统样本均值、样本比例、样本方差等都是统计量计量统计量是样本的一个函数统计量是样

3、本的一个函数统计量是统计推断的根底统计量是统计推断的根底常用统计量常用统计量 样本统计量样本统计量 样本平均值样本平均值 样本方差样本方差 样本规范差样本规范差 样本比率样本比率iXXn 22111niiSXXn 2111niiSXXn p常用统计量常用统计量 样本统计量样本统计量 样本变异系数样本变异系数 样本样本k阶矩阶矩 样本样本k阶中心矩阶中心矩SVX 11knkiimXXn 11nkkiimXn 常用统计量常用统计量 样本统计量样本统计量 样本偏度系数样本偏度系数 样本峰度系数样本峰度系数3133 221()()niiniinXXXX 414221()3()niiniinXXXX 次

4、序统计量次序统计量一组样本观测值一组样本观测值X1,X2,Xn由小到大的排由小到大的排序序 X1X2 Xi Xn 后,称后,称X1,X2,Xn为次序统计量为次序统计量 中位数、分位数、四分位数等都是次序统中位数、分位数、四分位数等都是次序统计量计量充分统计量充分统计量统计量加工过程中一点信息都不损失的统统计量加工过程中一点信息都不损失的统计量通常称为充分统计量计量通常称为充分统计量【例】某电子元件厂欲了解其某产品的不合格率【例】某电子元件厂欲了解其某产品的不合格率p,质,质检员抽检了检员抽检了100个电子元件,检查结果是,除前个电子元件,检查结果是,除前3个是个是不合格品记为不合格品记为X1=

5、1, X2=1, X3=1 ,其他都是合格品其他都是合格品记为记为Xi0,i4,5,,100。当企业指点问及抽。当企业指点问及抽检结果时,质检员给出如下两种回答:检结果时,质检员给出如下两种回答:1抽检的抽检的100个元件中有个元件中有3个不合格记为个不合格记为 2抽检的抽检的100个元件中前个元件中前3个不合格个不合格 X1=1, X2=1, X3=1 10013iiX 6.2 关于分布的几个概念关于分布的几个概念6.2.1 抽样分布抽样分布6.2.2 渐进分布渐进分布6.2.3 随机模拟获得的近似分布随机模拟获得的近似分布 6.2.1三种不同性质的分布三种不同性质的分布 总体分布总体分布

6、样本分布样本分布 抽样分布抽样分布总体分布总体分布(population distribution)总体中各元素的察看值所构成的分布总体中各元素的察看值所构成的分布 分布通常是未知的分布通常是未知的可以假定它服从某种分布可以假定它服从某种分布 样本分布样本分布(sample distribution)一个样本中各察看值的分布一个样本中各察看值的分布 也称阅历分布也称阅历分布 当样本容量当样本容量n n逐渐增大时,样本分布逐渐逐渐增大时,样本分布逐渐接近总体的分布接近总体的分布 抽样分布抽样分布 (sampling distribution)样本统计量的概率分布,是一种实际分布样本统计量的概率分

7、布,是一种实际分布在反复选取容量为在反复选取容量为n的样本时,由该统计量的一的样本时,由该统计量的一切能够取值构成的相对频数分布切能够取值构成的相对频数分布 样本统计量是随机变量样本统计量是随机变量样本均值样本均值, 样本比例,样本方差等样本比例,样本方差等结果来自容量一样的一切能够样本结果来自容量一样的一切能够样本提供了样本统计量长久而稳定的信息,是进展提供了样本统计量长久而稳定的信息,是进展推断的实际根底,也是抽样推断科学性的重要推断的实际根底,也是抽样推断科学性的重要根据根据 抽样分布的构成过程抽样分布的构成过程 (sampling distribution)6.2.2渐近分布渐近分布样

8、本统计量的极限分布常称为渐近分布样本统计量的极限分布常称为渐近分布6.2.3随机模拟获得的近似分布随机模拟获得的近似分布利用计算机运用随机模拟方法获得统计量利用计算机运用随机模拟方法获得统计量的近似分布的近似分布6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布6.3.1 2分布分布6.3.2 t 分布分布6.3.3 F 分布分布 2 分布分布由阿贝由阿贝(Abbe) 于于1863年首先给出,后来由海尔墨特年首先给出,后来由海尔墨特(Hermert)和卡和卡皮尔逊皮尔逊(KPearson) 分别于分别于1875年和年和1900年推导出来年推导出来设设 ,那么,那么令令 ,那么,那

9、么 Y 服从自在度为服从自在度为1的的2分布,即分布,即当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,那么的样本,那么 2分布分布( 2 distribution)2( ,)XN (0,1)XzN 2Yz 2(1)Y 2( ,)XN 2212()(1)niixxn 分布的变量值一直为正分布的变量值一直为正 分布的外形取决于其自在度分布的外形取决于其自在度n的大小,通常为不的大小,通常为不对称的正偏分布,但随着自在度的增大逐渐趋对称的正偏分布,但随着自在度的增大逐渐趋于对称于对称 期望为:期望为:E(2)=n,方差为:,方差为:D(2)=2n(n为自为自在度在度) 可加性:假设可加性:

10、假设U和和V为两个独立的为两个独立的2分布随机分布随机变量,变量,U2(n1),V2(n2),那么那么U+V这一随这一随机变量服从自在度为机变量服从自在度为n1+n2的的2分布分布 2分布分布(性质和特点性质和特点)22分布分布 图示图示 t 分布分布t分布分布 t-分布是由分布是由W.S.Gosset(1876-1937)于于1908年在一篇署名为年在一篇署名为“student的论文中的论文中初次提出,因此又称为初次提出,因此又称为“学生氏分布。学生氏分布。 设随机变量设随机变量X N(0,1), Y ,且,且X和和Y相互独立,那么随机变量相互独立,那么随机变量 的分的分布称为自在度为布称为

11、自在度为n的的t-分布,并记为分布,并记为T t(n)(2nnYXT t分布分布 t -分布分布 是一概率分布簇。是一概率分布簇。某一特定的某一特定的 t 分布依赖于参数分布依赖于参数n,称之为自称之为自在度。在度。随着自在度的添加,随着自在度的添加,t-分布与正态分布之间分布与正态分布之间的差距将会不断减小的差距将会不断减小(n30)。随着自在度的添加,随着自在度的添加,t-分布的离散程度也将分布的离散程度也将减小。减小。 t-分布的均值为分布的均值为0,方差为,方差为12nn t分布分布 t分布表的运用分布表的运用 (1)xtt nSn 【例】某银行向审计部门报告,其向企业发放的短期贷款中

12、,未归还的贷款额近似服从正态分布,平均值为8.5万元,规范差未知。现审计人员为了验证这个报告结果,随机抽取了25个工程进展检查,查得平均拖欠贷款额为7.6万元,规范差为1.6万元。审计人员所关怀的问题是,假设总体均值为8.5万元,那么能抽到的样本其平均值不超越7.6万元的概率有多大?例题分析例题分析解:由于总体规范差未知解:由于总体规范差未知 ,所以采用,所以采用t分布分布xtSn 其中,其中,n=25,自在度自在度n-1=247.68.5,(7.6)(2.8137)1.6/25tP xP t 则则t(7.6)0.005P x 查查 分分布布表表得得,0 0. . 0 00 02 25 5F

13、分布分布由统计学家费希尔由统计学家费希尔(R.A.Fisher) 提出的,以其姓提出的,以其姓氏的第一个字母来命名氏的第一个字母来命名设假设设假设U为服从自在度为为服从自在度为n1的的2分布,即分布,即U2(n1),V为服从自在度为为服从自在度为n2的的2分布,即分布,即V2(n2),且且U和和V相互独立,那么相互独立,那么 称称F为服从自在度为服从自在度n1和和n2的的F分布,记为分布,记为12(,)FF n nF分布分布(F distribution)12U nFV n F分布分布(F distribution)2(, ),(),222(2)(),4(2)(4)XF m nnE Xnnn

14、mnD Xnm nn 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理一个总体参数推断时样本一个总体参数推断时样本统计量的抽样分布统计量的抽样分布样本均值的抽样分布样本均值的抽样分布在反复选取容量为在反复选取容量为n的样本时,由样本均的样本时,由样本均值的一切能够取值构成的相对频数分布值的一切能够取值构成的相对频数分布一种实际概率分布一种实际概率分布推断总体均值推断总体均值的实际根底的实际根底样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)5 . 21NxNii25. 1)(122NxNii样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)3.53.02.52.

15、033.02.52.01.524.03.53.02.542.542.03211.51.01第二个察看值第一个察看值16个样本的均值x样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析例题分析)5 . 2x625. 02x 样本来自正态分布样本来自正态分布 【正态分布再生定理】:设【正态分布再生定理】:设 为一组随机变量,假设它们相互独立,而且为一组随机变量,假设它们相互独立,而且都服从正态分布都服从正态分布 ;那么服从正态;那么服从正态分布分布 。nxxx,21( ,)N x),(nnN【正态分布再生定理】:假设容量为n的随机样本抽自平均数为u方差为 的正态分布总体,那么

16、样本平均数 也服从正态分布,该分布的期望值为 ,方差为 。 2xu2xxx1xNnNnn 退退不不 退退当当N远远大于远远大于n时,即时,即时,也可将不退还抽样看作退还抽样。时,也可将不退还抽样看作退还抽样。11NnN(20 )Nn 其中其中 样本来自非正态总体样本来自非正态总体 【中心极限定理】设【中心极限定理】设 为一组随为一组随机变量,假设它们相互独立,而且具有一样机变量,假设它们相互独立,而且具有一样分布;期望分布;期望,方差方差 ;那;那么服从正态分布么服从正态分布 。nxxx,21)(ixE0)(2ixV),(nnNix 【注】对恣意分布形状的平均数为u,方差为 的总体进展随机抽样

17、,只需样本容量足够大 n30那么样本平均数抽样分布逼近期望值为 ,方差为 的正态分布22xxu其中x不退还抽样退还抽样1NnNnnx通常把通常把n30n30作为作为“n n很大的规范。样本容量很大的规范。样本容量n30n30称为大样本,否那么称为小样本。称为大样本,否那么称为小样本。中心极限定理中心极限定理【例】某类钢制产品的分量,经过多次衡量,获得【例】某类钢制产品的分量,经过多次衡量,获得有差别的一系列数据,这些数据近似的服从正态有差别的一系列数据,这些数据近似的服从正态分布,设平均值为分布,设平均值为2800公斤,方差为公斤,方差为9000公斤。公斤。现假定从该总体中抽出容量为现假定从该

18、总体中抽出容量为10的随机样本。问的随机样本。问这个样本的平均分量小于或等于这个样本的平均分量小于或等于2750公斤的概率公斤的概率为多大?为多大?90002800,10 xx(2750)27502800()900010(1.67)0.0475xxP xxPP Z 【例】从海外【例】从海外A地域、地域、B地域、和地域、和C地域到货了地域到货了3批大批大豆,分别为豆,分别为1000包、包、10000包和包和100000包,知包,知3批批大豆中平均每包分量都为大豆中平均每包分量都为100公斤公斤,规范差都是规范差都是4公公斤。现从每批中都按不反复抽样抽取样本容量斤。现从每批中都按不反复抽样抽取样本

19、容量n=500包的样本,来测定这包的样本,来测定这3批大豆的每包平均分批大豆的每包平均分量,要求分别标出样本平均分量短秤半公斤的概量,要求分别标出样本平均分量短秤半公斤的概率。率。解:从解:从A A地域大豆抽样的地域大豆抽样的4100050011000150045000.1266999500 xNnNn 从从B B地域大豆抽样的地域大豆抽样的4100005001100001500495000xNnNn 从从C C地域大豆抽样的地域大豆抽样的4100000500110000015004995000.178499999500 xNnNn 假设不作总体修正,那么假设不作总体

20、修正,那么40.1789500 xn A A地域地域99.5100(99.5)(3.95)0.126610.999950.00005P xP Z B B地域地域99.5100(99.5)(2.86)0.174410.99790.0021P xP Z C C地域地域99.5100(99.5)(2.80)0.178410.99740.0026P xP Z 抽样分布与总体分布的关系抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布未知时,样本均值的抽样分未知时,样本均值的抽样分布布xZn 总体是正态总体或非正态总体但样本量很大 未知,总体

21、是正态总体未知,总体是正态总体xtSn 2()1xxSn 未知,总体非正态总体且样未知,总体非正态总体且样本量很大本量很大xxtor ZSSnn 未知,总体非正态总体且样未知,总体非正态总体且样本量很小本量很小分布未知分布未知6.5 样本比例的抽样分布样本比例的抽样分布比例比例(proportion)总体总体(或样本或样本)中具有某种属性的单位与全中具有某种属性的单位与全部单位总数之比部单位总数之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品) 与全部产品总数之比与全部产品总数之比总体比例可表示为总体比例可表示为样本比例可表示为样本比例可表示为011N

22、NNN 或或011nnppnn 或或样本比例的抽样分布样本比例的抽样分布样本比例的数学期望样本比例的数学期望样本比例的规范差样本比例的规范差反复抽样反复抽样不反复抽样不反复抽样p(1)pn(1)1pnNnN样本比例的抽样分布样本比例的抽样分布3. 当样本容量很大,即当样本容量很大,即 时,时,由中心极限定理有:由中心极限定理有:(1)( ,),(1)N-n( ,),N-1pNnpNn 重重复复抽抽样样不不重重复复抽抽样样5(1) 5nn和样本比例的抽样分布样本比例的抽样分布例题分析例题分析【例】假定我们知办公室人员所填写的表格中有【例】假定我们知办公室人员所填写的表格中有5至少包括一处笔误。假

23、设我们检查一个由至少包括一处笔误。假设我们检查一个由475份表份表格组成的简单随机样本,其中至少含一处笔误的格组成的简单随机样本,其中至少含一处笔误的表格所占的比例在表格所占的比例在3和和7.5%之间的概率有多大?之间的概率有多大?例题分析例题分析解:由于解:由于n较大较大较小,较小,n23.55.所以可用正态近所以可用正态近似处置,以为样本比率的抽样分布服从正态分布似处置,以为样本比率的抽样分布服从正态分布0.05(10.05)0.05,475pp 其其中中,(3%7.5%)0.030.050.0750.05()0.05(10.05)0.05(10.05)4754750.971PpPZ 6.

24、6 两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个独立总体都为正态分布,即两个独立总体都为正态分布,即 , 两个样本均值之差两个样本均值之差 的抽样分布服从正态分的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差布,其分布的数学期望为两个总体均值之差方差为各自的方差之和方差为各自的方差之和 2111(,)XN 2222(,)XN 12xx 1212()E xx122221212xxnn 两个样本均值之差的抽样分布两个样本均值之差的抽样分布 总体总体1 总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算x1抽

25、取简单随机样抽取简单随机样样本容量样本容量 n2计算计算x2计算每一对样本计算每一对样本的的x1-x2一切能够样本一切能够样本的的x1-x21 1 22两个样本均值之差的抽样分布两个样本均值之差的抽样分布例题分析例题分析【例】一个市场分析人员研讨顾客在甲乙【例】一个市场分析人员研讨顾客在甲乙2个不同类个不同类型的食品杂货店中所破费的时间,他在每个商店型的食品杂货店中所破费的时间,他在每个商店中各察看了一个由中各察看了一个由75人组成的样本,发现商店甲人组成的样本,发现商店甲的顾客所破费的平均时间为的顾客所破费的平均时间为55分钟,商店乙的顾分钟,商店乙的顾客所花的平均时间为客所花的平均时间为49分钟。假定甲乙分钟。假定甲乙2个商店的个商店的顾客所破费平均时间的真值无差别,且规范差对顾客所破费平均时间的真值无差别,且规范差对每个总体来说都是每个总体来说都是15分钟,问察看到样本差大于分钟,问察看到样本差大于或等于或等于6分钟的概率有多大?分钟的概率有多大?两个样本均值之差的抽样分布两个样本均值之差的抽样分布例题分析例题分析解:两样本是相互独立,都服从正态分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论