六西格玛之分析阶段 S8 43 中心极限定理ppt课件_第1页
六西格玛之分析阶段 S8 43 中心极限定理ppt课件_第2页
六西格玛之分析阶段 S8 43 中心极限定理ppt课件_第3页
六西格玛之分析阶段 S8 43 中心极限定理ppt课件_第4页
六西格玛之分析阶段 S8 43 中心极限定理ppt课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中心极限定理 ( Central Limit Theorem )DefineMeasureAnalyzeImproveControlStep 8- Data 分析Step 9- Vital Few X的选定 多变量研讨 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析Step 7- Data 搜集途径位置实际课 定义 中心极限定理的运用 1. 正态分布的例子 2. Chi-Square分布的例子 规范误差与样本大小的关系目 录定义中心极限定理是论述大量随机变量之和的极限分布是正态分布的一系列定理的总称。最常用的有:独立同分布中心极限定理: “随机变量x1,x2,独

2、立,且服从同一分布, 假设存在有限的数学期望E(xi)=u和方差D(xi)=2, 当n时,随机变量的总和xi趋于均值为nu,方差为n 2的正态分布。 即算术平均数1/n xi=xbar趋于均值为u,方差为2/n的正态分布不论总体服从何种分布,只需它的数学期望和方差存在, 从中抽取容量为n的样本,那么这个样本的总和或平均数是随机变量, 当n充分大时, xi或 xbar趋于正态分布。定义德莫佛-拉普拉斯中心极限定理: “假设用X表示n次独立实验中事件A发生(“胜利)的次数,P是事件A在每次实验中发生的概率,那么X服从二项分布,B(n,p), 当n时,X趋于均值为np,方差为npq的正态分布。 正态

3、分布和泊松分布都是二项分布的极限分布 当n足够大时, 可用正态分布近似计算; 当n足够大且p小时,可用泊松分布近似计算。中心极限定理是一种非常重要的景象,它是统计学中运用的许多方法的实际根底的组成部分(如:计算样本均值的置信区间) 利用同样的数据画出两种不同的控制图,并仔细比较它们的差别: 翻开文件CENLIMIT.MTW .分别用下面的两个途径画出个体图和子群大小为5的均值图 个体图途径 均值图途径运用图形输出个体数据样本平均 仔细比较两个图上的控制上下线(UCL和LCL),有什么不同?运用个体控制图和 X bar控制图的差别15100102030405060运用平均值分布的规范偏向叫做 均

4、值规范误差 ,因此其定义为:这个公式阐明平均值比个体数据更稳定,稳定因子是样本数的平方根。sx=均值规范误差个体值的规范差n=平均值的样本数x均值的规范误差Standard Error of the Mean其中 我们经常依托从丈量系统中得到的一个数值来估计输入或输出变量的值。减小丈量系统误差的简易方法就是把两个或更多的读数平均。 我们的丈量系统的精细度自动添加,添加因子是平均值样本数的平方根,假设我们要想使丈量系统的误差减小一半,我们就需求把4次的丈量值平均才可以。实践运用丈量系统的改善当总体数据具备正态分布时中心极限定理了解例题模拟-1 假设他面前有一个大桶,桶里面装有相当多数量的白色纸条

5、,每张纸条上都写 有数字,且假定这些数字都来自一个具有特定平均值和规范偏向的正态分布. 1)从中随机抽出9张白色纸条,并把其上面的9个数字求平均, 2)然后把这个平均值写在一张绿色纸条上, 3)把这9张白色纸条放回原来的桶里, 4)把这张绿色纸条放入另外一个桶里, 如此反复上面的步骤,直到盛有绿色纸条的桶放满为止。白色纸条代表总体的数据;绿色纸条代表平均值的样本;我们用MINITAB来模拟做这个练习。让我们用MINITAB产生一些模拟的数据来验证我们的实际。首先用MINITAB产生9列各250个数据,假设这些数据来自一个 平均值=70、规范偏向=9的正态分布:那么列C1-C9 代表达色纸条然后

6、求出各行9个数据的平均值,其结果放在列C10,那么C10代表绿色纸条。我们用描画统计的方法求出各列数据的平均和规范偏向。仔细比较C1-C9列与C10列有什么差别?例题1 中心极限定理运用模拟1、用MINITAB随机产生样本数据分别输入以下信息2、样本平均数计算3、输出:产生10列数据留意:每次每个人操作产生的数据都不一样4、描画统计途径5、描画统计结果比较描画性统计: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均值变量 N N* 平均值 规范误 规范差 最小值 下四分位数 中位数 上四分位数C1 250 0 70.605 0.534 8.439 43.5

7、37 64.924 70.895 76.690C2 250 0 69.633 0.623 9.847 43.521 63.094 70.174 76.382C3 250 0 69.643 0.591 9.341 47.785 62.617 69.063 76.286C4 250 0 70.293 0.559 8.846 49.313 64.745 69.702 75.834C5 250 0 70.705 0.603 9.542 45.849 64.118 70.673 77.782C6 250 0 69.385 0.587 9.288 41.398 63.237 69.285 76.174C7

8、 250 0 70.228 0.543 8.585 48.888 64.444 70.587 75.767C8 250 0 69.852 0.592 9.357 41.977 63.096 69.826 77.060C9 250 0 70.126 0.568 8.988 48.100 64.023 69.871 75.867C10 250 0 70.052 0.185 2.930 61.501 68.167 70.479 72.1805、描画统计结果比较续描画性统计: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均值变量 N N* 平均值 规范误 规范差

9、最小值 下四分位数 中位数 上四分位数C1 250 0 70.605 0.534 8.439 43.537 64.924 70.895 76.690C2 250 0 69.633 0.623 9.847 43.521 63.094 70.174 76.382C3 250 0 69.643 0.591 9.341 47.785 62.617 69.063 76.286C4 250 0 70.293 0.559 8.846 49.313 64.745 69.702 75.834C5 250 0 70.705 0.603 9.542 45.849 64.118 70.673 77.782C6 250

10、 0 69.385 0.587 9.288 41.398 63.237 69.285 76.174C7 250 0 70.228 0.543 8.585 48.888 64.444 70.587 75.767C8 250 0 69.852 0.592 9.357 41.977 63.096 69.826 77.060C9 250 0 70.126 0.568 8.988 48.100 64.023 69.871 75.867C10 250 0 70.052 0.185 2.930 61.501 68.167 70.479 72.180如今开场比较。样本的分布(C9)和样本平均的分布(C10)进

11、展比较。分布减少了很多. = 8.988 = 2.9306、直方图结果比较用点图比较频度数那么可以更明确的了解分布。7、点图结果比较样本平均值分布的平均值和总体的平均值非常接近;样本平均值分布的规范偏向等于总体的规范偏向除以样本数的平方根;样本平均值的分布非常接近正态分布。8、结论 当总体数据是非正态分布时,假设从中随机抽样n个并计算其平均, 同样如此反复假设干次,然后比较这些平均的分布与这些个体值的 分布,他会发现,当n时,x-bar的分布也具有正态分布。 为了验证,我们在非正态分布中随机选择一个偏移较大的分布- “Chi-Square分布,求其x-bar来领会一下中心极限定理。 当总体数据

12、不具备正态分布时中心极限定理了解例题模拟-21、用卡方分布随机产生9列,每列各有250个数据2、用产生的数据进展点图描画和正态检验 在这里看到,这是一个很偏移的分布,我们用它来验证中心极限定理C10 项是对 C1C9 的平均值的数据统计,同样样本大小为 9,其分布明显变得小多了。描画性统计: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 平均值变量 N N* 平均值 规范误 规范差 最小值 下四分位数 中位数 上四分位数C1 250 0 1.917 0.122 1.932 0.002 0.543 1.252 2.602C2 250 0 2.038 0.112

13、1.768 0.003 0.602 1.453 3.068C3 250 0 2.072 0.130 2.050 0.009 0.558 1.402 2.853C4 250 0 2.005 0. 2.204 0.002 0.551 1.327 2.875C5 250 0 1.854 0.109 1.726 0.009 0.534 1.283 2.595C6 250 0 1.954 0.129 2.039 0.003 0.477 1.347 2.743C7 250 0 1.965 0.122 1.935 0.011 0.516 1.412 2.759C8 250 0 2.074 0. 2.178 0.011 0.597 1.379 2.755C9 250 0 2.008 0. 2.149 0.022 0.599 1.283 2.680C10 250

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论