lec11正态分布样本分布ppt课件_第1页
lec11正态分布样本分布ppt课件_第2页
lec11正态分布样本分布ppt课件_第3页
lec11正态分布样本分布ppt课件_第4页
lec11正态分布样本分布ppt课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态分布样本分布第十一讲:大纲 正态分布 性质、计算与运用 样本分布 总体与样本 参数、样本统计量与估计 样本分布及其察看:正态分布 统计学中最常用、最重要的分布均值均值 Mean中位数中位数 Median众数众数 ModeXf(X):正态分布发现的历史 对正态分布的认识始于对丈量误差的研讨,因此最初被称为 “law of errors 几个重要人物 Abraham De Moivre 1667-1754 1733年私下里出版了一本小册子,Doctrine of Chance。他第一次提到,独立的离散随机变量可以近似地用一个指数函数来描画 Marquis de Laplace 1749-182

2、7 长期对丈量误差的性态进展研讨,他证明了,几乎一切独立同分布的随机变量都会随着样本的添加迅速收敛于一个指数分布,即正态分布: Carl Friedrich Gauss 1777-1855 正态分布也被称为“高斯分布。高斯在1809年第一个建立了两参数的指数函数,来描画天文观测中的误差分布 1924年,英国统计学家Karl Pearson 偶尔发现,De Moivre在1733年就曾经写出了正态分布的概率密度的数学表达式:外形特点 钟型,对称 正态分布的曲线是钟形,故有时又称为“钟形曲线,它反映了这样一种极普通的情况:天下形形色色的事物中,“两头小,中间大的居多,如人的身高,太高太矮的都不多,

3、而居于中间者占多数 均值=中位数=众数 随机变量值域无限 :正态分布与颐和园玉带桥 它们的外形极其相像05级经济学系刘振楠提供的拟合结果蓝色的曲线为一条正态分布曲线:正态分布的重要性 正态分布在数理统计学中占有极重要的位置 描画许多随机的活动和延续景象 统计推断根底 现今仍在常用的许多统计方法,就是建立在“所研讨的量具有或近似地具有正态分布这个假定的根底上,而阅历和实际概率论中“中心极限定理都阐明这个假定的现实性 现实世界许多景象看来是杂乱无章的,如不同的人有不同的身高、体重。大批消费的产品,其质量目的各有差别。看来毫无规那么,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种次序存在:正

4、态分布概率密度函数与概率 密度函数 p = 3.14159; e = 2.71828 s =总体的规范差 m = 总体均值 x 的定义域为(, + ) 正态分布的概率: 22)(2121)(xexfdcdxxfdXcP)()(cdXf(X):正态分布概率密度曲线 C A B :概率密度曲线的性质 图形以直线x = 为对称轴呈钟形对称曲线,并且f (x)在x = 处到达最大值 在x = 处有拐点 当x 时,曲线以x轴为渐进线 参数m 和s 变化对分布图形的影响 假设 固定,改动 的值,那么f (x)的图形沿着x轴平行挪动,但不改动外形 假设 固定, 大时,曲线平缓, 小时,曲线峻峭 f (x)图

5、形的外形完全由 决议,而位置完全由 决议21:正态分布的规范化 普通正态分布:XN(m ,s2) 记它的密度函数和分布函数为f(x)和F(x) 正态分布:ZN(1 ,0) 记它的密度函数和分布函数为f(x)和F(x) 普通正态分布与规范正态分布的关系: Z = 0 z = 1Z正正态态分分布布标标准准正正态态分分布布X XZ) 1 , 0( NXZ:例如Z Z= 0 Z= 1.12标标准准化化示示例例正正态态分分布布标标准准正正态态分分布布X = 5 = 106.212.01052.6XZ:证明 对于XN(m ,s 2),有 令 ,那么有 即221()21Pr()2xbaaXbedxzx212

6、1Pr()( )( )()()2bzabaaXbF bF aedz Pr()Pr(), (0,1)abXaXbZZN:运用Excel计算正态分布的概率 正态分布函数NORMDIST 用于计算给定均值和规范差的正态分布的累积函数 语法构造为:NORMDIST(x, mean, standard_dev, cumulative) cumulative 为 能否前往累积分布函数 规范正态分布函数 NORMSDIST 用于计算规范正态分布的累积函数,该分布的均值为 0,规范差为 1 语法构造为:NORMSDIST(z): 。 其中:z为需求计算其分布的数值。 :续 正态分布函数的反函数:NORMINV

7、 根据知概率等参数确定正态分布随机变量值。 其语法构造为:NORMINV(probability, mean, standard_dev) 规范正态分布函数的反函数NORMSINV 根据概率确定规范正态分布随机变量的取值。 其语法构造为:NORMSINV(probability):练习 设ZN(1 ,0) ,求 Pr(Z -0.09) Pr(|Z|1.96) Pr(2.15 Z 6.7) 设XN(1, 4),求 P (0 X 1.6) 知XN(2 ,s 2),且 P( 2 X 4 ) = 0.3,求 P ( X 0 ) 自学查正态分布表:例:知分布求概率 一种自动包装机向袋中装糖果,规范是每袋

8、64g。但因随机误差,每袋的详细分量有动摇,根据以往的资料显示,一袋糖果的分量服从均值为64g,规范差为1.5g的正态分布。问随机抽出一袋糖果,其分量超越65g的概率为多少? 分量缺乏62g的概率为多少?:例:知概率求x值 某企业对消费中某关键工序调查后发现,工人们完成该工序的时间以分钟计近似服从正态分布N(20, 32)。问: 从该工序消费工人中任选一人,其完成该工序时间少于17分钟的概率是多少? 要求以95%的概率保证该工序消费时间不多于25分钟,这一要求能否满足? 为鼓励先进,拟奖励该工序消费时间用得最少的10%的工人,奖励规范应定在什么时间范围内?:例 假设某种汽车电池的寿命服从正态分

9、布,平均数为800天,规范差为100天。现随机抽取一个汽车电池,其寿命小于500天的概率有多大?大于1000天的概率有多大?介于700天至900天的概率有多大?假设该公司想制定一个保质期,在保质期内可以免费改换电池,公司最多可以承当1%的免费改换,保质期应该定在多长?:样本分布 总体与样本 参数、样本统计量与估计 样本分布及其察看:什么是总体 描画统计中的总体定义 被察看对象的全体,我们所感兴趣的全体 总体分布 表征总体的分组变量的次数分布,与总体均值、方差联络在一同 例:某班学生按性别分组按性别分组人数(频数) 人数比重(频率)%男生3060女生2040合计50100:用随机变量表示总体 如

10、今我们从班上恣意抽取一名学生,令随机变量X 表示该名学生的性别,有 随机变量X 的概率分布于是为: 发现:随机变量X 的概率分布与它所对应的总体的次数分布完全一致12X该学生为男生该学生为女生X12pi0.60.4:概率分布与总体分布 我们可以用一个随机变量来表示一个总体,这个随机变量的概率分布就是该总体分布总体分布表征总体的随机变量X的概率分布分布频率概率均值期望方差方差:样本 从总体中按照随机原那么抽出的个体组成的小群体 设X1, X2, Xn是一组相互独立与X具有一样分布的随机变量,称(X1, X2, Xn)为来自总体X的简单随机样本,简称样本,n为样本容量 X1, X2, Xn为样本单

11、位或样本点 样本察看值或察看结果(x1, x2, xn)称为样本值:总体与样本 我们可以用一个随机变量X来描画一个总体 由于它们具有一样的概率分布 以及一样的数字特征,如期望和方差 我们可以用一组相互独立与总体X具有一样分布的随机变量(X1, X2, Xn)来描画一个样本 按照随机原那么从总体X中抽取的每一个样本点一定与总体X具有一样分布:参数、样本统计量与估计 参数:与总体有关的数字特征 总体的均值m 与方差s 总体原点距、中心距等 样本统计量:根据样本值构造出的一些特定的量,是样本的函数,用它对总体参数进展估计时,又称作估计量 样本均值 = ,用来估计m; 样本方差 = ,用来估计s2 样

12、本矩用于估计总体矩X2211()1niiSXXn:样本分布 样本分布 样本统计量的概率分布 样本统计量是随样本不同而变化的量,是随机变量,有一定的概率分布。 例:知一个盒子里放了8个球,每个球的分量分别为1g,2g,8g。现从中简单随机即放回反复抽取抽取2个球,求样本平均分量 的概率分布。:两个球的平均重量第二个球的重量12345678第一个球的重量111.522.533.544.521.522.533.544.55322.533.544.555.542.533.544.555.56533.544.555.566.563.544.555.566.57744.555.566.577.584.55

13、5.566.577.58:Xbar的概率分布64/18/18/1) 1() 1() 1(21XPXPXP64/22)8/18/1 () 1()2()2() 1()5 . 1(2121XPXPXPXPXPX11.522.533.544.5p1/64 2/64 3/64 4/64 5/64 6/64 7/64 8/6455.566.577.58p7/64 6/64 5/64 4/64 3/64 2/64 1/64X:总体与样本均值分布图0.0000.0250.0500.0750.1000.1250体分布图总体分布图0.0000.0200.0400.0600.0800.10

14、00.1200.140样本均值分布样本均值分布n = 2n = 3:样本均值分布的性质 样本均值的期望等总体均值: 由于来自总体的简单随机样本X1, X2, , Xn相互独立,并与总体具有一样的分布,那么 所以有 样本均值的方差等于总体方差除以样本容量 含义:样本容量越大,样本均值越稳定)(XE()iE X111()()()nniiiiE XEXEXnnnn 2222111()()()nniiiiD XDXDXnnnnn :正态总体样本均值分布的性质 假设总体服从正态分布XN(m,s 2),那么其样本均值Xbar,服从参数为(m,s 2/n) 的正态分布,即: 并有2( ,/ )XNn (0,

15、1)/XZNn:样本均值性质的Excel模拟 模拟工具:随机数发生器 从均值为3,规范差为5的正态总体中分别抽取样本容量为4,10,40的样本,每种样本容量的抽取各反复2000次 察看不同样本容量下的样本均值的描画统计结果 样本均值 样本方差:Xbar的描画统计结果样本容量n41040均值2.987733 3.038573标准误差 这里的n为2550.054672 0.035098中值3.020192 3.075469模式#N/A#N/A标准偏差S2.444986 1.569619方差5.977957 2.463705峰值0.215253 -0.08111偏斜度0.005460.000619区

16、域19.95369 10.13068最小值-6.21058 -1.94074最大值13.74311 8.189938/Sn:例 股市中随机选取16支股票。假定该日股市动摇幅度服从以均值为1.5,规范差为2的正态分布。试问所选取的16支股票的平均价钱上涨的概率是多少? 令 为16支股票的平均动摇幅度 那么 =1- normdist( 0, 1.5%, 0.5%, true) = 99.87%, 所选取的16支股票的平均价钱上涨的概率是99.87%X)0(XP)16/2 , 5 . 1 (2NX:Stata模拟 从l=3的指数分布总体中分别抽取样本容量为4,25,400的样本,每种样本容量的抽取各

17、反复20000次 prog simu rndexp 4 3 /rnd用于生成各种分布中的随机数 qui sum xe /rndexp产生的随机数记作xe end simulate simu m=r(mean), reps(20000) hist m,normal:分布图0123y012345x0.2.4.6.8Density123456r(mean)0.1.2.3Density051015r(mean)0.511.5Density22.533.544.5r(mean)l3的均匀分布总体n=4的样本均值分布n=25的样本均值分布n=100的样本均值分布:作业1 5.12 5.13 设由自动线加工的某种零件的内径 X (mm) N ( ,1)。知销售每个零件的利润T (元)与销售零件的内径 X 有如下的关系: 问平均直径 为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论