




已阅读5页,还剩350页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计 对随机现象进行观测、试验,以取得有代表性的观测值 对已取得的观测值进行整理、分析 ,作出推断、决策 ,从而找出所研究的对象的规律性 数 理 统 计 的 分 类 描述统计学 推断统计学 第一节 基本概念 一、总体和个体 二、样本 简单随机样本 一、总体和个体 一个统计问题总有它明确的研究对象 . 研究某批灯泡的质量 研究对象的全体称为 总体 (母体 ), 组成总体的每个元素称为 个体 . 总体 然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项 (或几项 )数量指标和该数量指标在总体中的分布情况 . 这时,每个个体具有的数量指标的全体就是总体 . 某批 灯泡的寿命 该批灯泡寿命的全体就是总体 国产轿车每公里 的耗油量 国产轿车每公里耗油量的全体就是总体 所研究的对象的某个 (或某些 )数量指标的全体称为总体 ,它是一个随机变量 (或多维随机变量 ),记为 X . X 的分布函数和数字特征称为总体分布函数和总体数字特征 . 总体: 例如 :研究某批灯泡的寿命时,总体 其中每个灯泡的寿命就是个体。 每个 灯泡的寿命 个体 总体 国产轿车每公里 的耗油量 国产轿车每公里耗油量的全体就是总体 又如 :研究某批国产轿车每公里的耗油量时,总体 其中每辆轿车的耗油量就是个体。 类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用 分别表示身高和体重,那么此总体就可用二维随机变量 (X,Y) 来表示,而每个学生的身高和体重就是个体 . 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样” ,所抽取的部分个体称为 样本 . 样本中所包含的个体数目称为样本容量 . 二、样本 简单随机样本 1)抽样和样本 样本的抽取是随机的,每个个体是一个随机变量 2,X 而一旦取定一组样本,得到的是 (x1, 称其为样本的一个观察值,简称 样本值 . 2, 由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法 简单随机抽样 ”,它要求抽取的样本满足下面两点 : 1. 样本 2, 有相同的分布 . 2)简单随机样本 由简单随机抽样得到的样本称为 简单随机样本 ,它可以用与总体独立同分布的 1, 简单随机样本是应用中最常见的情形,今后,当说到“ 2, ,若不特别说明,就指简单随机样本 . 设 2, 总体 1)若 分布律是 p(x),则 2, p(p ( p ( 2)若 概率密度是 f(x),则 2, f (f ( f ( 事实上我们抽样后得到的资料都是具体的、确定的值 . 如我们从某班大学生中抽取 10人测量身高,得到 10个数,它们是样本取到的值而不是样本 . 我们只能观察到随机变量取的值而见不到随机变量 . 3)总体、样本、样本值的关系 统计是从手中已有的资料 样本值,去推断总体的情况 总体分布 F(x)的性质 . 总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体 . 样本是联系二者的桥梁 4)经验分布函数 设 2, 的样本, x1, 对于每个固定的 x,设事件Xx在 vn(x),于是事件 Xx发生的频率为: ()() x 显然 Fn(x)为不减右连续函数,且 ( ) 0 , ( ) 1 称 Fn(x) 为样本分布函数或经验分布函数 . 定理(格列文科)当 n 时,经验分布函数 Fn(x) 依概率 1关于 li m s u p | ( ) ( ) | 0 1nn x F x 定理表明: 当样本容量 验分布函数 Fn(x) 几乎一定会充分趋近总体分布函数 F(x),这是用样本来推断总体的理论依据 . 第二节 统计量与抽样分布 一、统计量 二、统计学中三个常用分布和上 分位点 三、抽样分布定理 一、统计量 由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)信息集中起来 . 定义 中不含有任何的未知参数,则称函数 g(,X n) 如果样本 ,X g(,X n) 为统计量 . g(,x n)为统计量 g(,X n)的一个 若 , 称函数值 观察值 . 若 , 2 已知 , 则 ,11是统计量, 而 例如: 是 X 的一个样本 , , 21 则 是统计量 . ,(NX 2 2, 是未知参数 , 几个常用的统计量 样本均值 样本方差 XX(的信息 它反映了总体方差 的信息 样本 样本 1k=1,2, 它反映了总体 k 阶矩 的信息 它反映了总体 k 阶 中心矩的信息 它们的观察值分别为: (111由大数定律可知: ( 例 1. 从一批相同的电子元件中随机地抽出 8个,测得使用寿命(单位:小时)分别为: 2300, 2430, 2580, 2400,2280, 1960, 2460, 2000,试计算样本均值、样本方差及样本二阶矩 . 解: 小时) 0 1(11 )(小时 278 26(小时 7 8 62抽样分布 统计量是样本的函数,而样本是随机变量,故统计量也是随机变量,因而就有一定的分布,它的分布称为 “抽样分布” . 二、统计学中三个常用分布和上 分位点 下面介绍三个来自正态总体的抽样分布 . )n( 222 分布 1、 定义 : 设 相互独立 ,都服从标准正态分布 X,X 21222212 N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布,记为 22 分布的概率密度为 其它00)2(21)(2122其中 )( 001 s( ( 2处的值 . n=1 n=4 n=10 f(y) 0 1 3 5 7 9 11 13 15 17 x 所改变 . 2 分布的概率密度图形如下: 2显然 分布的概率密度图形随自由度的不同而 性质 1. ),( 22 )(,)( 22 则 证 明: 设 n,i),(N110 X,X 21相互独立 ,则 ,)X(D,)X(E 0 2n)( 22 )X(E)X(D)X(E ,13 2244 )()( 2242 (这个性质称为 分布的可加性 . 2性质 2. )( 2122221 ),( 1221 ),( 2222 21 与 22相互独立,则 t 的概率密度为 : 2121221 n)n)n()n()t( 设 X N( 0 , 1 ) , Y 所服从的分布为自由度为 n 的 t 分布 t t (n). )(2 t 分布 ,且 X 与 Y 相互 独立,则称变量 n=4 n=10 n=1 xt(x;n) o t=0对称,且 当 n30),其图形与标准正态分布的概率密度函数的图形非常接近 n,t 分布与 N (0,1)分布相差很大 . 由定义可见, 3、 则称统计量 服从自由度为 的 21121F(n2,),n(Y),n(X 2212定义 : 设 X 与 Y 相互独立, 作 FF(n1,. 0001)()()()()()(2222212112121212121F(n1,则 xo)n,n;x(f 212统计的三大分布的定义、基本性质在后面的学习中经常用到,要牢记! 4、上 分位点 )(定义: 设随机变量 f(x),对于 任意给定的 (045), 2其中 分位点 22 )12(21 3)对于 t 分布 a)由其对称性,有: )()(1 b) 当 n45), )(4)对于 : ),(1),(12211例 2. 查表求下列值 : ,)5()6()9,10(2,28()( . 2022503 6 4 (t)6()6( ,10( 9 4 3 )28,2(1)2,28(F 8 2 0(2 , 010332010 )3,0( 2和 服从 分布,而 , X 9 和 , Y 9 292221921的分布 . 分别是来自 的简单随机样本,求统计量 解: )9,0( NX i )81,0(91)1,0(991 )9,0( NY i )1()3( 22 Y i)9(99291291281/9/91291( ,X 15是来自 求 )2,0( 2服从 分布,而 )的分布 . 统计量 解: )2,0( 2NX i )1()2( 22 X i)10(44210121012)5(442151121511220402152122112102221/) )()Y )5,10( F 当总体为 正态分布 时,教材上给出了几个重要的抽样分布定理 三、抽样分布定理 定理 1 设 2, ),( 2有 ),(2( 1)样本均值 ( 2)样本均值 与样本方差 相互独立。 X 2S( 3)随机变量 22)1( )()(1 2221 2 设 2, ),( 2 2 分别为样本均值和样本方差 , 则有 )1( 定理 3 (两个总体样本均值差的分布 ) )2(112)1()1()(21212122221121 ,设 ),(),( 2221 独立 , 分别是这两个样本的样本均值 , 自 分别是这两个样本的样本方差 ,则有 2221 是取自 , 1Y 2, 2 定理 4 (两个总体样本方差比的分布 ) )1,1( 2122222121 ,设 ),(),( 222211 立 , 分别是这两个样本的样本均值, 分别是这两个样本的样本方差 ,则有 2221 1, 是取自 2, 2上述 4个抽样分布定理很重要,要牢固掌握 . 的概率不小于 90%,则样本容量至少取多少 ? 例 ( 7 2 , 1 0 0 )为使样本均值大于 70的概率 解: 设样本容量为 n , 则 )1 0 0,72( 0( 0(1 6 0 2 42. 从正态总体 ),( 2,抽取了 n = 20的样本 1 2 2 0, , ,X X (1) )19(119 22012222即 )1()1( 22220 222111 0 . 3 8 1 6 5 1 . 8 0 9 5 520 X ( ) 20222112 0 . 3 7 1 7 1 . 7 0 8 520 ( )故 191361633720122 19136163371 2012220122 查表 20 222111 0 . 3 8 1 6 5 1 . 8 0 9 5 520 X ( )(2) )20( 22012 故 20222112 0 . 3 7 1 7 1 . 7 0 8 520 ( )3 掌握给出的四个抽样分布定理。 第六章 小 结 体、样本和统计量的概念,要掌 分布、 会 2查表求其上 分位点。 握样本均值和样本方差的计算及基本性质。 附: 几种重要随机变量的数学期望和方差 一 二 三 四 五 六 一 X 0 1 1 p )( )( 2 )1()( 若随机变量 分布律为: 二 随机变量 XB(n,p),其分布律为: ,2,1,)1( 由二项分布定义可知, X是 发生的次数,且在每次试验中 p,设 k ,2,1,01次不发生在第次发生在第则 分布律为: X 0 1 1 p ,)( k )1()( 21)( )()( 21 1( )()()( 21 )1()()( ,若随机变量 XB( n , p ),则 即: 三 随机变量 ,其分布律为: )( X,2,1,0,! 0 !)( 11)!1( 22 )()()( 即: )(,)()( 2)1( )()1( 0 !)1( 222)!2( 2若随机变量 X(),则 四 设随机变量 a,b)上服从均匀分布,其概率密度为 ,01)(其它 ()( 1 2)( 22)(333322 22 )()()( 4232222 12)( 2即 12)()(,2)(2若随机变量 XU( a , b ),则 五 随机变量 ,其概率密度为: ),( 21)(222)( ()( 21 (令 ) 22)(21 )()( 2 221)( (令 ) 222)(2 22222)(,)( 即 若随机变量 XN( ,2 ) , 则 六 随机变量 的指数分布 ,其概率密度为: 0001)( ()( 01 x 0( 00|)(0| ()( 22 02 1 x 02 (0|2 2 02 20|)( 02 ( 020|2 )(,22 22 )()()( 2若随机变量 的指数分布 ,则 即 2)()( ,例 求 ,)3( X ,12 )()(1(3 2 ,)3( X 则 ,3)( )( )(2 )(4 12)1(3 2 )(3 2 ()(3 2 3,)9,1( 1, 5)上服从均匀分布 , 例 和 1, 5)上服从均匀分布, 求 (1) (X,Y)的概率密度 ;(2) ,)243( 243( 9,1( 5141)(其它 3)( 5( 234,231)( 18)1( 21)( )( 和 )()(),( X 其它0,51,212118)1(2243( )(4)(3 )243( ()4()(9 2 156 概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理,称为大数定律 第一节 大数定律 一个常数,若对于任给的正数 0, 总成立 1|定义 , 21 是一个随机变量序列, a 是 则称 随机变量 序列 ,21 a, 记为 )( )()( n)( , g( x) 是连续 函数,则 )(,(),( ( g( x , y) 是二元连续函数,则 ,)( n 设 发生的次数为 n, p ,则对任给的 0,总成立 定理 1(贝努利大数定律) 1| )( 贝努里大数定律的意义 在概率的统计定义中 , 事件 A 发生的频率 “ 稳定于” 事件 A 在一次试验中发生的概率是指:频率 与 p 大时可以用频率近似代替 p . 因而在 n 足够 贝努里大数定律提供了通过试验来确定事件概率的方法 . 定理 2(契比雪夫大数定律的特殊情形) 1|1, 相互独立,并且具有相同的数学期望和方差, E(, D(2,i=1,2, , 则对任给的 0,总成立 即 )( 的意义 具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望 n 足够大时 , 实验结果的算术平均几乎是一常数 . 因此,在实际应用中,当试验次数 足够大时 ,可用独立重复试验结果的 算术平均数来估计随机变量的数学期望 . 定理 3(契比雪夫大数定律的一般情形) 1|11|1, 相互独立,它们都具有数学期望: E(i,并且都 具有被同一常数 D( 0,总成立 2)( 望的算术平均的概率接近于 1. 即当 差不多不再是随机的了,取值 定理 3的意义 定理表明,独立随机变量序列 如果方差有共 其数学期望 X(. 同的上界,则 偏差很 设随机变量序列 2, 相互独立,服从同一分布,具有相同的数学期 望 E(, i=1,2, , 则对于任给正数 0 ,总成立 定理 4 (辛钦大数定律) 1|1|)( 1| 设随机变量序列 2, 相互独立,服从同一分布,且具有相同的 k 阶矩 ,)( 21 0,总成立 即 )( 大数定律以严格的数学形式表达了随机现象最根本的性质之一: 它是随机现象统计规律的具体表现 平均结果的稳定性 第二节 中心极限定理 客观背景: 客观实际中,许多随机变量是由大量 相互独立的偶然因素的综合影响所形成,每一个微小 因素,在总的影响中所起的作用是很小的,但总起来, 却对总和有显著影响,这种随机变量往往近似地服从 正态分布。 概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理。 由于无穷个随机变量之和可能趋于 ,故我们不研究 )()(的极限分布 . 下面介绍常用的三个中心极限定理。 1定理 1(独立同分布下的中心极限定理) 设 2, 是独立同分布的随机变量序列,且E(, D(2, i=1,2, ,则 定理表明: 当 准化随机变量 近似服从标准正态分布 . 1由此可知:对于独立的随机变量序列 ,不管 服从什么分布,只要它们是同分布,且有有限的数学期望和方差,那么,当 些随机变量之和 近似地服从正态分布 1 , 2 , , ) 2,N n n) 至少命中 180发炮弹的概率 ; (2) 命中的炮弹数不到 200发的概率 . 例 100 次 , 每次轰击命中的炮弹数服从同一分布 , 其数学期望为 2 , 均方差为 若各次轰击命中的炮弹数是相互独立的 , 求 100 次轰击中 解: 设 X k 表示第 k 次轰击命中的炮弹数, 100,2,1,2)( 2 X 表示 100次轰击命中的炮弹数 ,则 ,1 0 01 有 ), 10152 0 0 (NX 近似则 10021 , 相互独立, 又 ,2 2 5)(,2 0 0)( ) 180 ) 2 0 00 8 )( 1 152 0 02 0 0152 0 0152 0 00 152 0 )0( )1)0( 15 2 0 01 8 015 2 0 0 于售出哪一种蛋糕是随机的,因而售出一只蛋糕的价格是一个随机变量,它取 1(元 ), 元 ), )各值的概率分别为 00只蛋糕 00 (元 )的概率 解: 设第 i, i=1,2, ,300,则 P 1 i ( 2)( )()( 由独立同分布中心极限定理知: 即 )10(,近似)10(,2 4003001 3 0 74 0 08 3 0 73001 0 73001 1 0 0 0 9 定理 2(德莫佛拉普拉斯中心极限定理) )1(设 发生的次数为 n,事件 p,则对于任给实数 x,总成立 2221 定理表明: 若 服从二项分布,当 nY ( n 近似服从标准正态 的标准化随机变量 由此可知:当 00, 求 , 的矩估计 . 解 : 1() x e d x xx d e ( )|e e d x ( )|22 1() x e d x 2xx d e ( ) 2 |2e x e d x ( )2 2 E (X )2222 2 12xx e d x 令 解得 用样本矩估计 总体矩 ,X 2 2 21122 知: 不论总体为何分布,总体均值的矩估计量总是 ,抽取 10只灯泡,测得其寿命为 (单位 :小时 ) 1050, 1100, 1080, 1120, 1200, 1250, 1040, 1130, 1300, 1200, 试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差 . 解: 27 )(1147101 101 1021110 ( )2B 26 8 2 1 ( ) 二、 极大似然估计法 即:在一次试验中,概率最大的事件最有可能发生 . 引例 : 有两个外形相同的箱子 ,各装 100个球,一箱中 取得的球是白球 所取的球来自哪一箱? 答 : 第一箱 . 中有 99个白球 1个红球,一箱中有 1个白球 99个红球。 现从两箱中任取一箱 , 并从箱中任取一球 ,结果所 一般说,若事件 有关, 取值不同, P(A)也不同。则应记 事件 (A| )件 认为此时的 值应是在 中使 P(A| ) 达到最大的那一个 。这就是 极大似然原理 . (极大似然原理) 极大似然估计法的理论依据: 2, 的样本, 则 样本的联合分布律为: 12 ( , , , ) x p x 似然函数: 121( , , , ) 其中 12, k 为 未知待估参数, 1 1 2 2 , , , x X x X x 1 1 2 2 1 2 1 2( , , , ) ( , , , ) ( , , , )k k n kp x p x p x 1. 散型总体,其分布律为 : 记 1 2 1 21( , , ) ( , , , )nk i p x 12( , , , ) 2. 续型总体,其概率密度为 为其样本的似然函数 . 则称 1 2 1 21( , , ) ( , , , )nk i f x 称 为样本的似然函数 . 12( , , ) 似然函数 12( , , ) 的值的大小实质上反映的是 该样本值出现的可能性大小 . 极大似然估计的 方法: 对于给定的样本值 ,选取 12, , ,k, 使得其 似然函数 12( , , ) 达到最大值。即求 12 ( , ) , 1 , 2 ,i i nx x x i k , ,使得 1 2 1 2 , , , ) m a x ( , , )( , 7 1 1 212 ( , , , ) ( , , , )nk k nx x xx x x称为未知参数 1, ,k 的极大似然估计值 这样得到的估计值 对应的统计量 1 1 1 212 ( , , , ) ( , , , )nk k X称为未知参数 1,k 的 极大似然估计量 (1) 由总体分布和所给样本,求得似然函数 步骤: 1 2 1 21( , , ) ( , , , )nk i f x (2) 求似然函数 12( , , ) 的对数函数函数 (化积商为和差,而 12l n ( , , ) 和 12( , , ) 同时取得最大值) 1 2 1 21l n ( , , ) l n ( , , , )nk i f x (3) 解方程组 121l n ( , , )0 122l n ( , , )0 12l n ( , , ) 0 74) 得未知参数 1, ,1 1 1 212 ( , , , ) ( , , , )nk k nx x xx x x及其对应的极大似然估计量 1 1 1 212 ( , , , ) ( , , , )nk k X7待估参数只有一个,则似然函数是一元函数 L(),此时,只须将上述步骤中求偏导改为求导即可。 说明: ,1,0,!)();( . 设总体 X 服从参数为 )0( 的泊松分 布,求参数 的极大似然估计量 解: 的样本,样本观察值为 ),( 21 由 X 服从泊松分布,得 ),( 21 为从总体 设 ni 1 !)(似然函数为 ! . . . .!两边取对数,得 n n ()(d)(0 得 对 求导,并令其为 0, 11所以参数 的极大似然估计量为: 000),(1其中 0 总体 X 的样本值,求参数 的极大似然估计值 . 例 6. 设总体 为待估参数, a0是已知常数, ),( 21 是取自 解 : ()(11 11)(两边取对数,得 )(x)xl n ()1a(对 求导 ,并令其为 0, (得 的极大似然估计值 . 0 1 2 322 2 (1 ) 12 是未知参数 , 3, 1, 3, 0, 3, 1, 2, 3, 是来自总体 求参数 的极大似然估计值 . )(210 例 7. 设总体 解: )( L 2211221 )()()()()()( 211221 2 246 1214 )()( 两边取对数,得 )(L )1l n (2)21l n (4 对 求导,并令其为 0, =0 得 12137 12137 和 因为 ,2112137不合题意, 所以 的极大似然估计值为 12137 ( 设 的函数 g=g()是 上的实值函数 ,且有唯一反函数 . 如果 是 的极大似然估计,则 g( )也是 g( )的极大似然估计 . 关于极大似然估计的两点说明: 此性质称为 极大似然估计的不变性 例 8. 设 2 , , 的指数分布 总体的样本,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 600套合同标准文本
- 2025年03月黑河学院博士72人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025年全国税法知识竞赛培训题库及答案
- 2025年全国环保知识竞赛题库及答案(共450题)
- 乡村振兴商务合作合同样本
- 冷库贮存合同样本
- 公路行业购销合同范本
- 2025年03月镇江市京口区事业单位集中工作人员23人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 凉皮加盟合同样本
- 出售牛肉货架合同标准文本
- 《沉淀溶解平衡》说播课课件(全国高中化学优质课大赛获奖案例)
- 设备周期保养检修记录表
- 中国大学生心理健康量表(CCSMHS)
- 专利法全套ppt课件(完整版)
- GB∕T 3639-2021 冷拔或冷轧精密无缝钢管
- 西师版六年级下册数学第五单元 总复习 教案
- 色谱、质谱、联用
- 独生子女父母退休一次性奖励审批1
- 铝合金窗陕西银杉节能门窗有限责任公司铝合金制作及安装工艺流程图
- 苏教版小学数学四年级下册《图形旋转》练习题
- 烧结普通砖、多孔砖回弹计算
评论
0/150
提交评论