




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、整理ppt中南大学数学公共课程之中南大学数学公共课程之数理统计数理统计郭孔华郭孔华Telmail:中南大学数学科学与计算技术学院中南大学数学科学与计算技术学院整理ppt变量函数的分布等。但是对一个实际问题,随机变量的概率分布往往是不知道的,如何确定随机变量的概率分布或数字特征就是数理统计要解决的问题。在概率论中,我们所研究的随机变量, 它的分布都是假设已知的, 在这一前提下去研究它的性质、特点和规律性, 例如求出它的数字特征,讨论随机数理统计是一个内容十分丰富的数学分支。它既有严格的理论,更有极其广泛的应用。而且随着科技的发展其研究内容还在不断地充实提高。数理统计的基
2、本概念数理统计的基本概念整理ppt 从历史的典籍中,人们不难发现许多关从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作人们很早就开始了统计的工作 . 但是当时的统但是当时的统计,只是对有关事实的简单记录和整理,而没计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范有在一定理论的指导下,作出超越这些数据范围之外的推断围之外的推断.整理ppt 到了十九世纪末二十世纪初,随到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正着近代数学和概率论的发展,才真正诞生了数理统计学
3、这门学科诞生了数理统计学这门学科.整理ppt 数理统计学是一门应用性很强的学科数理统计学是一门应用性很强的学科. 它它是研究怎样以是研究怎样以有效的方式有效的方式收集、收集、 整理和分析整理和分析带带有随机性的数据有随机性的数据,以便对所考察的问题作出推,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供断和预测,直至为采取一定的决策和行动提供依据和建议依据和建议.整理ppt对象:抽样所获得的数据(带有随机性)对象:抽样所获得的数据(带有随机性)数理统计学研究的对象及任务数理统计学研究的对象及任务任务:如何有效地收集、整理和分析任务:如何有效地收集、整理和分析 数据,并对所观察的
4、问题做出数据,并对所观察的问题做出 推断或预测,为采取的决策提推断或预测,为采取的决策提 供依据和建议。供依据和建议。注:只允许我们对随机现象进行次数不多的注:只允许我们对随机现象进行次数不多的观察试验,也就是说观察试验,也就是说, 我们获得的只是局部我们获得的只是局部观察资料观察资料.整理ppt作出精确而可靠的结论.从总体上来说,数理统计可以分为两大类两大类:一类是如何科学地安排试验,此部分内容称为描述统计学描述统计学如:试验设计、抽样方法。另一类是研究如何分析所获得的随机数据, 对所研究的问题进行科学的、合理的估计和推断, 尽可能地为采取一定的决策提供依据,这部分的内容称为推断统计学推断统
5、计学, 如:参数估计、假设检验等。我们主要讨论有关推断统计学中几个最基本的问题。以获取有效的随机数据。整理ppt 对随机现象进行观测、试验, 以取得有代表性的观测值 对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性数数理理统统计计的的分分类类描述统计学描述统计学推断统计学推断统计学整理ppt参数估计 (第6章) 假设检验 (第7章) 回归分析 (第8章) 方差分析 (第8章) 推断 统计学整理ppt100个样品进行强度测试,于是面临下列几个问题: 例如例如 某厂生产一型号的合金材料, 用随机的方法选取1、估计这批合金材料的强度均值是多少?(参数的点估计问题参数的
6、点估计问题)2、强度均值在什么范围内?(参数的区间估计问题)参数的区间估计问题)3、若规定强度均值不小于某个定值为合格,那么这批材料是否合格? (参数的假设检验问题)参数的假设检验问题)4、这批合金的强度是否服从正态分布?5、若这批材料是由两种不同工艺生产的,那么不同的工艺对合金强度有否影响?若有影响,那一种工艺生产的强度较好?(分布检验问题)分布检验问题)(方差分析问题)方差分析问题)整理ppt6、若这批合金由几种原料用不同的比例合成,那么如何表达这批合金的强度与原料比例之间的关系?(回归分析问题)回归分析问题)我们依次讨论参数的点估计、区间估计、假设检验等内容。首先我们讨论数理统计中的一些
7、基本概念。整理ppt第第5章章 样本及其分布样本及其分布 在数理统计中,我们所研究的随机变量在数理统计中,我们所研究的随机变量的分布往往是未知的,通过对随机变量进行的分布往往是未知的,通过对随机变量进行多次独立重复的试验和观测,获取数据,利多次独立重复的试验和观测,获取数据,利用实际观测数据研究随机变量的分布,对其用实际观测数据研究随机变量的分布,对其分布函数、数字特征等进行估计和推断分布函数、数字特征等进行估计和推断 本章作为数理统计基础,学习总体、样本章作为数理统计基础,学习总体、样本、统计量与抽样分布等有关概念,以及有本、统计量与抽样分布等有关概念,以及有关正态总体的重要的抽样分布定理关
8、正态总体的重要的抽样分布定理整理ppt整理ppt .总体和样本一 .统计量二整理ppt 总体容量有限的称为总体容量有限的称为有有限总体限总体, 总体总体 一一个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.1.1.总体总体研究对象的全体称为研究对象的全体称为总体总体( (母体母体) ),总体中每个对象称为总体中每个对象称为个体个体.研究某批灯泡的质量研究某批灯泡的质量总体总体考察国产考察国产 轿车的质量轿车的质量1 1 总体和样本总体和样本 不过在统计研究中,人们关心总体仅仅是关心不过在统计研究中,人们关心总体仅仅是关心其每个个体的一项其每个个体的一项( (或几项或几项) )数量
9、指标和该数量指标在总体中的分布数量指标和该数量指标在总体中的分布情况情况. 该批灯泡寿命的全体就是总体该批灯泡寿命的全体就是总体 灯泡的寿命灯泡的寿命 每公里的耗油量每公里的耗油量所有国产轿车每公里耗油量的全体就是总体所有国产轿车每公里耗油量的全体就是总体这时,这时,每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体. 称总体中所含个体的数目为称总体中所含个体的数目为总体容量总体容量, 总体容量无限的称为总体容量无限的称为无限总体无限总体. 当个体个数很大时通常把有限总体看作无限总体。当个体个数很大时通常把有限总体看作无限总体。整理ppt 那么那么, 此此总体就可用描述其
10、寿命的随机变量总体就可用描述其寿命的随机变量 X 或用其分布函数或用其分布函数 F( (x) )表示表示. 因此在理论上可因此在理论上可以把总体与概率分布等同起来以把总体与概率分布等同起来.概率分布是刻划这种集体性质最适当的工具概率分布是刻划这种集体性质最适当的工具. . 统计的任务统计的任务, ,是根据从总体中抽取的样本是根据从总体中抽取的样本, 去推断总体的性质去推断总体的性质. 由于我们关心的是总体中的个体的由于我们关心的是总体中的个体的某项指标某项指标( (如人的身高、体重,如人的身高、体重,灯泡的寿命灯泡的寿命, ,汽车的耗油量汽车的耗油量) ),从另一方面看:从另一方面看:如研究某
11、批灯泡的寿命时如研究某批灯泡的寿命时, 关心的关心的数量指标就是寿命数量指标就是寿命, 所谓总体的性质,无非就是这所谓总体的性质,无非就是这些些指标值集体的性质指标值集体的性质. 我们用我们用X和和Y分别表示身高和体重,那么此总体就可用二分别表示身高和体重,那么此总体就可用二维随机变量维随机变量( (X,Y) )或其联合分布函数或其联合分布函数 F( (x, y) )来表示来表示.总体概念的要旨总体概念的要旨: 总体就是一个概率分布总体就是一个概率分布 再如再如, 若若研究某地区中学生的营养状况时研究某地区中学生的营养状况时, 关心的数量指标是身关心的数量指标是身高和体重高和体重,整理ppt当
12、X为离散型离散型时, 称X的概率函数(分布列)为总体概率函数总体概率函数。当X为连续型连续型时, 称X的概率密度为总体密度函数总体密度函数。当总体分布为指数分布时, 称为指数分布总体;当总体分布为正态分布时,称为正态分布总体正态分布总体或简称正态总体正态总体等等. 整理ppt例如例如本市家庭的月收入X是个随机变量,X服从什么在数理统计中总体X的分布永远是未知的,有足够的理由可以认为总体X服从某种类型的分布,但这个分布的参数还是未知的。分布事先是不清楚的,根据资料可确信.,2NX即使但2,究竟取什么值还是未知的,由于总体X的分布是未知的,因此X的数字特征如均值、方差等往往也是一个未知的值。 对于
13、这些未知值可以根据有关数据来推测。整理ppt坏性的试验更是不允许对整个总体进行考察.考察某工厂生产的灯泡寿命考察某型号手机的质量考察吸烟和患肺癌的关系在实际问题中,要考察整个总体往往是不可能的,因为它需要耗费太多的资源和太多的时间.有些破2 2、 样本与简单样本样本与简单样本整理ppt 样本中所包含的个体数目称为样本中所包含的个体数目称为样本容样本容量量.但是,一旦取定一组样本,得到的是但是,一旦取定一组样本,得到的是 n 个具体的数个具体的数 x1, x2, , xn , , 按一定规则从总体中抽取若干个按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息体进行观察试验以获得有关总
14、体的信息. 为推断总体分布及各种特征为推断总体分布及各种特征, 从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为 5 样本是随机变量样本是随机变量抽到哪抽到哪 5 辆是随机的!辆是随机的!容量为容量为 n 的样本可以看作一的样本可以看作一 n 维随机变量维随机变量( (X1, X2, , Xn) ). 所抽取的部分个体称为所抽取的部分个体称为样本样本. 这一抽取过程称为这一抽取过程称为抽样抽样, 称为称为样本样本( (X1, X2, , Xn) )的一组观测值的一组观测值,简称,简称样本值样本值 .样本的值域称为样本的值域称为样本空间样本空间。整理ppt 它要
15、求抽取的样本它要求抽取的样本X1, X2, , Xn 满足下面两点满足下面两点: 它可以用与总体它可以用与总体同分布的同分布的 n 个相互独立的随机变量个相互独立的随机变量 X1, X2, , Xn 表示表示.2.代表性:代表性: Xi ( (i =1,2,n) ) 与所考察的总体与所考察的总体 X 同分布同分布. 为了使抽取的样本能为了使抽取的样本能很好地反映总体的信息,很好地反映总体的信息,必须考虑抽样方法必须考虑抽样方法. 最常用的一种抽样方法叫作最常用的一种抽样方法叫作简单随机抽样简单随机抽样,1.独立性:独立性: X1, X2, , Xn 是相互独立的随机变量是相互独立的随机变量 ;
16、抽样的目的是为了对总体进行统计推断,抽样的目的是为了对总体进行统计推断,由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本, 今后今后, 说到说到 “X1, , Xn 是取自某总体的样本是取自某总体的样本”时时, 若不特别说明若不特别说明, 就指简单随机样本就指简单随机样本.则其简单随机样本的联合分布函数为则其简单随机样本的联合分布函数为F( ( x1, x2, , xn ) )= F( (x1) )F( (x2) )F( (xn) ) 简单随机样本是应用中最常见的情形简单随机样本是应用中最常见的情形, 若总体若总体 X 的分布函数为的分布函数为F(x), . )
17、(1niixF若总体若总体 X 的概率密度为的概率密度为 f (x), 则其简单随机样本的联合概率密度为则其简单随机样本的联合概率密度为 . )(),(11niinxfxxf整理ppt 求样本求样本( (X1, X2, X3 ) )的的概率分布概率分布. . ex1.设总体设总体 X B( (1, p), ), 即即 P( (X=x) )= p x(1-(1-p) )1-1-x, , X = 0 , 1 . 设设 X1, X2, X3 为为 X 的一个样本的一个样本, 解解 x i = 0, 1; i = 1, 2, 3 . ( (X1, X2, X3 ) )的分布律的分布律 P( (X1=
18、x1 , X2= x2 , X3= x3 ) )31)(iixXP311)1(ixxiipp,)1(3213213xxxxxxpp又又 x1 + x2 + x3 =0, 1, 2, 3 , P( (X1= x1 , X2= x2 , X3= x3 ) ) kkpp3)1(k = 0, 1, 2, 3 . ,)1()(iixxippxXP 整理pptex2.设总体设总体X服从均值为服从均值为1/2的指数分布,的指数分布,X1,X2,X3,X4为来自为来自X的样本,求的样本,求X1,X2,X3,X4的联合的联合概率密度和联合分布函数概率密度和联合分布函数解:解:X的概率密度为的概率密度为 0, 0
19、0,2)(2xxexfx其分布函数为其分布函数为 0, 00,1)(2xxexFx则则X1,X2,X3,X4的联合概率密度为:的联合概率密度为:)()()()(),(43214321xfxfxfxfxxxxf 其它其它, 04 , 3 , 2 , 1, 0,16412ixeixii整理ppt 比如我比如我们从某班大学生中抽取们从某班大学生中抽取 10 人测量身高人测量身高, 得到得到 10 个数个数. 我们只能观察到我们只能观察到随机变量取的值随机变量取的值而见不到而见不到随随机变量机变量. 它们是样本它们是样本取到的值而不是样本取到的值而不是样本. 3. 3. 总体、样本、样本值的关系总体、
20、样本、样本值的关系总体总体( (理论分布理论分布) )? 样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料 样本值样本值, 去推断总体的情况去推断总体的情况 总体总体分布分布F( (x) )的性质的性质. 总体分布决定了样本取值的概率规律,也就是样本取到样本值总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,的规律,事实上事实上, 我们抽样后得到的资料都是具体的、确定的值我们抽样后得到的资料都是具体的、确定的值. 因而因而可以由样本值去推断总体可以由样本值去推断总体. ? ? ? 是总体的代表是总体的代表, 含有总体的信息含有总体的信息分散、复杂分散、复杂 样本
21、是联系二者的桥梁样本是联系二者的桥梁 整理ppt312)(iiX ,)(312iiX 其中其中 已知已知, , 未知未知 , 则称则称 g( (x1, , xn) )是是一个一个统计量统计量. 一个有效一个有效的方法就是构造一些的方法就是构造一些样本的函数样本的函数, 若样本函数若样本函数 g( (x1, , xn) )中不含任何未知参数中不含任何未知参数, 由样本值去推断总体情况由样本值去推断总体情况, 需要对样本值进行需要对样本值进行“加工加工”, 1. 统计量统计量 这种不含任何未知参数、这种不含任何未知参数、完全由样本决定的量完全由样本决定的量称为统计量称为统计量 通过通过样本函数样本
22、函数把样本中所含的把样本中所含的( (某一方面某一方面) )的信息集中起来的信息集中起来.定义定义 设设X1, X2, , Xn 是来自总体是来自总体 X 的容量为的容量为 n 的样本的样本, 样本的函数样本的函数ex1.设设 X1, X 2, X3 是取自正态总体是取自正态总体 X ( ( , 2) ) 的一个样本的一个样本, 问下列样本函数中哪些是统计量问下列样本函数中哪些是统计量, 那些不是?那些不是? X1 , X2+1, ( (X1 + X2 + Xn ) )/ /3 , Max X1, X2, X3 , , 我们主要研究两种基本的统计量:我们主要研究两种基本的统计量: 样本矩样本矩
23、 和和 顺序统计量顺序统计量 2 2 统计量统计量整理ppt几个常见的统计量几个常见的统计量 样本均值样本均值样本方差样本方差niiXnX11niiXXnS122)(11反映了总体均值的信息反映了总体均值的信息它反映了总体方差的信息它反映了总体方差的信息样本样本 k 阶原点矩阶原点矩样本样本 k 阶中心矩阶中心矩nikikXnA11nikikXXnB1)(1 k=1,2,它反映了总体它反映了总体 k 阶矩的信息阶矩的信息反映了总体反映了总体 k 阶中心矩的信息阶中心矩的信息并称他们相应的观测值并称他们相应的观测值 样本标准差样本标准差 niiXXnS12)(11它反映了总体标准差的信息它反映了
24、总体标准差的信息,11niixnx,)(11122niixxns,11nikikxna,)(11nikikxxnb k=1,2,)(1112niixxns仍分别为仍分别为: 样本均值、样本方差、样本标准差、样本样本均值、样本方差、样本标准差、样本 k 阶原点矩、阶原点矩、样本样本 k 阶中心矩阶中心矩. 10 样本矩样本矩 niniiiXnXXXn1212)2(11)222XnXn )2Xn niinXXnS122)(1 niinXXnS12)(1统称为统称为 样样 本本 矩矩 整理ppt统计量的重要性质统计量的重要性质 设设 X1, X2, , Xn 是来自总体是来自总体 X 的容量为的容量
25、为 n 的样本的样本, 若若 X 有期望有期望 EX= 和方差和方差 DX = 2, , 则则 niiEXnXE11)(12niiXXE ex3.)()(2222 nnn= , ( (1 1) ) ?)(2nSE,)1(2 n)()(212XEXDnXEXDniii;12 nn11nn1 E( (S 2) ) ? = 2 , ( (2) ) )()(212XEnXEniiniiDXnXD121= 2/n ; 2DCXC X22DXEXEX整理ppt2 顺序统计量与极差顺序统计量与极差设),(21nXXX为样本,),(21nxxx为样本值,且*2*1nxxx当),(21nXXX取值为),(21n
26、xxx时,定义 r.v.nkxXkk, 2 , 1,*)(则称统计量)()2()1(,nXXX为顺序统计量顺序统计量.其中,max,min1)(1)1(knknknkXXXX称)1()(XXDnn为极差极差整理ppt总总 体体 样样 本本统统 计计 量量 描述描述作出推断作出推断 随机随机 抽样抽样我们介绍了数理统计的基本概念我们介绍了数理统计的基本概念.小结小结整理ppt整理ppt 统计中常用分布 一.几个常见的抽样分布 二.直方图 三.整理ppt 统计量的分布称为抽样分布。 在使用统计量进行统计推断时常需知道它的分布。当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一
27、般来说是困难的。 本节介绍来自正态总体的几个常用统计量的分布。今后,我们将看到这些分布在数理统计中有重要的应用。 整理ppt(1)(1) 正态分布正态分布则niiiniiiniiiaaNXa12211,特别地,nNXnXnii21,1则nXXX,21),(2NXi若若nXXX,21),(2iiN整理ppt(2)伽玛分布伽玛分布(分布分布) )如果连续型随机变量X的密度函数为为函数,则称X服从参数是,的伽玛分布,记为X (,).定义定义1,0( ),0,0( )0,0 xxexf xx其中,10( )xxe dx整理ppt)(!) 1()2/1 (, 1) 1 (),() 1(Nnnnxxx函数
28、具有以下性质:设X (,),可以证明:对于任意整数k,有10()()( )( )kkxkxkE Xxedx从而有:222(1)()()()E XE XD X 整理ppt一、统计学的三大分布为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计中的三个重要分布,即 分布,分布,分布。 1、 分布设 是来自总体 的样本,则称统计量 (1)服从自由度为 的 分布,记为2tF2nXXX,211 , 0N222212nXXXn2 n22整理ppt n2 其它,0, 0,2212122yeynyfynn yf此处,自由度是指(1)式右端包含独立变量个数分布的概率密度为的图形如图51所示。(2)整理ppt
29、图51整理ppt2122221nn 此结论可推广:设 且相互独立 iinX2ki, 2 , 1niikiinX1212分布的可加性 1221n2222n2221,设,并且 独立,则(证明略)则整理ppt例 设 是总体 的简单随机样本,试确定c和d使得解:容易求得 12(,)nXXX(0,1)XN22212345()()( )c XXXd XXn并求出n。1234512345(0,3)(0,2)(0,1)(0,1)32XXXNXXNXXXXXNN从而有并且它们是相互独立的,由2分布的定义知 22212345232XXXXX由此可知,c=1/3,d=1/2,n=2。整理ppt若 ,则有 n22nE
30、2nD222分布的数学期望和方差1 , 0 NXi因12iiXDXE34iXEni, 2 , 1故nXEXEEniinii12122因此2132242iiiXEXEXD又所以 也相互独立由于 相互独立nXXX,2122221,nXXXnXDXDDniinii212122于是整理ppt则称点 为 的上 分位点x xF2分布的分位点 xF10定义 设有分布函数 对给定的 xXP若有(6) dxxfxXPx ndyyfnP222 xF xf当 有密度函数 时,式(6)可写成(7) n2由上述定义得 分布的上 分位点为(8)整理ppt如图52所示,对于不同的 上 分位点的值已制成表格,可以查用(参见附
31、表5)。,n整理ppt图52整理ppt例如 对于 ,查得但该表只详列到 费歇(R.A.Fisher)曾证明,当 充分大时,近似地有 (9)其中 是标准正态分布的上 分位点。利用(8)式可以求得当 时, 分布的上 分位点的近似值9,05. 0n 919.169205. 045nn ,122122nunu45n n2例如由(9)式可得 (由更详细的表得 )221.6799645. 121502205. 0505.6750205. 0整理ppt2、 分布t设 , ,且 独立1 , 0 NX nY2YX,服从自由度为 的 分布ntnYXt 则称随机变量(10) ntt 记为t分布又称为学生氏(stud
32、ent)分布 nt分布的概率密度函数为 ,1221212nntnnntht(11 )整理ppt图53中画出了 的图形。 的图形关于 对称,当 充分大时,其图形类似于标准正态变量概率密度的图形。事实上,利用 函数的性质可得 故当 足够大时, 分布近似于 分布。 但对于较小的 , 分布与 分布相差较大(见附表 3 与附表 4 ) th th0tn 2221limtnethnt1 , 0Nnt1 , 0N(12)整理ppt图53整理ppt的点 为 分布的上 分位点。(见图6-6) nt ntt分布的分位点10对于给定的 , ,称满足条件 dtthnttPnt(13)图6-6整理ppt由 分布上 分位
33、点的定义及 图形的对称性知t th ntnt1在 时,对于常用的 的值,就用正态近似45n unt(14)t分布的上 分位点可自附表4查得。(15)整理ppt 其它,00,12222212112221212111ynynnnynnnnynnnnF3. 分布 ,12nU,22nVVU,设且 独立,21nVnUF 21,nnF则称随机变量服从自由度为 的 分布.,21nnFF记为(16)21,nnF的概率密度为(17)整理ppt y图54中画出了 的图形.,21nnFF12,1nnFF由定义可知,若 则 ( 18)图54整理ppt 21,21,nnFdyynnFFPF分布的分位点,10对于给定的
34、称满足条件(19)21,nnF21,nnF的点 为 分布的上 分位点(图5-5)图5-5整理ppt12211,1,nnFnnF容易证明等式:(20)利用这个等式,查附录表,可以计算当995. 0,99. 0,975. 0,95. 0F时的 的值.211. 074. 415 ,10110, 505. 095. 0FF例如F分布的上 分位点有表格可查(见附表 6 )整理ppt二、几个常见的抽样分布 研究数理统计的问题时,往往需要知道所讨论的统计量 的分布。一般说来,要确定某个统计量的分布是困难,有的甚至是不可能的 。然而,对于总体服从正态分布的情形已经有了详尽的研究。下面我们讨论服从正态分布的总体
35、的统计量的分布。nXXXg,21niiXnX1121211niiXXnSnXXX,212,N2,N假设 是来自正态总体 的样本,即它们是独立同分布的皆服从 分布样本均值与样本方差分别是整理pptnNX2,1 , 0 NnXX2,N定理1 设总体 服从正态分布 ,(21)即则niiniiXnXnX11111 , 0 NnXnXXX,21X2,N 因为随机变量 相互独立且与总体 服从相同的正态分布 证所以由正态分布的性质可知,它们的线性组合服从nN2,正态分布即整理ppt这个定理的证明从略,我们仅对自由度作一些说明2221Sn 1n2112222nSnX2,N定理2 设总体 服从正态分布 则X2S
36、(1)样本均值 与样本方差 相互独立;(2)统计量 服从自由度 的 分布即(22)整理pptniiXXSn12212112222211niniiiXXXXSn虽然是 个随机变量的平方和,但是这些随机变量不是相互独立的 。因为它们的和恒等于零:n0111niiniiXnXXX2S由样本方差 的定义易知所以统计量由于受到一个条件的约束,所以自由度为1n整理ppt上述两定理是正态总体统计推断的基础,因而是十分重要的,下面列举其应用.整理pptnXXX,212,N1ntSnXTex1. 设 是来自 的样本,则统计量(23)1 , 0 NnXu由定理1知,统计量112222nSn又由定理2知,统计量因为
37、 与 相互独立X2SnXu2221Sn 与 也相互独立所以证11/11222ntSnXnSnnXnTt于是 ,由 分布的定义可知,统计量 整理pptex2. 设 来自 , 是来自 的两个独立样本,记1,21nXXX21,N2,21nYYY22,N111,1niiXnX212,1njjYnY11212111niiXXnS,11212222njjYYnS,211212222112nnSnSnSw2wwSS则统计量211212121nntnnSYXTw(24)整理ppt121,nNX222,nNY由定理1可知,统计量证XY且 与 相互独立221221,nnNYX由正态分布的性质知1 , 011212
38、1NnnYXU即,11122211nSn11222222nSn又由定理2知:整理ppt因为 与 相互独立, 与 相互独立X21SY22S所以统计量 与 也相互独立UV211221212121nntnnSYXnnVUTw因为 与 相互独立,所以由 分布的可加性可知21S22S22112122222211nnSnSnV统计量t于是,由 分布定义可知,统计量整理ppt由假设, 、 相互独立,则由 分布的定义21S22SF11212111niiXXnS21222211njjYYnS1, 1212221nnFSSFex3. (续上例)记则(25)证,11122211nSn11222222nSn由定理21
39、, 111112122212222221211nnFSSnSnnSn知注:若两个正态分布的方差 与 不相等,21221, 12122212221nnFSSF则统计量整理ppt本节所介绍的几个分布以及几个重要结论,在下面各章中都起着重要的作用。应注意,它们都是在总体为正态这一基本假定下得到的。整理pptex4. 在总体 中,随机地抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.)3 .6,52(2NX解解)363 . 6,52(2NX故63 . 6528 .5063 . 6528 .53) 8 .538 .50( XP) 8 .50() 8 .53(XXFF8239. 0
40、)1429. 1()7143. 1 (整理pptex5.设总体X 的概率密度函数为101)(xxxxf为总体的样本,求),(5021XXX(1)(1)X的数学期望与方差(2) )(2SE(3) )02. 0(XP解解(1)0d)()(11xxxXEXE1001d2501)(501)(501)(1022xxxXEXDXD整理ppt8414. 02 . 0121 . 0002. 012)02. 0(1)02. 0(XPXP)1001, 0( NX(近似),(3)由中心极限定理(2)21)()()(22XEXDSE整理ppt容量为10与15的两个独立样本,求它们的均值差大于0.3的概率。ex6. 设
41、总体(20,3)XN,分别从X中抽取解解 设 与 分别表示容量为10与15的两个样本的均值, 则1X2X1233(20,)(20,)1015XNXN又由于 与 相互独立,从而有1X2X121212()0,()0.5E XXD XXDXDX12(0,1)1/2XXN故 整理ppt因此1212(0.3)(0.3 2)1/2XXP XXP-3-2-11230.050.10.150.20.250.30.35Za-Za( 0.424)1(0.424)0.3372 查标准正态分布表:12(0.3)0.7644P XX2( 0.424) 整理ppt.2)(12)2(;2)(12)1( , ),( 16 ),
42、( 2122212216212 niiniiXXnPXnPXXXnNX求概率求概率的样本的样本量为量为从此总体中取一个容从此总体中取一个容设总体设总体解解 , , (1)1621是是来来自自正正态态总总体体的的样样本本因因为为XXX),()(1 2122nXnii 所所以以ex7.整理ppt 21222)(12 niiXnP于是于是 32)(1816122iiXP 32)16(82 P8)16(32)16(22 PP8)16(132)16(122 PP;94. 0 整理ppt),1()(1 (2)2122 nXXnii 因因为为 21222)(12 niiXXnP于于是是 32)(181612
43、2iiXXP 32)15(82 P32)15(8)15(22 PP.98. 0 整理ppt 三、三、 直方图直方图直方图与经验分布函数直方图与经验分布函数如前所述,数理统计所研究的实际问题(总体)的分如前所述,数理统计所研究的实际问题(总体)的分布一般来说是未知的,需要通过样本来推断但如果布一般来说是未知的,需要通过样本来推断但如果对总体一无所知,那么,做出推断的可信度一般也极对总体一无所知,那么,做出推断的可信度一般也极为有限在很多情况下,我们往往可以通过具体的应为有限在很多情况下,我们往往可以通过具体的应用背景或以往的经验,再通过观察样本观测值的分布用背景或以往的经验,再通过观察样本观测值
44、的分布情况,对总体的分布形式有个大致了解观察样本观情况,对总体的分布形式有个大致了解观察样本观测值的分布规律,了解总体测值的分布规律,了解总体X的概率密度和分布函数,的概率密度和分布函数,常用直方图和经验分布函数常用直方图和经验分布函数.整理ppt1. 直方图直方图直方图是对一组数据直方图是对一组数据x1,x2,.,xn的分布情况的图形描的分布情况的图形描述述将数据的取值范围分成若干区间(一般是等间隔的),将数据的取值范围分成若干区间(一般是等间隔的),在等间隔的情况,每个区间的长度称为组距考察这些在等间隔的情况,每个区间的长度称为组距考察这些数据落入每一个小区间的频数和频率,在每一个区间上数
45、据落入每一个小区间的频数和频率,在每一个区间上画一个矩形,它的宽度是组距,高度可以是频数、频率画一个矩形,它的宽度是组距,高度可以是频数、频率或频率或频率/组距,所得直方图分别称为组距,所得直方图分别称为频数直方图频数直方图、频率直频率直方图方图和和密度直方图密度直方图图图5-6 密度直方图密度直方图整理ppt如果数据如果数据x1,x2,.,xn是来自连续总体是来自连续总体X的样的样本观测值,其密度直方图中,每一个矩形的面本观测值,其密度直方图中,每一个矩形的面积恰好是观测数据落入对应区间的频率,这种积恰好是观测数据落入对应区间的频率,这种密度直方图可以用来估计总体的概率密度(用密度直方图可以
46、用来估计总体的概率密度(用密度直方图的顶部折线估计密度直方图的顶部折线估计X的概率密度曲的概率密度曲线)组距对直方图的形态有很大的影响,组线)组距对直方图的形态有很大的影响,组距太小或太大,直方图反映概率密度的形态就距太小或太大,直方图反映概率密度的形态就不够准确不够准确整理ppt作直方图的步骤如下:1 找出样本观测值 中的最小值与最大值,分别记作 与 ,即nxxx,21*1x*nx,min21*1nxxxxnnxxxx,max21*2 适当选取略小于 的数 与略大于 的数 , 并用分点 把区间 分成 个子区间 第 个子区间的长度为 *1xa*nxbbtttttall1210ba,lbtttt
47、ttalii,11211i1iiitttli, 2 , 1整理ppt此外,为了方便起见,分点 应比样本观测值 多取一位小数。itixlabti各子区间的长度可以相等,也可以不等;若使各子区间的长度相等,则有子区间的个数一般取为8至15个,太多则由于频率的随机摆动而使分布显得杂乱,太少则难于显示分布的特征。3 把所有样本观测值逐个分到各子区间内,并计算样本观测值落在各子区间内的频数 及频率innnfii., 2 , 1li整理pptiiiiiiifttfttS11., 2 , 1liOx4 在 轴上截取各子区间,并以各子区间为底,1iiittfiS以 为高作小矩形,各个小矩形的面积就等于样本观测
48、值落在该子区间内的频率,即所有小矩形的面积的和. 111liiliifS这样作出的所有小矩形就构成了直方图。 因为样本容量 充分大时,随机变量 落在各个子区间 内的频率近似等于其概率 即 所以直方图大致地描述了总体 的概率分布。nXiitt,1iiitXtPf1li, 2 , 1X整理pptex8. 测量100个某种机械零件的质量,得到样本观测值如下(单位:g) 246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 2
49、40 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244写出零件质量的频率分布表并作直方图。
50、整理ppt解因为样本观测中最小值为237,最大值为265,所以我们把数据的分布区间确定为(236.5,266.5)并把这个区间等分为10个子区间(236.5,239.5), ( 239.5,242.5), ( 263.5,266.5)由此得到零件质量的频率分布表: 零件质量/ 频数 频率 236.5239.5 1 0.01 239.5242.5 5 0.05 242.5245.5 9 0.09 245.5248.5 19 0.19 248.5251.5 24 0.24 251.5254.5 22 0.22 254.5257.5 11 0.11 257.5260.5 6 0.06 260.526
51、3.5 1 0.01 263.5266.5 2 0.02 总计 100 1.00ginif整理ppt直方图如图57所示图57整理ppt一个合适的分组是希望密度直方图的形态接近一个合适的分组是希望密度直方图的形态接近总体的概率密度函数的形态手工计算常取组总体的概率密度函数的形态手工计算常取组数等于数等于 左右,一些统计软件会根据样本容量左右,一些统计软件会根据样本容量和样本的取值范围自动确定一个合适的分组和样本的取值范围自动确定一个合适的分组方式,画出各种漂亮的直方图方式,画出各种漂亮的直方图n整理pptex9.从某高校一年学生的从某高校一年学生的“高等数学高等数学”课程考课程考试试成绩中,随机
52、抽取成绩中,随机抽取60名学生的成绩如下:名学生的成绩如下:试利用试利用Excel的的“数据分析数据分析”功能作学生成绩的功能作学生成绩的密度直方图,并通过直方图了解学生成绩的分密度直方图,并通过直方图了解学生成绩的分布情况布情况766971776971836985858677749566876651687377626673937963878754805772725876727669718175667460677963887885725890617077688079整理ppt 实验步骤实验步骤:(1) 确定分组个数:因为确定分组个数:因为 ,取分组个数,取分组个数为为8数据的最小值为数据的最小
53、值为51,最大值为,最大值为95,为分组,为分组方便起见,考虑范围从方便起见,考虑范围从50到到100,分为,分为8个组,组个组,组距取距取50 / 8 = 6.25,分点分别为:,分点分别为:50,56.25,62.5,68.75,75,81.25,87.5,93.75,100。整理学生。整理学生成绩数据,在成绩数据,在“组上限组上限”栏中填入各组的上限值,栏中填入各组的上限值,如图如图5-8左所示左所示75. 760 整理ppt 图图5-8 数据整理与数据整理与“直方图直方图”对话框对话框整理ppt(2)在在Excel主菜单中选择主菜单中选择“工具工具”“数据分析数据分析”,打,打开开“数
54、据分析数据分析”对话框,在对话框,在“分析工具分析工具”列表中选列表中选择择“直方图直方图”选项,单击选项,单击“确定确定”按钮按钮(3) 在打开的在打开的“直方图直方图”对话框中,依次输入(或用对话框中,依次输入(或用鼠标拖动选择)鼠标拖动选择)“输入区域输入区域”、“接收区域接收区域”和和“输出区域输出区域”,如图,如图5-8右所示,单击右所示,单击“确定确定”按按钮钮 得到频率分布的结果如图得到频率分布的结果如图5-9左所示左所示整理ppt图图5-9 计算各组频率与密度计算各组频率与密度整理ppt(4) 计算密度:在单元格区域计算密度:在单元格区域J2:J9中依次输入组域名:中依次输入组域名:50-56.25、56.25-62.5、62.5-68.75、68.75-75、75-81.25
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论