




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 数理统计的基础知识数理统计的基础知识 统计中的基本概念(总体和样统计中的基本概念(总体和样本本) 几个常用的分布和抽样分布几个常用的分布和抽样分布概率论与数理统计的关系 概率论是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学判断,对这种出现的可能性大小做出数量上的描述;比较这些可能性的大小、研究它们之间的联系,从而形成一整套数学理论和方法。 数理统计是应用概率的理论来研究大量随机现象的规律性;对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明;并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是
2、否能以相当大的概率来保证某一判断是正确的,并可以控制发生错误的概率。 5.1 数理统计的基本概念数理统计的基本概念从本质上讲,总体就是所研究的随机变量的分从本质上讲,总体就是所研究的随机变量的分布。即一个具有确定概率分布的随机变量。布。即一个具有确定概率分布的随机变量。一一、总体(母体)总体(母体) 在数理统计中,把所研究的对象的全体称为在数理统计中,把所研究的对象的全体称为总体总体。通常指研究对象的某项数量指标,一般记为通常指研究对象的某项数量指标,一般记为X。 把总体的每一个基本单位称为把总体的每一个基本单位称为个体个体。如某批灯泡的寿命如某批灯泡的寿命X X,全体在校生的身高,全体在校生
3、的身高Y Y。对不同的个体,对不同的个体,X的取值是不同的。的取值是不同的。X是一个随机变量是一个随机变量或随机向量或随机向量。X或或Y的分布也就完全描述了我们所关心的分布也就完全描述了我们所关心的指标,即总体的分布。为方便起见,我们将的指标,即总体的分布。为方便起见,我们将X的可能的可能取值的全体组成的集合称为总体,或直接称取值的全体组成的集合称为总体,或直接称X为总体。为总体。X的分布也就是总体的分布的分布也就是总体的分布。二、随机样本二、随机样本从总体从总体X中抽出若干个个体称为中抽出若干个个体称为样本样本,一般记为一般记为(X1,X2,Xn)。n称为称为样本容量(或样本大小)样本容量(
4、或样本大小)。而对这。而对这n个个体的一次具体的观察结果个个体的一次具体的观察结果(x1,x2,xn)是完全是完全确定的一组数值,但它又随着每次抽样观察而改变。确定的一组数值,但它又随着每次抽样观察而改变。(x1,x2,xn)称为称为样本样本观察观察值值。如果样本如果样本(X1,X2,Xn)满足满足(1)代表性:样本的每个分量代表性:样本的每个分量Xi与总体与总体X有相同的分布;有相同的分布;(2)独立性:独立性: X1,X2,Xn是相是相互独立的随机变量,互独立的随机变量,则称样本则称样本(X1,X2,Xn)为为简单简单随机样本随机样本。1设总体设总体X的分布为的分布为F(x),则样本则样本
5、(X1,X2,Xn)的联合分布为的联合分布为),(),(221121nnnxXxXxXPxxxF)()()(2211nnxXPxXPxXPniinxFxFxFxF121)()()()(2当总体当总体X是离散型时,其分布律(离散总体密度)为是离散型时,其分布律(离散总体密度)为kk)(pxXP, 2 , 1k 样本的联合分布律(离散样本密度)为样本的联合分布律(离散样本密度)为)()()(),(22112211nnnnxXPxXPxXPxXxXxXPniiniixxXP11i)(p)(3当总体当总体X是连续型时,是连续型时, Xf(x)(连续总体密度)连续总体密度),则样本的联合密度(连续样本密
6、度则样本的联合密度(连续样本密度)为为niinxfxxxf121)(),(例例5.2 设某电子产品的寿命设某电子产品的寿命X服从指数分布,密度函数服从指数分布,密度函数000)(xxexfx(X1,X2,Xn)为为X的一个样本,求其密度函数。的一个样本,求其密度函数。解解 因为因为(X1,X2,Xn)为为X的一个样本,的一个样本,)(iixfXniinxfxxxf121)(),(其他0), 2 , 1(01nixeinixi其他0), 2 , 1(01nixeixnnii例例5.3 某商场每天客流量某商场每天客流量X服从参数为服从参数为的泊松分布,的泊松分布,求其样本求其样本(X1,X2,Xn
7、)的联合分布律。的联合分布律。解解exxXPx!)(, 2 , 1 , 0 xniinnxXPxXxXxXP1i2211)(),(niixexi1!nnxexxxnii!211三、分组数据统计表与频率直方图三、分组数据统计表与频率直方图1、分组数据表分组数据表(1)组距:若样本值过多时,可将其分为若干组。组距:若样本值过多时,可将其分为若干组。 分组的区间长度一般取成相等,称区间的长度为组距。分组的区间长度一般取成相等,称区间的长度为组距。(2)组频数:区间所含的样本值个数称为该区间的组频数)组频数:区间所含的样本值个数称为该区间的组频数。(3)组频率:组频数与总的样本容量之比称为组频率。)组
8、频率:组频数与总的样本容量之比称为组频率。2、频率直方图频率直方图 它能够直观地反应出组频率的分布它能够直观地反应出组频率的分布四、经验分布函数四、经验分布函数。()为经验分布函数称发生频率是相同的。次独立重复的试验中的在与事件函数的样本值的频率为则不大于若可按大小次序排列成的样本的样本值为的一个容量为设总体定义nxXxx1xxxn/kxx0)x(F. n/kx,xxx.xxxxx,xnX(n)1k()k()1(n)1k()k()n()2()1(n21五、统计量五、统计量 样本是我们进行分析和推断的起点,但实际上我样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进
9、行们并不直接用样本进行推断,而需对样本进行“加工加工”和和“提炼提炼”,将分散于样本中的信息集中起来,为此,将分散于样本中的信息集中起来,为此引入统计量的概念。引入统计量的概念。 (X1,X2,Xn)g(X1,X2,Xn)其中其中g(x1,x2,xn)是是(x1,x2,xn)的连续函数。的连续函数。如果如果g(X1,X2,Xn)中中不含有未知参数不含有未知参数,称,称g(X1,X2,Xn)为统计量。为统计量。(不含未知参数的样本的函数)(不含未知参数的样本的函数)几个常用的统计量几个常用的统计量样本均值样本均值niiXnX11样本方差样本方差niiXXnS122)(11样本均方差(样本标准差样
10、本均方差(样本标准差niiXXnS12)(11样本样本k阶原点矩阶原点矩nikikXnA11, 2 , 1knikikXXn1)(1B, 2 , 1k样本样本k阶中心矩阶中心矩5.2 常用统计分布常用统计分布(一一) 2分布分布1、定义:、定义: 设设X1,X2,Xn为取自总体为取自总体N(0,1)的样本,则的样本,则一、常用分布一、常用分布 2分布、分布、 t 分布和分布和F分布。分布。 )(2122nXnii称为自由度为称为自由度为n的的 2分布。分布。n个相互独立的服从标准正态分布的随机变个相互独立的服从标准正态分布的随机变量的平方和服从量的平方和服从 2(n)。 2分布的密度函数分布的
11、密度函数f(y)曲线曲线0, 00,)(212)2/(212/yyeyyfynnn例例5.4 ),(2NX(X1,X2,X3)为为X的一个样本的一个样本求求232221XXX的分布。的分布。解解 因为因为(X1,X2,X3)为为X的一个样本的一个样本则则) 1 , 0( NXii=1,2,3)3(2232221XXX例例5.5 )1 , 0( NX(X1,X2,X6)为为X的一个样本的一个样本求常数求常数C使得使得CY服从服从 2分布。分布。26542321)XXX()XXX(Y解解 因为因为(X1,X2X6)为为X的一个样本的一个样本,XiN(0,1),i=1,26则则) 3 , 0 (N)
12、XXX(3 , 0 (N)XXX(654321)) 1 , 0(N3XXX1 , 0(N3XXX654321)) 2()3XXX()3XXX(226542321所以,取常数所以,取常数C=1/3使得使得CY服从服从 2分布分布性质1. 若X2(n),则E(X)=n,D(X)=2n证明:性质2.(分布可加性):若X2(n1),Y2(n2),X与Y独立,则 X + Y2(n1+n2 )1)(, 0)(),1 , 0(,X12iiiniiXDXENXXnXDXEXEXEXEEniiiniiniinii)()()()()()X(12121212nXEXEXDXDDniiniiniinii2) 13()
13、()()()()X(1221412123、 2分布表及有关计算分布表及有关计算设设)(2nP)(2n称为水平为称为水平为的上的上侧侧分位数分位数)(2n307.18)10(382.34)25(205.021.0查表得22)1-2n(u21)n(n充分大时,近似有当为整体记号)(2n例例5.6 总体总体XN(,2),(X1,X2,X16)为一个样本,求为一个样本,求161222)(1612iiXP解解),(2NXi) 1 , 0( NXi16, 2 , 1i)16(21612iiX161222)(1612iiXP16)16(82P70. 095. 0125. 01)8)16(P(1)16)16(
14、P(18)16(16)16(2222PP1、定义、定义 若若XN(0, 1),Y 2(n),X与与Y独立,则独立,则).(ntnYXT t(n)称为自由度为称为自由度为n的的t分布。分布。(二二) t分布分布例例5.6 ),(2NX(X1,X2,X3)为为X的一个样本,求的一个样本,求23221)()()(2XXX的分布的分布),(2NXi) 1 , 0( NXii=1,2,3)2(22322XX)2(223221tXXX) 1 , 0(1NX)2()()()(223221tXXX解解t(n) 的概率密度为的概率密度为tntnnntfn,)1 ()2()21()(2122、基本性质、基本性质:
15、 (1) f(t)关于关于t=0(纵轴纵轴)对称;对称;(2) f(t)的极限为的极限为N(0,1)的密度函数,即的密度函数,即 3、t分布表及有关计算分布表及有关计算 设设 Tt(n) PT= xettftn,21)()(lim22的上侧分位数分布的水平为称t(n)(tn注注:)()(1ntnt)(1nt)(ntT分布的双侧分位数分布的双侧分位数2)n(-tTP,2)n(tTP22即:的双侧分位数。分布的水平为为称t(n)n(t)n(tTP22)45nu)n(tn (通常充分大以后当例例5.7.设总体设总体X服从服从N(0,1),样本样本X1,X2Xn来自总体来自总体X,试试求常数求常数c使
16、统计量使统计量 服从服从t-分布分布.25242321)(XXXXXc3/2ct(3) 服从)(相互独立又因为服从服从服从服从解:3/2,)3()1 ,0(,)1 ,0(2)2,0(2524232121225242325,4321121XXXXXYYXXXYNXXXNXXYNXX例例5.8.设随机变量设随机变量X服从服从N(2,1),随机变量,随机变量Y1 ,Y2 ,Y3, Y4均均服从服从N(0,4),且它们相互独立,令且它们相互独立,令求求(1)T的分布的分布24232221YYYY)2(4TX.01. 0tTPt )2(00使得4 , 3 , 2 , 1i),1 , 0(N2Y)4 ,
17、0(NY) 1 , 0(N2X) 1 , 2(NXii解:)4()2Y()2Y()2Y()2Y(224232221)4( t4/)4YYYY(216YYYY2YYYY)2(4T242322212423222124232221XXX6041. 4)4(t)4(tt01. 0tT(2)P005. 0200(三三) F分布分布1、定义、定义 若若X 2(m),Y 2(n) ,X,Y独立,则独立,则),m(mnFnYXF 称为第一自由度为称为第一自由度为m ,第二自由度为第二自由度为n的的F分布分布,其概率密度为其概率密度为0, 00,)m1)(2n()()/m)(2m()(2/ )m(2m12m2/
18、myyynynnyhn例例5.9 (X1,X2,X5)为取自正态总体为取自正态总体XN(0,2)的样本,的样本,求统计量求统计量)(2)(32524232221XXXXX的分布的分布解解), 0(2NXi)5 , 2 , 1(i) 1 , 0(0NXXii)2(22221XX) 3(2252423XXX)3 , 2(322524232221FXXXXX)3 , 2()(2)(32524232221FXXXXX2、设、设 FF(m,n) 如果如果PF= 称称 =F(m,n)为为F(m,n)分布分布的水平的水平上侧分位数上侧分位数(2)FF(n1,n2),则则),(1),()3(12121nnFn
19、nF3 F3 F分布的性质分布的性质),(112nnFF)n, 1 (FX),n( tX) 1 (2则若357.080.21)12,9(1)12,9(1)9 ,12(.eg0.0595.0195.0FFFHomework P142 3,4设设(X1,X2,Xn)是正态总体是正态总体N(,2)的样本,则的样本,则 (1)nNX2,(2) 1()XX(1) 1(2n1i2i222nSn(3)X与与S2独立独立(4)()X(12n1i2i2n5.3 5.3 抽样分布抽样分布: :统计量的分布统计量的分布(- -)单正态总体)单正态总体(5)1(ntnSX证明证明 (X1,X2,Xn)是正态总体是正态
20、总体N(,2)的样本,的样本,则由则由1、2可知可知) 1 , 0( NnX) 1() 1(222nSnX与与S2独立独立且且所以由所以由t分布的定义,可知分布的定义,可知) 1() 1() 1(22ntnSXnSnnX例例5.105.10.设设X X1 1, X X2 2 ,X X2525是取自是取自N N(2121,4)4)的样本的样本, , 求(求(1 1)样本均值的数学期望和方差;)样本均值的数学期望和方差;24.021-XP)2()254,21(NX25n),4,21(NX4514. 01)6 . 0(26 . 04 . 021-X24. 021-X) 1 , 0(N0.421-X)
21、16. 0 ,21(NXPP16. 0254)XD(,21)X(E解解:例例5.115.11.设设X X1 1, ,X X1010是取自是取自N N(2 2,16)16)的样本的样本, , 求求a a。解:解:95. 0252 aSP 10122)(91iiXXS)9(16922 S95. 0409169140916925222aSPaSPaSP919.16)9(409250 . 0a196.75 a例例5.12 5.12 设设X X1 1,X X2 2, , ,X X8 8 是取自是取自N(1,9)N(1,9)的样本的样本, ,求样本方差求样本方差 S S2 2的期望与方差。的期望与方差。解:解: 8122)(71iiXXS)7(9722 S7)(97)97(22 SESE9)(2 SE14)(8149)97(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论