精选数理统计的基础知识讲解讲义_第1页
精选数理统计的基础知识讲解讲义_第2页
精选数理统计的基础知识讲解讲义_第3页
精选数理统计的基础知识讲解讲义_第4页
精选数理统计的基础知识讲解讲义_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(优选)数理统计的基础知识ppt讲解现在是1页\一共有69页\编辑于星期四

数理统计是研究统计工作一般原理和方法的科学,它主要阐述搜集、整理、分析统计数据,并据以对研究对象进行统计推断的理论和方法,是统计学的核心和基础。数理统计的任务就是在概率论的基础上研究怎样以有效的方式收集、整理和分析可获得的、有限的、带有随机性的数据资料,对所考察问题的统计规律性尽可能作出精确而可靠的推断或预测,为采取一定的决策和行动提供依据和建议。现在是2页\一共有69页\编辑于星期四

数理统计与概率论是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象。但在研究问题的方法上有很大区别:概率论——已知随机变量服从的分布规律,寻求分布的性质、数字特征、及其应用;

数理统计

——通过对实验数据的统计分析,寻找所服从的分布和数字特征,从而推断整体的规律性.

数理统计的核心问题——由样本推断总体现在是3页\一共有69页\编辑于星期四统计推断数理统计的一般步骤:数据资料的收集数据的整理、分析现在是4页\一共有69页\编辑于星期四4.1总体与样本4.2统计量4.3常用的统计分布4.4抽样分布现在是5页\一共有69页\编辑于星期四§4.1总体与样本一、总体与总体分布

二、样本与样本分布

三、统计推断问题简述

现在是6页\一共有69页\编辑于星期四一、总体与样本研究某批灯泡的质量…考察国产轿车的质量总体总体1、总体与个体;总体分布具有一定的共同属性的研究对象全体.总体:总体中每个对象或成员。个体:现在是7页\一共有69页\编辑于星期四

然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.

该批灯泡寿命的全体就是总体。灯泡的寿命国产轿车每百公里的耗油量

所有国产轿车每百公里耗油量的全体就是总体。现在是8页\一共有69页\编辑于星期四

由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。

从而可把此种数量指标看作随机变量,我们用一个随机变量或其分布来描述总体。现在是9页\一共有69页\编辑于星期四一、总体与总体分布定义41(总体与总体分布)

统计学中称随机变量(或向量)X为总体并把随机变量(或向量)X的分布称为总体分布

(1)表示总体的X既可以是随机变量也可以是随机向量如果当事者关心的不是个体的一项数量指标而是两项或两项以上的数量指标时

X便是随机向量

但为简化讨论本书只限于考察一项数量指标的情形这样今后总体指的皆是随机变量说明现在是10页\一共有69页\编辑于星期四一、总体与总体分布

(2)有时个体的特性本身不是直接由数量指标来描述的我们仍可用一个随机变量X来表示个体的定性指标皆可转化成一个数量指标从而也就可设定一个随机变量来表示所研究的总体

定义41(总体与总体分布)

统计学中称随机变量(或向量)X为总体并把随机变量(或向量)X的分布称为总体分布

说明现在是11页\一共有69页\编辑于星期四一、总体与总体分布

(3)总体分布就是设定的表示总体的随机变量X的分布总体的分布一般说来是未知的

已知总体分布的类型但不知这些分布中所含的参数

有时甚至连分布所属的类型也不能肯定

统计学的主要任务正是要对总体的未知分布进行推断

定义41(总体与总体分布)

统计学中称随机变量(或向量)X为总体并把随机变量(或向量)X的分布称为总体分布

说明现在是12页\一共有69页\编辑于星期四二、样本与样本分布定义42(简单随机样本)

称(X1

X2

Xn)为总体X的简单随机样本若X1

X2

Xn是独立同分布的随机变量且与总体X同分布

样本中所含分量的个数n称为该样本的容量

代表性:要求样本中的每一分量Xi与总体X同分布表明抽样观察时每一个体都是从同一总体中抽取的

独立性:要求样本中诸分量是独立的则表明每一观察结果既不影响其他观察结果也不受其他观察结果的影响

获得上述简单随机样本的方法称为简单随机抽样

说明现在是13页\一共有69页\编辑于星期四样本与样本值

在未观察具体的抽样结果时应把样本(X1

X2

Xn)视为一个随机向量在观察具体的抽样结果后样本便理解为所得的一组具体的观察值(x1

x2

xn)

今后约定以大写的英文字母Xi表示随机变量而以相应的小写英文字母xi表示它的观察值并称样本(X1

X2

Xn)的一组具体的观察值(x1

x2

xn)为样本值全体样本值组成的集合称为样本空间(总体规模很大)现在是14页\一共有69页\编辑于星期四样本分布

设总体X的分布函数为F(x)

则样本(X1

X2

Xn)的分布函数为称之为样本分布

若总体X为连续型随机变量其密度函数为f(x)

则样本的密度函数为样本与样本值

在未观察具体的抽样结果时应把样本(X1

X2

Xn)视为一个随机向量在观察具体的抽样结果后样本便理解为所得的一组具体的观察值(x1

x2

xn)

现在是15页\一共有69页\编辑于星期四

若总体X为离散型随机变量概率分布为p(x)P{Xx}

x取遍X所有可能取值则样本的概率分布为样本分布

设总体X的分布函数为F(x)

则样本(X1

X2

Xn)的分布函数为称之为样本分布

样本与样本值

在未观察具体的抽样结果时应把样本(X1

X2

Xn)视为一个随机向量在观察具体的抽样结果后样本便理解为所得的一组具体的观察值(x1

x2

xn)

现在是16页\一共有69页\编辑于星期四

例41

称总体X为正态总体如它服从正态分布设总体X服从正态分布N(

2)

则样本(X1

X2

Xn)的密度函数为现在是17页\一共有69页\编辑于星期四

例42

称总体X为伯努利总体如果它服从以p(0p1)为参数的伯努利分布即

P{X1}p

P{X0}1p则样本(X1

X2

Xn)的概率分布为其中ik(1kn)取1或0

而sni1i2

in

它恰等于样本中取值为1的分量之总数

现在是18页\一共有69页\编辑于星期四

例43

设总体X服从参数为的泊松分布

则样本(X1

X2

Xn)的概率分布为

其中ik(1kn)取非负整数而sni1i2

in

现在是19页\一共有69页\编辑于星期四三、统计推断问题简述

统计学要解决的问题是借助总体X的一个样本(X1

X2

Xn)

对总体X的未知分布进行推断我们把这类问题统称为统计推断问题

为利用样本对未知的总体分布进行推断我们需借助样本构造样本的适当的函数正是利用这些函数所反映的总体分布的信息来对:总体分布所属的类型总体分布中所含的未知参数作出统计推断现在是20页\一共有69页\编辑于星期四§4.2统计量一、统计量的定义二、常用的统计量三、枢轴量

现在是21页\一共有69页\编辑于星期四一、统计量的定义定义4.3(统计量)

设(X1

X2

Xn)为总体X的一个样本称此样本的任一不含总体分布未知参数的函数为该样本的统计量

例44

设(X1

X2

Xn)为正态分布总体X~N(5

2)的一个样本

2未知

但U不是该样本的统计量

则Sn与X均为样本(X1

X2

Xn)的统计量

令现在是22页\一共有69页\编辑于星期四是不是补充例1设(X1,X2,X3)是来自总体N(μ,σ2)的一个样本,其中μ已知,σ2未知,判断下列各式哪些是统计量,哪些不是?现在是23页\一共有69页\编辑于星期四二、常用的统计量1

样本均值2

样本方差

设(X1

X2

Xn)为总体X的一个样本令2和S2分别为样本的未修正样本方差和修正样本方差

并称S0现在是24页\一共有69页\编辑于星期四3

样本标准差

设(X1

X2

Xn)为总体X的一个样本样本标准差S定义为样本方差的算术平方根即4

样本原点矩

设(X1

X2

Xn)为总体X的一个样本记并称Ak为样本的k阶原点矩

显然一阶原点矩即为样本均值因此可把样本原点矩视为样本均值概念的推广

现在是25页\一共有69页\编辑于星期四5

样本中心矩

显然二阶中心矩即为未修正样本方差因此可把样本中心矩视为未修正样本方差概念的推广

设(X1

X2

Xn)为总体X的一个样本记并称Bk为样本的k阶中心矩现在是26页\一共有69页\编辑于星期四样本矩具有下列性质:性质现在是27页\一共有69页\编辑于星期四6

顺序统计量

设(X1

X2

Xn)为总体X的一个样本将样本中的诸分量按由小到大的次序排列成

X(1)X(2)

X(n)

则称(X(1)X(2)

X(n))为样本的一组顺序统计量称X(i)为样本的第i个顺序统计量

特别地称X(1)min(X1

X2

Xn)与X(n)max(X1

X2

Xn)分别为样本极小值与样本极大值并称X(n)X(1)为样本的极差

现在是28页\一共有69页\编辑于星期四三、枢轴量

例45

设总体X~N(

0)

其中0已知

未知

(X1

X2

Xn)为总体X的一个样本

2

2则样本函数U是一枢轴量

设(X1

X2

Xn)为总体X的样本

为总体中一个未知参数我们把一个仅含未知参数并且其分布已知的样本函数U(X1

X2

Xn

),称为枢轴量

现在是29页\一共有69页\编辑于星期四§43常用的统计分布一、分位数

二、

2分布

三、F分布

四、t分布

现在是30页\一共有69页\编辑于星期四一、分位数

定义44(上侧分位数)

设随机变量X的分布函数为F(x)

给定实数(01)

如果实数F满足

P{XF

}(46)即1F(F

)=或F(F

)=1-(4.7)则称F为随机变量X的分布的水平为的上侧分位数.或直接称为分布函数F(x)的水平的上侧分位数

现在是31页\一共有69页\编辑于星期四

如果F(x)是严格单调递增的,那么其水平的上侧分位数F为:

F=F-1(1-)(4.8)

当X是连续型随机变量时设其密度函数为f(x)

则其水平的上侧分位数F

满足两个等式:现在是32页\一共有69页\编辑于星期四一、分位数

定义45(双侧分位数)

设X是对称分布的连续型随机变量其分布函数为F(x)

给定实数(01)

如果正实数T满足

P{|X|T

}(412)即F(T

)F(T

)1(413)则称T

为分布函数F(x)的水平的(双侧)分位数

现在是33页\一共有69页\编辑于星期四由于对称性(见教材45页第13题,或习题四的第6题)对于具有对称密度函数的分布函数的上侧分位数,恒有现在是34页\一共有69页\编辑于星期四标准正态分布的分位数用u表示标准正态分布N(01)的水平的上侧分位数则u满足

10(u)

即0(u)1(49)

例46

设005

求标准正态分布的水平005的上侧分位数和双侧分位数

水平005的上侧分位数为u005

它满足

0(u005)1005095

查附表2得u0051645

现在是35页\一共有69页\编辑于星期四标准正态分布的分位数用u表示标准正态分布N(01)的水平的上侧分位数则u满足

10(u)

即0(u)1(49)

例46

设005

求标准正态分布的水平005的上侧分位数和双侧分位数

水平005的双侧分位数为u0025

它满足

0(u0025)100250975

查附表2得

u0025196

现在是36页\一共有69页\编辑于星期四二、

2分布

命题41

如果随机变量X的密度函数由上式给出则称X服从以n为自由度的2分布

现在是37页\一共有69页\编辑于星期四定义46(2分布)

如果随机变量X的密度函数为则称X服从以n为自由度的2分布记作X~2(n)

根据命题41若X1

X2

Xn是n个相互独立的标准正态随机变量则说明现在是38页\一共有69页\编辑于星期四现在是39页\一共有69页\编辑于星期四说明见教材71~72页例2.29见教材73~74页练习2-5的第6题现在是40页\一共有69页\编辑于星期四教材上说:为什么?请读者思考中心极限定理现在是41页\一共有69页\编辑于星期四命题42(1)

2分布的可加性:若X~

2(m)

Y~

2(n)

且X与Y相互独立则XY~

2(mn)

(2)若X~

2(n)

则EXn

DX2n

现在是42页\一共有69页\编辑于星期四现在是43页\一共有69页\编辑于星期四

2分布的分位数

附表3中对自由度n45的

2分布给出了水平的上侧分位数之值

当X~

2(n)时有

例如设X~

2(10)

取水平005

查表可知

P{X18307}P{X3940}

005

P{3247X20483}095

现在是44页\一共有69页\编辑于星期四

当自由度n充分大时

2分布可近似地看作正态分布于是由正态分布的分位数可近似地求得

2分布的分位数

2分布的分位数

附表3中对自由度n45的

2分布给出了水平的上侧分位数之值

当X~

2(n)时有现在是45页\一共有69页\编辑于星期四现在是46页\一共有69页\编辑于星期四三、F分布

命题43

设X~

2(m)

Y~

2(n)

且X与Y相互独立记则Z的密度函数为

如果随机变量X的密度函数由(420)给出则称X服从第一自由度为m

第二自由度为n的F分布

现在是47页\一共有69页\编辑于星期四定义47(F分布)

如果随机变量X的密度函数为则称X服从第一自由度为m

第二自由度为n的F分布记作X~F(m

n)

由命题43不难推知若X~F(m

n)

则X

1~F(n

m)

现在是48页\一共有69页\编辑于星期四

由于X为非负随机变量,其密度函数自然不是对称函数。因此,对F分布而言,也不存在双侧分位数。但在统计推断中常使用如下关系式:现在是49页\一共有69页\编辑于星期四

当X~F(m

n)时有

P{XF(m

n)}P{XF1(m

n)}

附表4中对一些充分小的值列出了F分布的水平的上侧分位数F(m

n)之值

F分布的分位数

例如设X~F(510)

查表4知

P{X333}005

P{X424}0025

又设Y~F(105)

查表可得

P{Y474}005

P{Y662}0025

现在是50页\一共有69页\编辑于星期四

当X~F(m

n)时有

P{XF(m

n)}P{XF1(m

n)}

附表4中对一些充分小的值列出了F分布的水平的上侧分位数F(m

n)之值

F分布的分位数

由(421)式知

当接近于1时可利用下式求出所需的上侧分位数现在是51页\一共有69页\编辑于星期四

当X~F(m

n)时有

P{XF(m

n)}P{XF1(m

n)}

附表4中对一些充分小的值列出了F分布的水平的上侧分位数F(m

n)之值

F分布的分位数

当接近于1时可利用下式求出所需的上侧分位数

例如当X~F(510)时查表可知现在是52页\一共有69页\编辑于星期四四、t分布

命题44

设X~N(01)

Y~

2(n)

且X与Y相互独立记则T的密度函数为

如果随机变量的密度函数由(423)给出则称其为服从自由度为n的t分布现在是53页\一共有69页\编辑于星期四定义48(t分布)

如果随机变量X的密度函数为则称X服从自由度为n的t分布记作X~t(n)

当自由度n很大时

t分布接近于标准正态分布这是因为现在是54页\一共有69页\编辑于星期四(A)Y~2(n)

(B)Y~2(n1)(C)Y~F(n1)(D)Y~F(1

n)由于X

2~F(1

n)

答(C)

现在是55页\一共有69页\编辑于星期四t分布的分位数附表5对于一些充分小的值给出了t分布的水平的上侧分位数t(n)之值

当X~t(n)时有

P{Xt(n)}P{Xt(n)}

P{|X|t/2(n)}

例如设X~t(8)

005

查表可知

t(8)1860

t/2(8)2306

故有P{|X|2306}005

P{X1860}P{X1860}现在是56页\一共有69页\编辑于星期四t分布的分位数附表5对于一些充分小的值给出了t分布的水平的上侧分位数t(n)之值

当接近1时可按下式求出相应的上侧分位数

t(n)t1(n)(424)

当X~t(n)时有

P{Xt(n)}P{Xt(n)}

P{|X|t/2(n)}

此外由于自由度n充分大时

t分布近似于标准正态分布故有t(n)u

现在是57页\一共有69页\编辑于星期四§44抽样分布一、正态总体的抽样分布

二、一般总体抽样分布的极限分布

现在是58页\一共有69页\编辑于星期四一、正态总体的抽样分布

定理41

设总体X~N(

2)(X1

X2

Xn)是其容量为n的一个样

有了正态总体的样本均值与样本方差的抽样分布便可容易地构造出单正态总体与双正态总体中样本的一些统计量(或枢轴量)

并使之服从确定的已知分布

现在是59页\一共有69页\编辑于星期四说明定理42(单正态总体的抽样分布)

设(X1

X2

Xn)为正态总体X~N(

2)的样本

X与S2分别为该样本的样本均值与样本方差则有

当与2都已知时定理42中提及的三个样本函数方可视为样本的统计量

现在是60页\一共有69页\编辑于星期四说明定理42(单正态总体的抽样分布)

设(X1

X2

Xn)为正态总体X~N(

2)的样本

X与S2分别为该样本的样本均值与样本方差则有为一枢轴量它们可用于对未知参数与

2作统计推断

现在是61页\一共有69页\编辑于星期四

结论(1)是定理41(1)的直接推论

结论(2)已由定理41给出

再因定理42

设(X1

X2

Xn)为正态总体X~N(

2)的样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论