本科《统计学》课件NO4_第1页
本科《统计学》课件NO4_第2页
本科《统计学》课件NO4_第3页
本科《统计学》课件NO4_第4页
本科《统计学》课件NO4_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 统计推断理论精要熟悉随机变量及其分布;掌握正态分布的意义、特点和性质,以及标准正态分布;学习目标了解2分布、t分布、F分布;掌握大数定律和中心极限定理。目录第一节 随机变量及其分布第二节 正 态 分 布第三节 其他常用分布第四节 大数定律和中心极限定理第一节 随机变量及其分布一、 随机变量(一) 随机试验与随机事件随机试验(E)是指具有以下三个特征的试验:(1) 试验可在相同的条件下重复进行。(2) 每次试验的结果具有多种可能性,但在试验之前可确知试验的所有可能结果。(3) 每次试验前不能确定哪个结果会出现。1.随机试验一、 随机变量(一) 随机试验与随机事件所谓随机事件(以下简称事件

2、),是指随机试验的每一个可能的结果。换言之,在一次随机试验中可能出现也可能不出现的事件就是随机事件。在概率中,随机事件通常用A、B、C等大写字母来表示。2.随机事件 复合事件是指由两个或两个以上的基本事件组成的集合 基本事件是指随机试验的每一个可能的结果,即不能被分解成其他事件组合的最简单的、最基本的事件。 必然事件是指随机事件必然会出现的结果。 不可能事件是指随机事件不可能出现的结果。(1) 事件的类型 事件的关系a.若事件A的每一个基本事件都包含在事件B中,则称事件B包含事件A,或者事件A包含于事件B,记为AB或BA。 AB 表明事件A的发生必导致事件B的发生。b.如果AB且BA,则称事件

3、A与事件B相等,记为A=B。c.由或属于事件A或属于事件B的一切基本事件组成的事件称为事件A与事件B的总和,记为AB,表明事件A与事件B至少有一个发生。(2) 事件的关系与运算法则(2) 事件的关系与运算法则 事件的关系d.由事件A与事件B中共同的基本事件组成的事件称为事件A与事件B的交集,记为AB或AB,表明事件A与事件B同时发生。e.由一切属于事件A但不属于事件B的基本事件组成的事件称为事件A与事件B的差,记为A-B=A ,表明事件A发生而事件B不发生。(2) 事件的关系与运算法则 事件的关系f.样本空间(随机试验的所有可能结果组成的集合)中一切不属于事件A的基本事件所组成的事件称为事件A

4、的对立事件,记为A,表明事件A不发生。A的对立事件就是原来的事件A,即 =A。所以,对立事件是相互的,必然事件U与不可能事件互为对立事件。g.若事件A与事件B没有共同的基本事件,则称事件A与事件B互不相容,记为AB= ,表明事件A与事件B不可能同时发生。若AB ,则称事件A与事件B是相容的。(2) 事件的关系与运算法则 事件的运算法则事件的运算规律和集合的运算规律完全相同,具体如下:a.交换律:AB=BA,AB=BA。b.结合律:A(BC)=(AB)C,(AB)C=A(BC)。c.分配律:(AB)C=ACBC,(AB)C=(AC)(BC)。d.对偶律: 。可推广到n个事件的情形 一、 随机变量

5、(二) 随机事件的概率一次随机试验有许多可能的结果,通常人们不仅想知道都有哪些可能的结果,还想知道某种结果出现的可能性,并希望将这一可能性用数值表示出来。因为对于随机事件来说,虽然在一次试验中是否发生不能事先预知,但在相同条件下大量地重复进行这一试验就会发现不同事件发生的可能性有大小之分。在概率论中,随机事件发生可能性的数值称为随机事件的概率。一、 随机变量(二) 随机事件的概率1.古典概型随机试验下的概率古典概型随机试验(以下简称古典概型)特点:(1) 它的样本空间()中的基本事件只有有限个,即只包含有限个样本点。(2) 每个基本事件出现的可能性相同。也就是说,每个样本点出现的可能性相同。古

6、典概型下事件A的概率计算如下:一、 随机变量(二) 随机事件的概率2.概率的统计定义在相同的条件下重复进行一次试验,事件A发生的频率m/n在某一常数值p附近摆动。一般来说,n越大,摆动幅度越小,逐渐趋于稳定。这一频率的稳定值p被称为事件A发生的概率,记为P(A)=p。很显然,0p1。一、 随机变量(二) 随机事件的概率2.概率的统计定义概率的统计定义看起来比较容易理解,但是同样存在一些问题:不能肯定重复n+1次试验的频率一定比重复n次试验的频率更精确;在实践中也不可能对每个事件都做大量的重复试验以求得频率的稳定性。一、 随机变量(二) 随机事件的概率3.主观概率主观概率又称个人判断概率,是一个

7、有理智的人对某一具体事件置信程度的计量。主观概率有以下两个特点:(1) 依赖于观察者,对于同一问题,不同的人所做出的概率判断可能不尽相同,但这并不意味着主观概率的数值可以随意确定。(2) 主观概率数值的确定是建立在个人对所研究问题具有丰富的经验、深厚的理论知识和明智的判断力基础之上的。一、 随机变量(三) 随机变量的含义设是随机试验的样本空间,w是样本点。 如果试验的每一个可能结果都有唯一的实数X()与之对应,那么称X()为定义在上的随机变量,简记为X。随机变量通常用大写字母X,Y,Z等表示。一、 随机变量(三) 随机变量的含义取值的随机性,即事先不能确定随机变量取哪个值;取值的统计规律性,即

8、完全可以确定随机变量取某个值或在某一个区间内取值的概率。随机变量有以下两个特性:一、 随机变量(三) 随机变量的含义1.离散型随机变量若样本空间包括有限个可能结果,就将这个样本空间称为离散的样本空间,将与离散的样本空间相对应的随机变量称为离散型随机变量。也就是说,离散型随机变量的取值为有限个或可数个,也可能是一个无限的整数数列,如从一批产品中抽取到次品的个数、某景点每日接待的游客人数、每日进出家乐福超市的总人数等。随机变量根据取值特点的不同分类一、 随机变量(三) 随机变量的含义2.连续型随机变量连续型随机变量的取值为实数轴上的某一区间,如水稻的亩产、电视机的寿命等。随机变量根据取值特点的不同

9、分类二、 概率分布概率分布表明随机变量分布的规律,具有一般的意义,所以可以称为理论分布。由于常用的随机变量有离散型随机变量和连续型随机变量两类,因此,常用的随机变量概率分布也有离散型随机变量概率分布和连续型随机变量概率分布之分。二、 概率分布(一) 离散型随机变量概率分布假设离散型随机变量X的一切可能值为x1,x2,x3且X取xk的概率为pk,则称pk=P(X=xk)(k=1,2,3)为离散型随机变量X的概率分布。有时,概率分布列成表格形式,也称为分布列,如表4-3所示。二、 概率分布(一) 离散型随机变量概率分布根据概率的性质,离散型随机变量概率分布具有以下两个基本性质:当离散型随机变量取任

10、何值时,其概率都不会是负数,即pk0;当离散型随机变量取遍所有可能值时,其概率之和等于1,即 。二、 概率分布(一) 离散型随机变量概率分布0-1分布记为xB(1,p),概率分布公式如下:0-1分布1二、 概率分布(一) 离散型随机变量概率分布二项分布记为XB(n,p),概率分布分公式如下: 二项分布2二、 概率分布(一) 离散型随机变量概率分布泊松分布记为XP(),概率分布公式如下:泊松分布3二、 概率分布(一) 离散型随机变量概率分布超几何分布4超几何分布记为XH(n,M,N),概率分布公式如下:其中,n、N、M为正整数,且MN,nN。当N很大且p=n/N较小时,有二、 概率分布(一) 离

11、散型随机变量概率分布超几何分布记为XH(n,M,N),概率分布公式如下:几何分布5二、 概率分布(二) 连续型随机变量概率分布图4-2是1 000名男大学生身高的频率直方图。如果被考察的男大学生人数不断增加,那么组数会越来越多,组距越来越小,频率将越来越稳定,频率直方图的上方也将越来越稳定于一条曲线f(x)。这条曲线f(x)就是连续型随机变量X的概率密度函数。1.连续型随机变量概率分布的形式(1) 连续型随机变量的概率密度函数二、 概率分布(二) 连续型随机变量概率分布1.连续型随机变量概率分布的形式概率密度函数f(x)具有以下两个性质: f(x)0,即概率密度曲线f(x)位于x轴的上方。 ,

12、即概率密度曲线f(x)与x轴之间的面积为1。(1) 连续型随机变量的概率密度函数二、 概率分布(二) 连续型随机变量概率分布1.连续型随机变量概率分布的形式(2)连续型随机变量的分布函数在频率直方图中,X在每一组内取值的频率为该组矩形的面积,在区间a,b上取值的频率为该区间内包含的矩形面积之和。随着数据的无限增多,分组就越来越细,X在a,b上取值的频率将逐步稳定于概率;a,b内包含的矩形面积也将稳定于曲线f(x)下面a与b两点之间的面积。不难看出,连续型随机变量X在某一区间a,b(也可以是开或半开区间)内取值的概率均为P(aXb)= 。二、 概率分布(二) 连续型随机变量概率分布1.连续型随机

13、变量概率分布的形式(2)连续型随机变量的分布函数在频率分布中,将各组频率依次累加,可以得到累计频率分布。类似地,在概率分布中则有分布函数。设X是一个随机变量,对任意实数x,事件“X x”的概率P(X x)称为随机变量X的分布函数,记为F(x)。当X是离散型随机变量时, 。当X是连续型随机变量时, 。二、 概率分布(二) 连续型随机变量概率分布1.连续型随机变量概率分布的形式(2)连续型随机变量的分布函数分布函数F(x)具有以下三个性质: 0F(x)1。 。 F(x)是非降函数,即若x1x2,则有F(x1)F(x2)。二、 概率分布(二) 连续型随机变量概率分布2.几种常见的连续型随机变量的概率

14、分布(1) 均匀分布。均匀分布记为XU(a,b),概率密度函数如下:相应的分布函数如下:二、 概率分布(二) 连续型随机变量概率分布1.连续型随机变量概率分布的形式(2) 指数分布。指数分布记为XE(),概率密度函数如下:相应的分布函数如下:三、 随机变量的数字特征(一) 随机变量的数学期望数学期望就是随机变量X的均值,是随机变量所有可能取值的平均水平,也就是对随机变量X可能取值的一种“期望”,记为E(X)。三、 随机变量的数字特征(一) 随机变量的数学期望当随机变量X为离散型随机变量时,其数学期望如下:1.离散型随机变量的数学期望三、 随机变量的数字特征(一) 随机变量的数学期望2.连续型随

15、机变量的数学期望假设连续型随机变量X的密度函数为f(x),如果广义积分 绝对收敛,则随机变量X的数学期望如下:三、 随机变量的数字特征(一) 随机变量的数学期望其数学期望具有以下几个性质:(1) 设C是常数,则E(C)=C。(2) 设C是常数,则E(CX)=CE(X)。(3) 若X1,X2是随机变量,则E(X1+X2)=E(X1)+E(X2)。对任意n个随机变量X1,X2,X3,Xn而言,有E(X1+X2+X3+Xn)=E(X1)+E(X2)+E(X3)+E(Xn)。2.连续型随机变量的数学期望三、 随机变量的数字特征(一) 随机变量的数学期望(4) 若X1,X2相互独立,则E(X1X2)=E

16、(X1)E(X2)。对任意n个相互独立的随机变量X1,X2,X3,Xn而言,有E(X1X2X3Xn)=E(X1)E(X2)E(X3)E(Xn)。2.连续型随机变量的数学期望三、 随机变量的数字特征(二) 随机变量的方差设X是一个随机变量,则X的方差如下:X的标准差或均方差如下:三、 随机变量的数字特征(二) 随机变量的方差1. 离散型随机变量的方差当随机变量X为离散型随机变量时,方差如下:三、 随机变量的数字特征(二) 随机变量的方差2.连续型随机变量的方差当随机变量X为连续型随机变量时,方差如下:随机变量X的方差也常用简便公式来表示。三、 随机变量的数字特征(二) 随机变量的方差其方差具有以

17、下几个性质:(1) 设C是常数,则D(C)=0。(2) 设C是常数,则D(CX)=C2D(X)。(3) 若X1,X2相互独立,则D(X1+X2)=D(X1)+D(X2)。对任意n个相互独立的随机变量X1,X2,X3,Xn而言,有D(X1+X2+X3+Xn)=D(X1)+D(X2)+D(X3)+D(Xn)。2.连续型随机变量的方差第二节 正 态 分 布 正态分布是统计学中最重要的分布,是统计学中抽样理论的基石。它的应用极为广泛。正态分布最早是由法国数学家德莫弗提出的。德国数学家高斯在研究误差理论时曾用它来刻画误差,因此正态分布也称为高斯分布。一、 正态分布的意义(二)正态分布是许多重要分布的极限

18、分布(一)许多随机变量服从或近似服从正态分布(三) 正态分布是许多其他重要分布的基础二、 正态分布的概率密度函数和性质正态分布是一个连续型分布,随机变量X的概率密度函数如下:式中,为正态分布的参数,分别表示总体的平均数与标准差。若随机变量X服从正态分布,则记作XN(,2),即X服从参数为,2的正态分布。二、 正态分布的概率密度函数和性质(1) 曲线的图形是一个单峰钟形曲线,如图43所示,它关于直线x=对称。正态分布的概率密度函数f(x)具有以下几个性质:二、 正态分布的概率密度函数和性质(2) 曲线在x=处达到最高点,从这一最高点出发,往正负两个方向下降,无限逼近横轴,但与x轴不相交。(3)

19、这条曲线与横轴之间的面积等于1,而且在与+之间曲线下的面积为0.682 7,在2与+2之间的面积为0.954 5,在3与+3之间的面积为 0.997 3,如图4-4所示。正态分布的概率密度函数f(x)具有以下几个性质:二、 正态分布的概率密度函数和性质(4) 均值、中位数和众数三者重合,即都为。(5) 正态分布是一个分布族,即正态分布由和完全确定。反映正态分布的中心位置和相应随机变量取值的集中位置。图4-5表明了当固定时,不同值的密度曲线在x轴上的位置。反映分布的分散程度:越小,密度曲线就越尖、越高,在x=的两侧下降得越快,表明相应的随机变量取值比较集中;越大,密度曲线就越平坦,在x=的两侧下

20、降得越慢,表明相应的随机变量取值比较分散。图4-6显示了当固定时,不同值的正态曲线的特点。正态分布的概率密度函数f(x)具有以下几个性质:二、 正态分布的概率密度函数和性质正态分布的概率密度函数f(x)具有以下几个性质:二、 正态分布的概率密度函数和性质正态分布的概率密度函数f(x)具有以下几个性质:二、 正态分布的概率密度函数和性质正态分布的概率密度函数f(x)具有以下几个性质:正态分布的数学期望和方差分别如下:正态分布的分布函数如下:三、 标准正态分布准正态分布是有指定参数(=0,=1)的正态分布。也就是说,当正态分布=0,=1时,随机变量X服从标准正态分布,记作XN(0,1)。这时分别用

21、(x)和(x)表示X的概率密度函数和分布函数,具体如下:(一) 标准正态分布的概率密度函数和分布函数三、 标准正态分布(x)的概率密度函数图形如图4-7所示,是一条以纵轴x=0为对称轴的钟形曲线。(一) 标准正态分布的概率密度函数和分布函数三、 标准正态分布(x)的分布函数图形如图4-8所示。(一) 标准正态分布的概率密度函数和分布函数三、 标准正态分布由于正态分布有广泛的应用,因此为了计算方便,人们编制了标准正态分布函数值表。若随机变量X服从标准正态分布,则可直接查表计算概率。若随机变量X服从一般正态分布,即XN(,2),对于给定的和,只要将X转化为Z,就可将一般正态分布转化为标准正态分布。

22、相关转换公式如下:可以证明,此时ZN(0,1)。(二) 标准正态分布概率的计算三、 标准正态分布对于服从标准正态分布的随机变量Z,假设其分布函数为(Z),则服从标准正态分布的随机变量Z即标准正态变量,在任何一个区间上的概率可表示如下:(二) 标准正态分布概率的计算三、 标准正态分布(二) 标准正态分布概率的计算对于负的Z,则有下式成立:同样,对于服从一般正态分布的随机变量X,在某一区间上取值的概率都可以通过标准正态分布求得。相关计算公式如下:第三节 其他常用分布 除正态分布外,其他常用分布还包括2分布、t分布和F分布。这些分布在后面章节中会有所涉及,故在此进行简要介绍。一、 2分布2分布是从正

23、态分布派生出来的一个分布,在统计学中占有重要的地位。许多实际分布可以用2分布来近似表示。设随机变量X1,X2,X3,Xn皆服从N(0,1),且相互独立,则随机变量 服从自由度为n的2分布,记作X2(n)。其概率密度函数如下:其中,参数n为自由度。一、 2分布自由度是指在一个样本中,各项随机变量的数值可以自由变动的项数。如样本有n个随机变量,每个数值都可以自由变动,则其自由度为n;如n个随机变量的平均数已确定,则只有n-1个随机变量的数值可以自由变动,而剩余的一个随机变量的数值必然由该平均数与n-1个随机变量的数值所决定,不能自由变动,这时n个随机变量的自由度为n-1。当一个样本的各项随机变量X

24、1,X2,X3,Xn之间存在着k个独立的线性约束条件时,则只有n-k个自由度。上述2分布中的自由度n表示 中独立随机变量的个数,即 中有n个随机变量项可以自由取值。一、 2分布2分布的概率密度函数曲线如图4-15所示。由图4-15可知,2分布为不对称分布,一般为正偏分布,但随着其自由度n的增大,曲线逐渐趋向于对称,并趋于正态分布。一、 2分布(1) 2分布的数学期望=n,方差2=2n。(2) X1,X2的分布具有可加性。若X12(n1),X22(n2),且X1,X2独立,则X1+X22(n1+n2)。2分布具有以下几个性质:一、 2分布2分布具有以下几个性质:(3) 设XN(,2),从中抽取容

25、量为n的样本, 分别为样本的均值和方差,则 与s2相互独立,并有 。2分布主要适用于总体方差的估计和检验,以及非参数统计中拟合优度检验和独立性检验等。二、 t分布设X,Y是两个相互独立的随机变量,且XN(0,1),Y2(n),则随机变量 的分布服从自由度为n的t分布,记为Tt(n)。t分布的概率密度函数如下:二、 t分布t分布的概率密度函数曲线如图4-16所示。二、 t分布t分布的特征如下:(1) t分布是一种连续型的对称分布。它是关于t=0对称的,且形状同标准正态分布类似。(2) 随机变量T取值范围为(,+)。(3) 一般来说,在小样本中,t分布的方差大于1。当n无限增大时,t分布的方差趋近

26、于1,即t分布逐渐逼近标准正态分布。(4) t分布决定于自由度。只有知道自由度,才能在t分布表查得相应概率。二、 t分布t分布的均值和方差分别表示如下:t分布可用于总体方差未知且为小样本时对正态总体均值的估计与检验,以及线性回归模型中回归系数的显著性检验等。三、 F分布设X2(n1),Y2(n2),且随机变量X,Y独立,则随机变量 的分布称为自由度为(n1,n2)的F分布,并记为FF(n1,n2)。F分布的概率密度函数如下:三、 F分布F分布一般为正偏分布。F分布的概率密度函数曲线如图4-17所示。三、 F分布 查F分布表时,常需要用到F分布的一个重要性质,即 F分布常用于两个总体方差之比抽样推断统计量的构造。假设有总体XN(1, ),总体YN(2, ),随机变量X,Y相互独立,从中各自独立抽取样本容量为n1和n2的样本, , 分别是它们的方差,则有 。第四节 大数定律和中心极限定理 极限定理就是采用极限

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论