04-统计推断的理论基础课件_第1页
04-统计推断的理论基础课件_第2页
04-统计推断的理论基础课件_第3页
04-统计推断的理论基础课件_第4页
04-统计推断的理论基础课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第四章统计推断的理论基础学习目标理解概率及概率分布的意义;掌握抽样的基本概念以及抽样分布的概念;本章内容概率与概率分布随机变量的数值特征与随机向量大数定理与正态分布定理抽样分布随机事件与概率随机现象的特点:

在基本条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。了解随机现象的方法:随机试验随机实验(简称实验)的特点:

每次试验的可能结果不是惟一的;每次试验之前不能确定何种结果会出现;试验在相同条件下重复进行随机现象与确定现象随机试验与事件随机事件:随机试验中可能出现也可能不出现的结果,简称为事件简单事件:也称为基本事件,它是不可以再分解的事件,其也被称为样本点。复杂事件:也称为复合事件,由简单事件组合而成的事件。基本事件也被称为样本点。设试验有n个基本事件,分别记为i,(i=1,2,…,n),集合={1,2,…,n}称为样本空间,中的元素就是样本点。随机事件与概率随机试验与事件例:投掷骰子的实验基本事件:

出现点数为1,2,3,4,5或6的事件复杂事件:出现点数是奇数的事件出现点数是偶数的事件我们常用A、B、……来表示随机事件。设A表示“出现点数是奇数”,则A={1,3,5}随机事件与概率随机试验与事件必然事件——必然出现的实验结果

用样本空间表示。不可能事件——不可能出现的试验结果

用空集表示。A发生或B发生事件记为A∪B;A与B同时发生事件记为A∩B,或AB;前面的例子中,A∪B=是必然事件;AB=是不可能事件。如果AB=

,称为A与B不相容随机事件与概率随机试验与事件定义:概率也称为机率,是指随机事件发生的可能性,或者说对随机事件发生可能性的度量随机事件与概率概率概率的计算:进行重复试验,通过试验的频率来计算概率。例如,不断重复地投掷一枚均匀的硬币,出现正面的频率会稳定在0.5附近。历史上,有人为此做过实验,结果如下:表:频率试验结果实验者投掷硬币的次数(n)正面朝上的次数(m)频率(=m/n)DemorganBuffonPearson(1)Pearson(2)204840401200024000106120486019120120.5180.50690.50160.5005随机事件与概率概率概率的统计定义:进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动时,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:

P(A)=p,0p1随机事件与概率概率如果随机试验的样本空间是有限集合,所有样本点出现的可能性相同,则事件A的概率可根据以下公式计算:样本点总数A包含的样本点个数nmP(A)=—=——————————随机事件与概率概率概率的性质:性质1(非负性):P(A)0

性质2(规范性):P()=1

推论:不可能事件的概率为0,即:P()=0

性质3(可加性):若事件A与事件B互不相容,则有:P(A∪B)=P(A)+P(B)

推论:设A表示A的对立事件,则有:

P(A)=1-P(A)独立事件:对事件A和B,若p(AB)=p(A)p(B)随机变量随机变量:产生于对随机试验的结果进行量化处理的需要。随机变量X是定义在样本空间上的一个函数,这个函数的取值随试验的结果不同而变化。对任意实数x,X<x是随机事件,且概率存在。随机变量离散型随机变量的概率分布设离散型随机变量X的所有可能取值为x1,x2,…,xn,…,,相应的概率为p(x1),p(x2),…,p(xn),…,称为离散型随机变量X的概率分布。简记为:p(X=xi)=p(xi)(i=1,2,…)概率分布的性质:0p(xi)1(i=1,2,…),p(xi)=1Xx1x2…xn…Pp(x1)p(x2)…p(xn)…随机变量连续型随机变量的概率分布分布函数:对任意实数x,X<x是一随机事件,可求其概率。记F(x)=p(X<x),该函数就是随机变量的分布函数。密度函数:对分布函数求导,可得密度函数,记为f(x)通过对密度函数积分,可得到随机变量X在点x附近或一个区间上取值的概率。注:连续型随机变量取一个固定值的概率为0随机变量连续型随机变量的概率分布密度函数的性质:表示随机变量X的取值在区间(a,b)内的概率。随机变量连续型随机变量的概率分布正态分布:如果连续型随机变量X的密度函数为则称随机变量X服从均值为,方差为2的正态分布,记为X~N(,2)=0.6=1=2随机变量连续型随机变量的概率分布标准正态分布:如果正态分布的密度函数中,=0,=1,则这样的正态分布称为标准正态分布。标准正态随机变量在区间[-Z,Z]取值的概率F(Z)可通过查标准正态分布概率表获得。随机变量连续型随机变量的概率分布例:设随机变量Z服从标准正态分布,求以下概率的大小:(1)p(-1<Z<1)(2)p(0<Z<1.25)(3)p(1<Z<1.25)(4)p(Z>1)随机变量连续型随机变量的概率分布正态分布的标准化变换:设随机变量X服从正态分布N(,2),则随机变量Z=(X-)/服从标准正态分布,即Z~N(0,1)例:假定学生某门学科的考试成绩服从均值为60分,标准差为12分的正态分布,问某一学生的成绩在60分到75分之间的概率应为多少?解:随机变量连续型随机变量的概率分布【例】

:设随机变量X服从正态分布N(,2),试分别求X落在以为中心,以,1.96,2,3为半径的区间内的。解:本章内容概率与概率分布随机变量的数值特征与随机向量大数定理与正态分布定理抽样分布随机变量的数值特征分布函数完整地描述了随机变量的统计规律性,但实际上,一方面常常不知道随机变量的分布函数,另一方面也可能不需要知道它,而只需要知道随机变量的某些特征。讨论随机变量的数值特征对于了解随机变量有重要意义。随机变量的数值特征随机变量的(数学)期望离散型随机变量X的数学期望(也即均值):

=E(X)=xip(xi)

连续型随机变量的数学期望:如果Y=g(X),则:随机变量数学期望的性质:E(X1+X2)=E(X1)+E(X2)该性质可推广到多个随机变量的情形贝努里试验:只有两种结果的试验n重贝努里试验:设A出现的概率为p,重复进行n次贝努里试验二项分布以Bk表示n重贝努里试验中事件A正好出现k次这一事件,则有:K012…nP(Bk)…随机变量的数值特征随机变量的(数学)期望离散型随机变量的方差:

2=var(X)=E(X-)2=(xi-)2p(xi)连续型随机变量的方差:方差的性质:Var(X)=2Var(X)Var(X)=E(X2)-[E(X)]2随机变量的数值特征随机变量的方差与标准差方差开平方即为标准差。二元(维)随机向量离散型随机向量的概率分布连续型随机向量的概率分布随机向量的数值特征二元正态分布其他常用的连续型随机变量的分布随机变量与独立性其它常用的连续型随机变量的分布:2-分布:设X1,X2,…,Xn是相互独立且服从标准正态分布的随机变量,则称随机变量2=Xi2所服从的分布为自由度为n的2-分布。t-分布:设X服从标准正态分布,Y服从自由度为n的分布,且它们相互独立,则随机变量T=X/Y/n所服从的分布为自由度为n的t-分布。当n30时,t-分布与标准正态分布的差别非常小,可用标准正态分布代替。F-分布:设X和Y是相互独立的分布,自由度分别是m和n,则称随机变量F=(X/Y).(n/m)所服从的分布为F-分布,称为它的自由度。本章内容概率与概率分布随机变量的数值特征与随机向量大数定理与正态分布定理抽样分布大数定理与正态分布定理大数定理大数定理又称作大数法则。人们在观察个别事物时,是连同一切个别的特性来观察的。个别现象受偶然因素影响,有各自不同的表现。但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。大数定理与正态分布定理大数定理大数定理:独立同分布的随机变量X1,X2,…,Xn,…设它们的平均数为,方差为2。则对任意正数,有:大数定理与正态分布定理中心极限定理与正态逼近

正态分布的再生定理相互独立的两个正态随机变量相加之和仍服从正态分布,这就是正态分布的再生性。因此,从服从正态分布的总体中抽出一个容量是n的样本,则样本平均数也服从正态分布。如果总体的平均是,标准差是(X),则样本平均数所服从的正态分布的中心仍是,标准差是抽样平均误差。

大数定理与正态分布定理中心极限定理:随机变量X1,X2,…,Xn,…相互独立,且服从同一分布,该分布存在有限的期望和方差:E(Xi)=,Var(Xi)=2,(i=1,2,…)。令则中心极限定理与正态逼近大数定理与正态分布定理也就是说,当n趋于无穷大时,Yn近似服从标准正态分布。中心极限定理与正态逼近大数定理与正态分布定理推论1:均值的分布趋向于正态分布推论2:n项和的分布趋向于正态分布中心极限定理与正态逼近例:4-19(P107)本章内容概率与概率分布随机变量的数值特征与随机向量大数定理与中心极限定理抽样分布统计推断与简单随机抽样推断统计:就是通过抽取样本,并利用样本信息来推断总体的各种性质或特征。推断统计包括:参数估计和假设检验。推断统计的基本内容抽样推断涉及的基本概念:

1.总体与样本

2.样本容量与样本个数

3.总体参数与样本统计量

4.重复抽样与不重复抽样统计推断与简单随机抽样推断统计的基本内容样本容量:指样本包含的总体单位数,一般用n表示。一般地说,样本容量大,抽样误差会小,但调查费用会增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。因此,在抽样设计中应根据调查目的和要求认真考虑合适的样本容量。样本个数:样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。关于样本个数的计算我们将在“重复抽样与不重复抽样”中介绍。注意:

这个概念只是对有限总体有意义,对无限总体没有意义!

若总体X的样本X1,…,Xn满足:Xi与X同分布,Xi与Xj相互独立,则称它为简单随机样本。如果总体X的密度函数为f(x),则简单随机样本的联合分布的密度函数为:统计推断与简单随机抽样简单随机样本例:设Xi(i=1,…,n)是来自指数分布总体X的简单随机样本。求它的联合分布密度。解:指数分布密度为:故该样本的联合分布密度为:总体参数:总体分布的参数往往是总体的数量特征,也是统计推断的对象。常见的总体参数有:总体平均数指标,总体成数(比率)指标,总体分布的方差、标准差,等等。它们都是反映总体分布特征的重要指标。总体成数(也称总体比率)指标是指总体中具有某性质的单位数目在总体中所占的比重,它反映了总体的结构特征。统计量与统计分布样本统计量样本统计量:通俗地说,样本统计量是样本的函数。由于样本是从总体中随机地抽出来的,因此,样本统计量也是随机变量。我们利用样本统计量来估计或推断总体的参数和数量特征。设已有样本(X1,X2,…,Xn),常见的统计量有:样本统计量统计量与统计分布样本统计量样本平均数样本成数样本方差样本标准差样本极差统计量与统计分布例:从一批瓷器中随机抽取10件,测得其重量如下,求这组样本值的均值和方差。123456789102.102.431.852.402.152.281.962.352.001.99解:重复抽样(或重置抽样)是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮抽样。

重复抽样的特点:

n个单位构成的样本是n次试验的结果;每次试验是独立的,即其试验的结果与前次、后次的结果无关;每次试验是在相同条件下进行的,每个单位在每次试验中选中的机会(概率)是相同的。在重复试验中,样本可能的个数是Nn,N为总体单位数,n为样本容量。抽样分布统计量与统计分布关于重复抽样与不重复抽样不重复抽样亦称为不重置抽样,即每次从总体抽取一个单位,登记后不放回原总体,不参加下一轮抽样。下一次继续从总体中余下的单位抽取样本。

不重复抽样的特点:

n个单位的样本由n次试验结果构成,但由于每次抽出不重复,所以实质上相当于从总体中同时抽取n个样本单位。如果考虑顺序,其样本可能个数为如果不考虑顺序,其样本可能个数为抽样分布统计量与统计分布关于重复抽样与不重复抽样

一个统计量的抽样分布就是该统计量的概率分布,寻求抽样分布是统计学的基本任务之一。只有知道了统计量的抽样分布,才能对该统计量做全面的了解和掌握。抽样分布统计量与统计分布抽样分布重复抽样分布

设从总体中抽出的样本为X1,X2,…,Xn,由于是重复抽样,每个Xi,(i=1,2,…,n)都是从总体中随机抽出的,都是与总体同分布的随机变量,并且是相互独立的。我们设总体的平均数为,方差为2,则样本平均数的期望值与方差分别是:样本平均数的抽样分布抽样分布重复抽样分布

由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布这是一个非常重要的结论,有广泛的应用。样本样本平均数样本样本平均数34,3434,3834,4234,4634,5038,3438,3838,4238,4638,5042,3442,3842,4242,4642,5034363840423638404244384042444646,3446,3846,4246,4646,5050,3450,3850,4250,4650,5040424446484244464850例:某班组5个工人的日工资为34、38、42、46、50元。现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。样本平均数频数343638404244464850123454321合计25结论(重复抽样):

此指标(抽样平均数的标准差)反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用表示。抽样分布重复抽样分布

总体成数p是指具有某种特征的单位在总体中的比重。在前面我们已经知道,成数是一个特殊平均数,设总体单位总数目是N,总体中有该特征的单位数是N1。设X是0、1变量,即:总体单位有该特征,则X取1,否则取0,则有:样本成数的抽样分布抽样分布重复抽样分布样本成数的抽样分布

现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:

P也是一个随机变量,利用样本平均数的分布性质结论,即有:

E(P)=p抽样分布不重复抽样分布样本平均数的抽样分布

某班组5个工人的日工资为34、38、42、46、50元。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论