版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学总体分布参数估计第1页,共66页,2023年,2月20日,星期六
§4.1总体分布与样本分布一、总体(母体):反映总体特征的随机变量的取值的全体。总体分布(母体分布):反映总体特征的随机变量的概率分布。从无限次随机抽取(然后放回)的角度看,表征一个总体特征的变量(指标),都可以视为随机变量。有限总体的概率分布,就是有限总体中不同个体的比率(频率)分布。二、随机样本与样本观测值(样本数据)1、随机样本表征n次抽取个体的随机抽样的一组随机变量X1,X2,···,Xn。第2页,共66页,2023年,2月20日,星期六2、样本观测值n次随机抽样的结果:x1,x2,···,xn
(称为随机样本X1,X2,···,Xn的样本观测值)。n称为随机样本向量(X1,X2,···,Xn
)的维度,即自由度。3、样本(累积)分布函数设样本观测值x1x2,···,
xn
ki为小于xi+1的样本值出现的累积频次,n为样本容量,则可得样本累积频率分布函数如下:样本累积频率分布函数,又称样本(累积)分布函数.样本(累积)分布函数Fn(x)是对总体的累积分布函数F(x)的近似,n越大,Fn(x)对F(x)的近似越好.第3页,共66页,2023年,2月20日,星期六样本分布与总体分布格利文科(Glivenko)定理(样本分布与总体分布的关系)定理:当样本容量n趋于无穷大时,Fn(x)以概率1(关于x)均匀地收敛于F(x).该定理是运用样本推断总体的理论依据.定理的数学表达为:第4页,共66页,2023年,2月20日,星期六
随机样本的均值函数和方差函数都是一个随机变量.样本数据的样本均值x是随机变量X的观测值;样本数据的样本方差s2
是随机变量S2
的观测值.随机样本的均值函数:随机样本的方差函数:三、统计量与统计量的分布统计量定义:统计量是不含未知参数的,随机样本X1,X2,···,
Xn的函数。第5页,共66页,2023年,2月20日,星期六统计量的值的定义:统计量的值是不含未知参数的,样本观测值x1,x2,···,xn的函数.四、由标准正态分布N(0,1)的随机样本所引出的几个重要统计量分布:2、t与F分布1、2(n)分布的构成设随机变量X服从N(0,1)分布,X1,X2,···,
Xn为X样本,则
2=
X2i=X21+X22+···
X2n
服从自由度为n的2分布,记为2~2(n)。2(n)分布的均值E(2)=n,方差D(2)=2n。第6页,共66页,2023年,2月20日,星期六n=1n=4n=102(n)分布图2(n)密度函数:其中,n为自由度。(n/2)为珈玛函数,是一个含参数n/2的积分,为:第7页,共66页,2023年,2月20日,星期六2、t分布自由度为n的t分布,记为t(n),是由N(0,1)分布和2(n)分布组成的,其表达式为:其中,X服从N(0,1),Y服从2(n)分布,且X与Y相互独立。密度函数为:第8页,共66页,2023年,2月20日,星期六t分布图3、F分布F分布是由两个2分布之比组成的:服从F(m,n)。其中,U服从2(m),V服从2(n)。第9页,共66页,2023年,2月20日,星期六m=100,n=20m=15,n=20重要性质:密度函数形式为:第10页,共66页,2023年,2月20日,星期六五、由一般正态分布的随机样本所构成的若干重要统计量的分布定理:若X1,X2,···,
Xn是正态总体N(,2)的一个随机样本,则样本均值函数和样本方差函数,满足如下性质:(1)X服从N(,2/n)分布。(2)X与S2相互独立。(3)
服从N(0,1)分布;(4)服从2(n-1)分布;第11页,共66页,2023年,2月20日,星期六(5)服从t(n-1)分布;(1)服从N(0,1)。(6)服从2(n)分布;定理:若X1,X2,···,
Xn1和Y1,Y2,···,Yn2分别是正态总体N(1,12)和N(2,22)的一个随机样本,且它们相互独立,则满足如下性质:第12页,共66页,2023年,2月20日,星期六(3)服从F(n1-1,n2-1)。其中,S12是容量为n1的X的样本方差,S22是容量为n2的Y的样本方差。(2)服从t(n1+n2-2),(1=2)。(4)服从F(n1,n2)。第13页,共66页,2023年,2月20日,星期六六、任意分布的随机样本均值函数的均值与方差设:随机变量X服从任何均值为,标准差为的分布,X是随机样本X1,X2,···,
Xn的均值函数。记随机变量X的分布函数的均值为X,标准差为X,则有如下结论成立:X=;(2)X=/n或2X=2/n注:一个应用广泛的样本均值函数的均值和方差:0-1分布的样本均值函数均值和方差。反映总体中某类个体的比例的随机变量X,可以简单地用0-1分布B(1,p)表示.E(X)=p,D(X)=p(1-p).p是总体中某类个体的比例.由样本X1,X2,···,
Xn产生均值函数X的均值X
=p,第14页,共66页,2023年,2月20日,星期六方差的均值也是总体中某类个体的比例p.所以,常用x来估计p.七、大样本均值函数的分布:中心极限定理设:随机变量X服从任何均值为,标准差为的分布,X是随机样本X1,X2,···,
Xn的均值函数。中心极限定理:当n充分大时,X近似地服从均值为,标准差为/n的正态分布。在实际问题中n多大?但一般n30。第15页,共66页,2023年,2月20日,星期六
对于一个学生而言,来参加家长会的家长人数是一个随机变量.设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05、0.8、0.15.若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布.(1)求参加会议的家长数X超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率.解中心极限定理例题解析第16页,共66页,2023年,2月20日,星期六根据中心极限定理第17页,共66页,2023年,2月20日,星期六中心极限定理可得:第18页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量§4.2点估计在实际问题中,人们常常判断总体分布的参数,这就需要用样本来推断总体分布的这些参数,这就是参数估计。参数估计分为:点估计和区间估计两种方法。1、点估计概念设是总体分布中一个需要估计的参数,现从总体中抽取一个随机样本X1,X2,···,
Xn,记估计的统计量为
则称为的估计量。第19页,共66页,2023年,2月20日,星期六若得到一组样本观测值x1,x2,···,xn,就可得出的估计值,记:。注:在选取样本统计量作为点估计时,必须考虑到“无偏差性”,这一点很重要。如果样本统计量的期望值(或均值)与打算估计的总体参数值相同,则估计值不存在偏差。总体分布参数的点估计,就是求出的估计值。第20页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量
点估计
–第21页,共66页,2023年,2月20日,星期六2、矩法估计就是用样本矩来估计总体矩。矩的一般形式:
E(Xk)表示k阶原点矩(以原点为中心);
E(X-)k表示k阶中心矩(以为中心);3、极大似然估计法设:总体X的(累积)概率分布函数为F(x,),概率密度函数f(x,),其中为未知参数(也可以表示未知参数向量).若X为离散型随机变量,则由离散型与连续型的对应关系,f(x,)对应于离散情况下的概率P(X=x).第22页,共66页,2023年,2月20日,星期六X为连续型随机变量时,X的随机样本X1,X2,···,
Xn的联合概率密度函数为
称为的极大似然估计函数.当X为离散随机变量时,L表示概率:L关于的极大值如果存在,极大值就是的极大似然估计值.其含义是:一组观测值x1,x2,···,xn在一次实验中出现了,其联合概率就应当是最大的,所以选择使联合密度L最大的那个
.第23页,共66页,2023年,2月20日,星期六例:设x1,x2,···,xn是正态总体N(,2)的一个样本观测值,求与2的极大似然估计值.解:极大似然函数为取对数,分别对与2求偏导,并令偏导为0,可求出与2的极大似然估计值如下:如果将上述xi换成Xi,上式成为极大似然估计量.第24页,共66页,2023年,2月20日,星期六例:设X服从区间[a,b]上的均匀分布,a、b是求知参数,(x1,x2,···,xn)是来自总体X的样本,求a、b的矩估计量解:X的密度函数第25页,共66页,2023年,2月20日,星期六第26页,共66页,2023年,2月20日,星期六§4.3判别点估计的优劣标准1、无偏估计量如果,则称为的无偏估计量。2、最小方差性若总体参数为,的估计量的方差Var()小于等于其他所有对的估计量的方差,即则称的估计量具有最小方差性。3、有效估计量如果一个估计量满足(1)无偏性;(2)最小方差性。第27页,共66页,2023年,2月20日,星期六那么,该估计量为有效估计量。4、渐近无偏估计量如果:,(n为样本容量)则称为渐近无偏估计量。5、一致估计量如果满足:则称为的一致估计量。一致估计量的另一等价定义:(1)渐进无偏的;(2)第28页,共66页,2023年,2月20日,星期六9、渐进有效性如果一个估计量满足:(1)是一致估计量;(2)比其它的估计量更小的渐进方差。注:在实践中广泛应用的准则:(1)小样本准则a、无偏性;b、有效性。(2)大样本准则一致估计量。渐进方差定义:第29页,共66页,2023年,2月20日,星期六例:设(x1,x2,···,xn)是来自具有有限数学期望的任一总体X的一个样本,记E(X)=a,证明:是a的无偏估计。第30页,共66页,2023年,2月20日,星期六第31页,共66页,2023年,2月20日,星期六§4.4区间估计1、置信区间若总体分布含有一个未知参数,找出了2个依赖于样本X1,X2,···,
Xn的估计量:使其中,01,一般取0.05或0.01,则称随机区间为的100(1-)%的置信区间.百分数100(1-)%称为置信度.2、总体均值的置信区间(总体方差已知)设:总体X服从已知N(,2),2已知,抽取n个观第32页,共66页,2023年,2月20日,星期六测值x1,x2,···,xn,求总体均值的100(1-)%(如=95%)的置信区间。首先构造:因为X服从N(,2/n)分布,所以Z服从N(0,1)分布。由:得置信区间:第33页,共66页,2023年,2月20日,星期六Z/2Z1-/21-/2/2例:设:总体X服从已知N(,0.09),抽取4个观测值x1,x2,x3,x4,求总体均值的95%的置信区间。解:由已知:1-=0.95,=0.3,n=4根据:第34页,共66页,2023年,2月20日,星期六得到:查表得z0.025=1.96,于是置信区间为(X-0.294,X+0.294),置信度为95%.也就是说:总体均值以95%的概率在该区间内.第35页,共66页,2023年,2月20日,星期六3、总体均值的置信区间(总体方差未知)设:总体X服从已知N(,2),2未知,抽取n个观测值x1,x2,···,xn,求总体均值的100(1-)%=95%的置信区间。首先构造:可得置信区间:第36页,共66页,2023年,2月20日,星期六由:将n个观测值x1,x2,···,xn代入上式得到置信区间。4、总体方差的置信区间(未知总体均值)设:总体X服从已知N(,2),未知,抽取n个观测值x1,x2,···,xn,求总体方差2的100(1-)%=95%的置信区间。首先构造:第37页,共66页,2023年,2月20日,星期六得到置信区间:由:将n个观测值x1,x2,···,xn代入上式得到置信区间。5、总体比例的置信区间Letpdenotetheobservedproportionof“successes”inarandomsampleofnobservationsfromapopulationwithaproportionofsuccesses.Then,ifnislargeenoughthat(n)()(1-)>9,thena100(1-)%confidenceintervalforthepopulationproportionisgivenby第38页,共66页,2023年,2月20日,星期六orequivalently,wherethemarginoferror,thesamplingerror,orbound,B,isgivenbyandZ/2,isthenumberforwhichastandardnormalvariableZsatisfies第39页,共66页,2023年,2月20日,星期六总体方差的区间估计
(例题分析)【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表7所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第40页,共66页,2023年,2月20日,星期六总体方差的区间估计
(例题分析)解:已知n=25,1-=95%,根据样本数据计算得s2=93.21
2置信度为95%的置信区间为该企业生产的食品总体重量标准差的的置信区间为7.54克~13.43克第41页,共66页,2023年,2月20日,星期六总体均值的区间估计
(例题分析)【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470第42页,共66页,2023年,2月20日,星期六总体均值的区间估计
(例题分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131。根据样本数据计算得:,
总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时第43页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量区间估计–总体参数值很可能落在区间估计所包括的数值范围内;使我们知道被估计值可能产生多大的误差边际;给出估计的信赖程度(或置信度)。第44页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量定义与区间估计相联系的信赖程度,常常用(1–)100%来表示。置信水平
置信区间
指某一指定置信水平下的区间估计,该区间包括了总体参数的真值。置信水平高
置信区间就宽
第45页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量置信区间就宽
样本统计量(点估计)置信界限(下限)置信界限(上限)第46页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量x
/2区间的较大数值在100(1-)%水平下,区间包含;在100%水平下,区间不包含;=
1-/2x_x__第47页,共66页,2023年,2月20日,星期六对比总体参数和样本统计量解释95%的置信区间表达了什么含义95%的置信水平意味着:如果从总体中随机抽取容量为n的所有可能样本,并相应计算这些样本的置信区间,则在计算之后有95%的区间将包括总体参数的真值。第48页,共66页,2023年,2月20日,星期六总体均值的置信区间--已知(1)无论样本容量为多少,原有总体服从正态分布;或者(2)原有总体不服从正态分布,但样本容量n
30。
服从均值=、标准差为的正态分布而且第49页,共66页,2023年,2月20日,星期六总体均值的置信区间--已知(1–)100%水平下的置信区间即,因此,第50页,共66页,2023年,2月20日,星期六总体均值的置信区间--已知举例:根据以前获得的经验,我们知道某台机器在生产训练用的钢管时,其直径的标准差为0.135厘米。如果从中抽取30根管子作为一个简单随机样本,则这些管子的平均直径为3.6厘米。请问在95%的置信水平下,这些管子的平均直径的置信区间是多少?
n=30,=0.135cm,=3.6cm根据中心极限定理,近似服从正态分布第51页,共66页,2023年,2月20日,星期六总体均值的置信区间--已知在95%水平下的置信区间是而且=3.61.960.02465=(3.55,3.65)在95%的置信水平下,由这台机器生产的训练用管子,其平均直径应当在3.55厘米至3.65厘米范围之内。第52页,共66页,2023年,2月20日,星期六如果总体的未知,则的抽样分布服从自由度为n–1的t分布,即如果样本容量足够大,我们可以用正态分布而不是t分布。总体均值的置信区间–未知第53页,共66页,2023年,2月20日,星期六总体均值的置信区间–未知如果是大样本(n
30),则在(1–)100%水平下,的置信区间是如果是小样本(n<30)并且原有总体近似服从正态分布,则在(1–)100%水平下,的置信区间是第54页,共66页,2023年,2月20日,星期六总体均值的置信区间–未知一家邮购公司在圣诞节前的一周内会接听大量的订购电话。过去经验表明,由于工作人员每天可能要接听几千个电话,因此为了及时处理打入的电话数量,有必要增加销售人员人数。为此,这家公司记录了75%的员工在每8小时之内接听电话的数量,结果发现他们平均要接听89.6个电话,而且标准差为17.32。请问在90%的置信水平下,被接听电话的平均数量的置信区间是多少?
举例:第55页,共66页,2023年,2月20日,星期六总体均值的置信区间–未知s=17.32, n=75(大样本)的抽样分布近似服从以下参数的正态分布在90%水平下,的置信区间而且=89.61.6452=(86.31,92.89)第56页,共66页,2023年,2月20日,星期六总体均值的置信区间–未知举例:一家会计公司想要设立一项时间标准,以便其工作人员能及时完成某类审计工作。它抽取了18名初级审计员作为一个样本并记录了他们的审计时间,结果发现这些人员的平均审计时间为3.2个小时,标准差为1.6个小时。请问在95%的置信水平下,当完成某类审计工作时其平均审计时间的置信区间是多少?第57页,共66页,2023年,2月20日,星期六总体均值的置信区间–未知s=1.6, n=18(小样本)的抽样分布服从自由度为17的t分布
在95%
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年挂衣瓦楞纸箱项目投资价值分析报告
- 2024至2030年中国磨光水砂片数据监测研究报告
- 2024年柔软快干水浆项目可行性研究报告
- 2024年内衬包装袋项目可行性研究报告
- 2024至2030年中国平台式洗瓶机数据监测研究报告
- 2024至2030年中国双线型剥线机行业投资前景及策略咨询研究报告
- 2024至2030年中国下置缸四柱式油压机数据监测研究报告
- 2024年中国芦荟醋饮市场调查研究报告
- 二零二四年到期租赁合同
- 二零二四年堡坎工程保险服务合同
- 环境工程专业英语 课件
- 四川美丰梅塞尔气体产品有限公司5000吨-年干冰技术改造项目环境影响报告
- 教学工作中存在问题及整改措施
- 2013部编版九年级物理全一册《测量小灯泡的电功率》评课稿
- 人教版九年级数学上册《二次函数与一元二次方程》评课稿
- 锻造焊接铸造缺陷课件
- 钢管静压桩质量监理细则
- 新生儿科品管圈-降低新生儿红臀发生率课件
- 《篮球原地双手胸前传接球》
- 弯垫板级进模的设计本科毕业论文
- 汽车维修设备设施汇总表
评论
0/150
提交评论