版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
会计学1第参数估计基础
二、标准误的计算【例5-1】假设已知100名(总体)正常成年男性红细胞数的均值为5.001012/L,标准差为0.431012/L,现从该总体中进行随机抽样,每次抽取10名正常成年男子,并测得他们的红细胞数,最终共抽取100份样本,并计算出每份样本的均数。第1页/共62页第2页/共62页将一百个样本均数看成一批资料或为一个新样本,我们可以计算其均数与标准差,均数值为4.9097,标准差为0.1350。将样本均数的“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的变异程度,而标准误则说明样本均数的变异程度,两者不能混淆。第3页/共62页将第1号样本的标准差及例数代入式(5-2),得
(5-2)
(5-1)
第4页/共62页
100个样本均数的频数分布图第5页/共62页标准误统计量的标准差称为标准误(如均数标准误、率的标准误);均数的标准误是描述均数抽样误差大小的统计指标。第6页/共62页标准误的用途:1.衡量样本均数的可靠性。2.结合样本均数和正态分布曲线下的面积分布规律,估计总体均数的置信区间。3.用于均数的假设检验。思考题:标准误和标准差的区别?第7页/共62页则z~N(0,1)第二节t分布
则z~N(0,1);~(μ,),作z转换x~N(μ,σ),作转换,
一、t分布的概念第8页/共62页t变量为用以推断总体均数的样本检验统计量。t
分布只有1个参数自由度ν=n-1。1.当σ已知时,可作z转换,推断总体均数的样本检验统计量为z。2.当σ未知时,可作正态变量的t转换,第9页/共62页二、t分布的特征与t界值表
图5-1不同自由度t分布的概率密度曲线第10页/共62页3.当
→∞时,t分布逼近z分布;特征:1.单峰分布,以0为中心,左右对称;2.越小,t值越分散,t分布的峰部越矮而尾部翘得越高;4.t分布曲线下的面积有一定规律。第11页/共62页双侧:单侧:第12页/共62页图5-2ν=9时单侧(a)与双侧(b)分布曲线下尾部面积第13页/共62页第三节总体均数的估计【例5-2】
随机抽取某地100名16岁男孩,测得其体重均数为48.65kg,标准差为15.23kg,试估计该地16岁男孩体重的总体均数。
一、点估计(pointestimation)
用样本统计量作为总体参数的点值估计第14页/共62页二、区间估计(intervalestimation)
结合样本统计量和抽样误差在一定的可信度100(1-)%下估计总体参数所在的范围,称为总体参数的置信区间(confidenceinterval,CI)。
置信区间的概念第15页/共62页1.Z分布法正态分布原理计算总体均数的1-可信区间为:
/2/21--z/2z/2(1)σ已知(小样本要求资料服从正态)均数置信区间的计算第16页/共62页(2)σ未知,但样本例数n足够大时(n>50)
注意:若总体不服从正态分布时,一般是很难确定其总体中的未知参数,但当样本量n很大时,我们可利用中心极限定理按上式对其总计均数作出近似的区间估计。第17页/共62页2.t分布法(σ未知)根据t分布原理,P(-t/2,<t<t/2,)=1-
0/2/21--t/2t/2总体均数(1-)可信区间计算公式如下:第18页/共62页
对于例5-2,因为总体标准差未知,所以采用公式(5-6)计算总体均数的95%置信区间为:
48.65±1.984×1.523=48.65±3.02=(45.63,51.67)kg第19页/共62页95%可信区间~
可以认为是每抽100个由样本含量相等的样本算得的置信区间,平均有95个置信区间会包括总体均数,只有5个置信区间不会包括总体均数。置信区间的涵义第20页/共62页(1)置信区间~包括总体均数的可能性为95%;
(2)总体均数落在置信区间~范围内的可能性为95%;
(3)通过样本资料计算出的95%置信区间19.6~23.2kg包括总体均数的可能性为95%。判断:第21页/共62页置信区间的两个要素:1.准确度2.精密度反映在可信度1-的大小上,从准确度的角度,愈接近1越好,如99%可信区间比95%的好;它反映在区间的宽度上,即区间越窄越好第22页/共62页均数可信区间与参考值范围的区别1.含义:均数可信区间用于估计总体参数,而参考值范围用于估计变量值的分布范围。2.计算公式:均数可信区间的计算公式是基于统计量的抽样分布,而参考值范围的计算基于变量值的分布。第23页/共62页Bernoulli试验以A表示所感兴趣的事件,A事件发生称为“成功”,不发生称为“失败”。相应的这类试验称作为“成——败型”试验或Bernoulli试验。一、二项分布第四节
二项分布和Poisson分布
第24页/共62页必须满足下列三条件:(1)每次试验结果只能是两个互斥结果之一(A或非A)。(2)每次试验的条件不变,每次试验结果
A事件发生的概率为常数。(3)各次试验独立,即每次试验出现事件
A的概率与前面各次试验出现的结果无关。第25页/共62页概率的运算法则乘法法则:几个相互独立事件的乘积(同时发生)的概率等于各独立事件概率之积:
P(A1A2···An)=P(A1)P(A2)···P(An
)可加性:互不相容事件A1、A2、、An(任一次试验至多一个出现)的和(至少一个发生)的概率等于各事件发生的概率之和:
P(A1+A2+···An)=P(A1)+P(A2)++P(An)第26页/共62页二项分布—成功次数的概率分布
某实验中小白鼠染毒后死亡概率:为0.7,则生存概率为:1-=0.3,故对一只小白鼠进行实验的结果为:死(概率为)或生(概率为1-
);第27页/共62页对二只小白鼠(甲乙)进行实验的结果为:甲乙均死 [概率为2]甲死乙生 [概率为(1-)]乙死甲生 [概率为(1-)]甲乙均生 [概率为(1-)2]概率相加得:
2+(1-)+(1-)+(1-)2
=[+(1-)]2
第28页/共62页对三只小白鼠(甲乙丙)进行实验的结果为:表3只白鼠各种实验结果及其发生概率概率相加得:[+(1-)]3
第29页/共62页
对n只小白鼠进行实验,所有可能结果的概率相加得:n+Cn1(1-)n-1+…+Cnx
x(1-)n-x+…+(1-)n=[+(1-)]nn次试验中事件A出现的次数为x的概率是:
,k=0,1,2,…n
记为xB(n,)第30页/共62页表5-3接种3人可能出现不适反应的人数及其概率第31页/共62页二项分布的性质:(1)二项分布的概率之和等于1,即(2)单侧累积概率至少有m例阳性的概率(上侧累积概率)至多有m例阳性的概率(下侧累积概率)第32页/共62页(3)二项分布的均数和标准差若x~B(n,),则x
的总体均数µ=n,x的总体方差2=n
(1-)x的标准差第33页/共62页(4)二项分布的正态近似性
二项分布图形的形状取决于和n
的大小;二项分布的图形有如下特征:当=0.5时,无论n的大小,均为对称分布;当
<或>0.5,n较小时为偏态分布,n较大时逼近正态分布。第34页/共62页第35页/共62页n=5=0.3第36页/共62页n=10=0.3第37页/共62页n=20=0.3第38页/共62页当不接近于0或1,n不是很小,n≥5且n(1-)≥5时,二项分布近似正态分布,有因此,二项分布的正态近似拓宽了二项分布的应用范围,应用十分方便。第39页/共62页样本率p的总体均数:
当样本含量较大,总体阳性率不接近与0,也不接近于1时,样本中的阳性数近似正态分布N(n,),样本阳性率也近似正态分布N(,p),故有样本率p的标准差:样本率的分布和正态近似第40页/共62页例补1:根据以往经验,新生儿染色体异常率一般为1%,某医院观察了当地400名新生儿,只有l例染色体异常,问该地新生儿染色体异常率是否低于一般?H0:=0.01H1:<0.01(1/400<0.01)单侧=0.05P(x1)=P(0)+P(1)=0.99400+4000.010.99399=0.0905P=0.0905>0.05,按=0.05水准尚不能拒绝H0,尚不能认为该地新生儿染色体异常率低于一般。第41页/共62页Poisson分布更多地专用于研究单位时间、单位面积、单位空间,单位人群内某罕见事件发生次数的分布。如某种细菌在单位容积空气或水中出现的情况,某段时间特定人群中某种恶性肿瘤患者的分布或出生缺陷的发病情况,放射性物质在单位时间内的放射次数,单位空间某种昆虫数的分布等等。二、泊松分布第42页/共62页用于描述事件出现概率很小而样本含量或试验次数很大的随机变量的概率分布。理论上可以证明二项分布当n很大而很小时的极限分布是泊松分布。由二项分布的概率公式可推导出泊松分布的概率计算公式为:泊松分布的概率函数为:记作k=0,1,2,
第43页/共62页例5-4某地新生儿先天性心脏病的发病率为9‰,该地100名新生儿中有3人患先天性心脏病的人数概率有多大?将n=100,=9‰代入公式得:=0.9=0.049即该地100名新生儿中有3人患先天性心脏病的人数概率为49‰。(程序)第44页/共62页泊松分布的性质
1.泊松分布的均数和方差=2
2.泊松分布的可加性
随机变量x1,x2,,…,xk相互独立,分别服从参数(均数)为μ1,μ2,…,μk的泊松分布,则也服从泊松分布,参数μ
=μ
1+μ
2+…+μ
k
第45页/共62页3.泊松分布的正态近似
若已知参数,可计算不同x取值的概率,以x为横坐标,可能取值的概率P为纵坐标,可绘制泊松分布的图形。
当足够大时,泊松分布趋向于正态分布。一般
20,即可认为泊松分布近似于正态分布。第46页/共62页
μ=3
μ=5第47页/共62页
μ=10第48页/共62页
μ=20第49页/共62页例补2:据以往大量观察得某溶液中平均每毫升有细菌3个。某研究者想了解该溶液放在5℃冰箱中3天,溶液中细菌是否会增长。他采取已放在5℃冰箱中3天的该溶液1毫升,测得细菌5个,请作统计推断。第50页/共62页P(X≥5)>,故不拒绝H0,即不能认为该溶液在5℃冰箱中放置3天,会引起溶液中的细菌数增长。第51页/共62页第五节总体率的估计【例5-5】某市疾控中心对该市郊区200名小学生进行贫血的检测,结果发现有80名小学生贫血,检出率为40.0%,则认为该市郊区小学生贫血率为40.0%。【问题】
(1)这是什么资料?(2)该研究属于何种设计方案?(3)以此次抽样得到小学生贫血率40.0%来代表该市郊区小学生贫血率是否合适?(4)怎样估计该市郊区小学生贫血率?第52页/共62页一、率的抽样误差与标准误由于抽样而引起的样本率与总体率及样本率间的差异称为率的抽样误差,与均数的抽样误差可以用均数的标准误度量一样,率的抽样误差的大小亦可以用率的标准误来度量。率的标准误由下式计算例6-6,n=200,p=0.40,代入公式得sp=0.035。第53页/共62页
二、总体率的估计当样本例数较小(n50),特别是p接近于0或1时,根据二项分布的原理确定总体率的可信区间。1970年,Miettinen根据二项分布和F分布的关系,导出了总体率的可信区间算法。精确概率法或查表法第54页/共62页
【例5-6】2003年4~6月某医院重症监护病房收治重症SARS患者38人,其中死亡12人,求SARS病死概率的置信区间。查附表3,n=38,x=12,在x与n的纵横交叉处,得到SARS病死概率的95%置信区间为18%~49%。第55页/共62页正态近似法当样本例数n较大,p和1-p均不太小,如np和n(1-p)均大于5。总体率的1-的可信区间为(p-z/2
Sp,p+z/2Sp)即该乡镇小学生贫血率的95%置信区间为(33.2%,46.8%)。例5-5,n=200比较大,p=0.4,np=80,n(1-p)=120,均大于5,第56页/共62页最佳选择题1.描述均数抽样误差大小的统计指标是()。A.标准差B.方差C.均数的标准误D.变异系数E.离均差平方和2.
减少均数的抽样误差的可行方法之一是():A.严格执行随机抽样B.增大样本含量C.
设立对照D.选一些处于中间状态的个体E.选一些处于极端状态的个体第57页/共62页3.在标准差与标准误的关系中,说法正确的是():A.样本例数增大时,标准差减小,标准误不变B.可信区间大小与标准差有关,而正常值范围与标准误有关C.样本例数增大时,标准差增大,标准误也增大D.样本的例数增大时,标准差与标准误均减小E.总体标准差一定时,增大样本例数会减小标准误4.关于t分布的图形,下述哪项是错误的()。A.当自由度
趋于无穷大时,t分布趋于标准正态分布B.无论自由度为多少,t分布曲线下的面积都为1C.自由度越小,则t分布的尾部越高D.t分布是一条以为中心左右对称的曲线E.t分布是一簇曲线,故临界值因自由度的不同而不同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内陆养殖与农村文化创意产业考核试卷
- 玻璃安装合同范例范文
- 内陆养殖供应链管理与产业升级策略考核试卷
- 打造数字化客户服务体验考核试卷
- 低温仓储物流信息系统案例考核试卷
- 消防机构销售合同模板
- 中介服务租房合同模板
- 智能化工合同模板
- 物料制作类 合同范例
- 投资款无合同范例
- 特征提取(数字图像处理课件)
- 二年级看图写话(植树8篇)
- 统筹车辆合同范本
- 诗词九宫格课件
- 色盲检测图(俞自萍第六版)
- 大学生心理健康2021-22-2学习通课后章节答案期末考试题库2023年
- 硝酸钾安全技术说明书MSDS
- 第三单元《工具与技术》知识点-教科版六年级科学上册
- TD-T 1056-2019 县级国土调查生产成本定额
- 出监教育内容2
- 中建八局建筑工程绿色施工技术及管理手册(420余页 图文并茂)
评论
0/150
提交评论