版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第5章参数估计总体样本抽取部分观察单位 统计量 参 数 统计推断统计推断 statistical inference如:样本均数 样本标准差S 样本率 P如:总体均数 总体标准差 总体率内容:参数估计(estimation of parameters) 包括:点估计与区间估计2. 假设检验(test of hypothesis)总体样本抽取部分观察单位 统计量 参 数 统计推断第一节样本均数的标准误如:样本均数 样本标准差S 样本率 P如:总体均数 总体标准差 总体率 抽样误差 (sampling error) :由于个体差异导致的样本统计量与总体参数间的差别。一、抽样试验 从正态分布总体N(
2、5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。抽样试验(n=5)抽样试验(n=10)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133个抽样实验结果图示由表可见,从同一总体中随机抽取样本
3、含量n=10的若干样本,各样本算得的样本均数并不等于相应的总体均数,且各样本均数也不完全相同。这种由于随机抽样而造成的来自同一总体的样本均数之间及样本均数与相应的总体均数之间的差异,称之为均数的抽样误差。 由于样本均数与相应的总体均数之间存在着差异,由数理统计推理可知:从正态总体中随机抽取样本含量为n的样本,每抽取一个样本可计算一个样本均数,重复1000次抽样可得到1000个样本均数。 这些样本均数服从均数为 ,方差为 的正态分布.其中 为样本均数的总体标准差,计算公式为: 为了与反映个体差异的标准差(或)相区别,样本均数的标准差用 表示。 统计上通常将统计量(如样本均数、样本率p等)的标准差
4、称为标准误(standard error,SE)。所以,样本均数的标准差 又称为样本均数的标准误,是反映样本均数抽样误差大小的指标。 特点: 的大小与总体标准差成正比,与样本含量的平方根成反比。即当样本含量n一定时,标准差越大,即样本的个体差异越大,标准误就越大,样本均数的抽样误差就越大;标准差越小,标准误就越小,即样本均数抽样误差就越小。 当 一定时,n越大,总体标准误就越小;n越小,总体标准误就越大。故影响抽样误差大小的主要因素是样本含量。作为总体参数(常数)通常是未知的,因而,在实际工作中常用样本标准差S来估计。二、总体均数的估计 (一) 总体均数的点估计(point estimatio
5、n)与区间估计参数的估计点估计:由样本统计量 直接估计 总体参数区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 统计学中的统计推断包括两个重要的方面:一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差S估计总体标准差等,称之为点估计。另一个是利用样本统计量来推断我们是否接受一个事先的假设,称之为假设检验。本章只讨论参数估计,假设检验将在下一章中讨论。而参数估计又分为点估计与区间估计。 1.点估计 总体均数的点估计(point estimation)就是用样本均数来直接地估计总体均数,这种方法比较简单,由于没有考虑到抽样误差
6、,只适合大样本资料的统计推断。 按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。 如给定=0.05,该范围称为参数的95%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计(interval estimation):总体均数可信区间的计算 总体均数可信区间的计算需考虑:(1)总体标准差是否已知, (2)样本含量n的大小通常有两类方法:(1)t分布法 (2)u分布法 1. 单一总体均数的可信区间 例 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mm
7、ol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。 故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。 例 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例( ),采用安慰剂;实验组32例( ),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),标准差为7.02 IU/ml ( );试验组治疗前IL-2的均数为16.89 IU/ml ( ),标准差为8.46 IU/ml ( )。问两组治疗前基线的IL-2总体均
8、数相差有多大? 第一步: 可信区间的确切涵义 1. 95%的可信区间的理解:(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。 2.可信区间的两个要素(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小 。当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。(2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区间要好 。 当n确定时,上述两者互相矛盾。提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。相反,在实际应用中,95%可信区间更为常用。 在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。 第二节 率的标准误一、率的抽样误差与标准误 由于抽样造成的样本率之间及样本率与总体率之间的差别称为率的抽样误差。 率的抽样误差大小可由率的标准误来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 借款合同印花税税率借款合同
- 营销顾问服务合同协议书
- 工程招投标与合同管理大学
- 高科技产品研发生产合同
- 涂层材料对主被动一体化热防护效果影响的实验研究
- 复杂电子对抗中的组网雷达功率分配与干扰智能识别及对抗研究
- 《动物的激素调节》课件
- 2025年西师新版七年级生物上册阶段测试试卷含答案
- 2025年中图版九年级历史下册阶段测试试卷
- 2025年浙教版七年级历史下册月考试卷
- 创新创业教育课程体系
- 包装品质彩盒外箱知识课件
- 神经外科课件:神经外科急重症
- 颈复康腰痛宁产品知识课件
- 2024年低压电工证理论考试题库及答案
- 微电网市场调查研究报告
- 《民航服务沟通技巧》教案第14课民航服务人员上行沟通的技巧
- MT/T 538-1996煤钻杆
- 小学六年级语文阅读理解100篇(及答案)
- CB/T 467-1995法兰青铜闸阀
- 气功修炼十奥妙
评论
0/150
提交评论