版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基本概念(复习)总体:根据研究目的所定的同质研究对象中所有观察单位的某变量值的集合。分无限总体和有限总体。样本:按随机化原则从同质总体中随机抽取的部分观察单位的某变量值的集合。变量类型:数值变量资料和分类变量资料。统计量:描述样本特征的指标。参数:描述总体特征的指标。1当前第1页\共有59页\编于星期五\6点基本概念(复习)概率:描述随机事件发生可能性大小的一个度量。正态分布
;标准正态分布抽样研究(samplingstudy):用样本信息推断总体特征的研究方法。统计推断(statisticalinference):即如何抽样以及如何用样本信息推断总体特征。包括总体参数估计和假设检验。2当前第2页\共有59页\编于星期五\6点抽样研究:样本信息总体特征统计推断:总体参数的估计假设检验3当前第3页\共有59页\编于星期五\6点抽样误差(samplingerror):由于个体变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异,称为抽样误差。抽样误差产生的两个前提条件:
①个体变异;②抽样研究抽样误差的大小与两个因素有关:①总体中个体变异的程度;②抽样时的样本含量大小抽样误差在抽样研究中是不可避免的,但只要严格遵循随机化抽样的原则,就能估计抽样误差的大小。4当前第4页\共有59页\编于星期五\6点由于变异的存在,抽样研究所造成的样本均数与总体均数的差异,以及各样本均数间的差异称为均数的抽样误差。抽样误差在抽样研究中是不可避免的,但只要严格遵循随机化抽样的原则,就能估计抽样误差的大小。第一节均数的抽样误差和总体均数的估计5当前第5页\共有59页\编于星期五\6点抽样实验假设某市16岁女中学生的身高值分布服从均数=155.4cm,标准差=5.3cm的正态分布,即x~N(155.4,5.32)。
从该总体中以样本含量n反复进行抽样(如抽10000个样本),分别计算样本均数,编制频数表,绘制直方图,观察样本均数的分布。6当前第6页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中以样本量n=10抽样10000次
7当前第7页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中以样本量n=20抽样10000次8当前第8页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中以样本量n=30抽样10000次9当前第9页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中以样本量n=50抽样10000次10当前第10页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中以样本量n=100抽样10000次11当前第11页\共有59页\编于星期五\6点抽样实验结果——样本量不同时,样本均数的分布12当前第12页\共有59页\编于星期五\6点抽样实验结果——样本量不同时,样本均数的标准差13当前第13页\共有59页\编于星期五\6点抽样实验结果——
总体标准差不同时,样本均数的分布14当前第14页\共有59页\编于星期五\6点抽样实验结果——总体标准差不同时,样本均数的标准差15当前第15页\共有59页\编于星期五\6点样本均数的抽样分布(samplingdistribution)具有如下特点::①各样本均数未必等于总体均数;②各样本均数间存在差异;③样本均数的分布围绕着总体均数,中间多两边少,左右基本对称,近似服从正态分布;④样本均数的变异范围较之原变量的变异范围小;⑤随着样本含量的增大,样本均数的变异范围逐渐缩小。16当前第16页\共有59页\编于星期五\6点理论上可以证明,从正态分布总体中以固定n抽样时,样本均数的分布仍服从正态分布。
当样本含量n足够大时,即使从偏态分布总体中以固定n抽样,其样本均数的分布也近似服从正态分布。17当前第17页\共有59页\编于星期五\6点非正态总体(正偏态)抽样样本均数的分布18当前第18页\共有59页\编于星期五\6点非正态总体(正偏态)抽样样本均数的分布19当前第19页\共有59页\编于星期五\6点均数的标准误样本均数的标准差(记为),反映的是样本均数与其总体均数之间的离散程度,即的大小,所以可将其作为描述均数抽样误差大小的指标。计算如下:(理论值)(估计值)通常,将样本统计量的标准差称为标准误(standarderror,SE)。样本均数的标准差也称均数的标准误(standarderrorofmean,SEM)
。20当前第20页\共有59页\编于星期五\6点标准误小,表示抽样误差小,样本均数的代表性好;反之,标准误大,表示抽样误差大,样本均数的代表性差。在实际工作中,可通过适当增加样本含量和减少观察值的离散程度(选择同质性较好的样本)来减少抽样误差。标准误的意义:21当前第21页\共有59页\编于星期五\6点22当前第22页\共有59页\编于星期五\6点0t分布一簇曲线0N(0,1)n足够大时,(1)(2)(3)以固定n随机抽样英国统计学家Gosset23当前第23页\共有59页\编于星期五\6点均数的抽样分布——t分布24当前第24页\共有59页\编于星期五\6点t分布是一种连续性分布,主要用于t检验和总体均数估计等问题。25当前第25页\共有59页\编于星期五\6点=3t分布曲线26当前第26页\共有59页\编于星期五\6点t-distributionstandardnormaldistributiont分布的特征为:1.以0为中心,左右对称的单峰分布。2.t分布曲线形态变化与自由度的大小有关。自由度越小,t值越分散,曲线越低平;自由度逐渐增大时,则分布逐渐逼近正态分布(标准正态分布)。当自由度趋于无穷大时,t分布即为u分布。27当前第27页\共有59页\编于星期五\6点t分布与标准正态分布28当前第28页\共有59页\编于星期五\6点t分布与标准正态分布29当前第29页\共有59页\编于星期五\6点t分布与标准正态分布30当前第30页\共有59页\编于星期五\6点t分布与标准正态分布31当前第31页\共有59页\编于星期五\6点t分布与标准正态分布32当前第32页\共有59页\编于星期五\6点t分布与标准正态分布33当前第33页\共有59页\编于星期五\6点t分布与标准正态分布34当前第34页\共有59页\编于星期五\6点35当前第35页\共有59页\编于星期五\6点t分布的分位数(双侧t界值)/2/21-t/2,-t/2,36当前第36页\共有59页\编于星期五\6点1-t,t分布的分位数(单侧t界值)37当前第37页\共有59页\编于星期五\6点-tt038当前第38页\共有59页\编于星期五\6点三、总体均数的估计(一)点估计(pointestimation)(二)区间估计(intervalestimation)
按照一定的概率估计总体参数可能所在的一个范围,称为区间估计。概率——可信度,通常取95%或99%。所估计的总体参数的范围——可信区间(confidenceinterval)39当前第39页\共有59页\编于星期五\6点总体均数的区间估计1、当未知且n较小时,由于服从t分布,可按t分布原理估计总体均数的可信区间。由于即故总体均数(1-)100%的可信区间为40当前第40页\共有59页\编于星期五\6点总体均数的区间估计2、当未知但n足够大时(n>100),t分布近似u分布,可以u界值代替t界值,估计总体均数的可信区间。3、当已知时,可按正态分布的原理,估计总体均数的可信区间。41当前第41页\共有59页\编于星期五\6点例3
某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64
mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。
故该地正常成年人血清胆固醇均数的95%可信区间为(3.47,3.81)mmolL。42当前第42页\共有59页\编于星期五\6点四、可信区间的确切涵义43当前第43页\共有59页\编于星期五\6点
1.95%的可信区间的理解:(1)我们所估计的可信区间有95%的可能包含所要估计的总体参数。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。
44当前第44页\共有59页\编于星期五\6点
2.可信区间的两个要素(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。(2)精确度:反映在区间的宽度上。区间愈窄愈好,如95%的可信区间比99%的可信区间要好。45当前第45页\共有59页\编于星期五\6点
当n确定时,上述两者互相矛盾。提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。相反,在实际应用中,95%可信区间更为常用。在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。46当前第46页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.0547当前第47页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.0548当前第48页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.1049当前第49页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.1050当前第50页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.0151当前第51页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=10,=0.0152当前第52页\共有59页\编于星期五\6点n=10=0.05=0.10=0.01准确度(可信度)逐渐降低,精确度逐渐升高;53当前第53页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=30,=0.0554当前第54页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=30,=0.0155当前第55页\共有59页\编于星期五\6点从正态总体N(155.4,5.32)中抽样n=30,=0.1056当前第56页\共有59页\编于星期五\6点n=30=0.01=0.05=0.10准确度(可信度)逐渐降低,精确度逐渐升高;57当前第57页\共有59页\编于星期五\6点=0.05n=10n=30准确度(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版劳动者劳动社会保险合同(特殊工种)3篇
- 二零二五版水沟施工与承包劳务合同范本2篇
- 二零二五版家政服务公司家政服务与品牌建设合同3篇
- 二零二五版宅基地使用权转让与房屋租赁一揽子合同2篇
- 二零二五版远程办公劳动合同签订与工作质量监控3篇
- 二零二五版办公用品耗材行业联盟采购合同2篇
- 二零二五版旅游租车服务合同范本2篇
- 2025年草原草原生态保护与资源合理利用合同3篇
- 二零二五版家具原料采购合同与供应链管理协议3篇
- 展会市场调研服务合同(2篇)
- 非ST段抬高型急性冠脉综合征诊断和治疗指南(2024)解读
- 产品共同研发合作协议范本5篇
- 风水学的基础知识培训
- 2024年6月高考地理真题完全解读(安徽省)
- 吸入疗法在呼吸康复应用中的中国专家共识2022版
- 1-35kV电缆技术参数表
- 信息科技课程标准测(2022版)考试题库及答案
- 施工组织设计方案针对性、完整性
- 2002版干部履历表(贵州省)
- DL∕T 1909-2018 -48V电力通信直流电源系统技术规范
- 2024年服装制版师(高级)职业鉴定考试复习题库(含答案)
评论
0/150
提交评论