版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定量资料的参数估计与假设检验基础演示文稿第一页,共四十页。优选定量资料的参数估计与假设检验基础第二页,共四十页。抽样研究与统计推断从总体中随机抽取一定量的观察单位作为样本进行抽样研究,然后由样本信息(统计量)推断总体特征(参数)的过程,称为统计推断(statisticalinference)。这种研究方法称为抽样研究。第三页,共四十页。抽样研究实验某研究者于2007年对安徽省高校2160名大学生进行了社会支持的抽样调查研究,其主观支持分满足正态分布。现从该正态分布总体中随机抽取20个个体组成样本,共抽取100次,分别计算每次抽样的样本均数、标准差,结果见表4-1。第四页,共四十页。第五页,共四十页。样本均数的抽样分布具有以下特征样本均数之间存在不同(why?)样本均数与总体均数间存在差异;(why?)样本均数的分布是以总体均数为中心,呈现近似正态分布;样本均数的变异程度(=0.901)明显小于原个体变量之间的变异(=4.102)。back第六页,共四十页。图4-1100个样本均数的直方图第七页,共四十页。如果没有个体变异……NoVariation!NoSamplingError!第八页,共四十页。如果没有抽样研究……NoRandomsampling!NoSamplingError!第九页,共四十页。抽样误差的定义100次抽样得到了不同的结果,原因何在?个体变异随机抽样不同大学生的社会支持分不同每次抽到的大学生人几乎不同抽样误差第十页,共四十页。
由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(samplingerror)。各种统计量都有抽样误差,这里我们以均数为研究对象抽样误差的定义第十一页,共四十页。抽样误差的表现抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别第十二页,共四十页。抽样误差的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机抽样
样本统计量已知统计推断风险第十三页,共四十页。抽样误差的规律性
既然抽样误差是有规律的,那么到底它的分布规律到底是怎样的?
第十四页,共四十页。中心极限定理从均数为μ,标准差为σ的正态总体中随机抽样,样本均数服从均数为μ,标准差为的正态分布。从均数为μ,标准差为σ的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为μ,标准差为的正态分布。
第十五页,共四十页。标准误的定义样本统计量(如均数)也服从一定的分布;与描述观测值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。用样本统计量的标准差来反映抽样误差的大小。又称标准误(standarderror)。第十六页,共四十页。标准误的计算计算公式为其中,为总体标准差,n为抽样的样本例数在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计第十七页,共四十页。标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。第十八页,共四十页。样本均数的抽样分布规律中心极限定理从均数为μ,标准差为σ的正态总体中随机抽样,样本均数服从均数为μ,标准差为的正态分布。从均数为μ,标准差为σ的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为μ,标准差为的正态分布。
第十九页,共四十页。t分布的演化根据中心极限定理的内容,当样本含量足够大时,对从均数为μ,标准差为σ的任意总体中随机抽样所得的样本均数进行标准化变换,有第二十页,共四十页。t分布的演化由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差,这里,ν为自由度,取值为n-1由W.S.Gosset提出第二十一页,共四十页。
f(t)
=∞(标准正态曲线)
=5
=10.10.2-4-3-2-1012340.3自由度分别为1、5、∞时的
t分布t分布的图形第二十二页,共四十页。t分布的性质t分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。t分布以0为中心,左右对称。分布的高峰位置比u分布低,尾部高。t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。每一自由度下的t分布曲线都有其自身分布规律。t界值表。第二十三页,共四十页。t界值表单侧:
P(t<=-tα,ν)=α或
P(t>=tα,ν)=α双侧:
P(t<=-tα,ν)+P(t>=tα,ν)=α
即:P(-tα,ν<t<tα,ν)=1-α[例]查t界值表得t值表达式
t0.05,10=2.228(双侧)
t0.05,10=1.812(单侧)-tt0第二十四页,共四十页。统计推断所谓统计推断(statisticalinference),是指如何抽样,以及如何用样本性质推断总体特征。参数估计(parameterestimation)假设检验(hypothesistesting)第二十五页,共四十页。参数估计点估计(PointEstimation)区间估计
(IntervalEstimation)第二十六页,共四十页。参数估计之一:点估计用样本统计量作为总体参数的估计例4-2
在例4-1编者2007年对安徽省高校2160名大学生进行了社会支持的调查研究中,某班级30名同学主观支持得分的平均数为18.89,标准差为4.079,试估计安徽省高校大学生主观支持的平均得分。本例中某班级大学生主观支持平均得分=18.89分,按照点值估计,则安徽省高校大学生主观支持得分的总体均数μ为18.89分。
第二十七页,共四十页。点估计的缺陷μ=?分σ=?分
x1,x2,x3,x4……
N
=18.75分S=4.68分x1,x2,x3…x10
=18.91分S=4.72分x1,x2,x3…x10
=18.88分
S=4.81分x1,x2,x3…x10样本含量n=10第二十八页,共四十页。区间估计可信区间的定义总体均数可信区间的计算均数之差的可信区间可信区间的要素正确理解可信区间的含义第二十九页,共四十页。区间估计例4-3根据例4-2中某班级30名同学主观支持得分的平均数为18.89,标准差为4.079,试估计安徽省高校大学生主观支持得分均值的95%可信区间。第三十页,共四十页。区间估计的实质假设某个总体的均数为µ,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含µ。即P(A<µ<B)=0.95第三十一页,共四十页。可信区间的定义按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidenceinterval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidencelevel),常取95%或99%。可信区间(CL,CU)是一开区间
CL、CU
称为可信限第三十二页,共四十页。均数的(1-α)100%可信区间-t/2,v0t/2,v
1-/2/2第三十三页,共四十页。均数的95%可信区间σ
未知且n较小时(n≤50):按t分布σ
已知或σ
未知但n足够大(n>50),按Z分布第三十四页,共四十页。总体均数单侧的可信区间
例4-4
从某高校随机抽取并测量了40名男大学生的肺活量,得到肺活量均值为3901ml,标准差为457ml,试估计该校男大学生肺活量均值的95%可信区间。故该高校男大学生肺活量均值的95%可信区间为:高于3779.2ml。第三十五页,共四十页。例:【例4.1】随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。【例4.2】某市2001年120名7岁男童的身高=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。第三十六页,共四十页。可信区间的两个要素可信度(Confidence):准确性,可靠性,即1-α。一般取90%,95%,可人为控制精确性(Precision):区间的大小,越小越好。必须二者兼顾第三十七页,共四十页。可信区间的宽度及影响因素均数的95%可信区间为则其宽度为第三十八页,共四十页。可信区间的宽度可信度越大,可信区间越宽,说明用该区间来估计总体参数(总体均数)越可靠。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 进社区交通安全宣传
- 怎样正确佩戴安全帽
- 企业年度安全生产工作总结模板
- 综合实践的知识课件
- KAPPA色彩常识介绍模特搭配技巧
- 护理学导论 健康与疾病
- 法学选修-经典法律案例评析-经济法-房地产调控法律分析
- 办公资产管理年终总结
- 2025版高考化学二轮复习 板块1 题型突破4 突破点2
- 腔镜肝癌手术疑难病例讨论
- 中学生标准学术能力诊断性测试2024-2025学年高三上学期10月月考试题 英语 含答案
- 2024新版行政复议法知识培训课件
- 石家庄市2025届高三教学质量摸底检测英语试题
- 专项15-分式方程的应用-八大题型
- 冠心病课件完整版本
- 2024年变电所值班制度(三篇)
- 北京市海淀区2023-2024学年五年级上学期数学期末试卷
- 新苏教版四上科学4-15《生活中的电》课件(26张课件)
- 2024-2025学年统编版八年级语文上学期 专题05 非连续文本阅读
- 工程结算资料清单
- 2024年四川广元市引进高层次和急需紧缺人才拟聘历年高频难、易错点500题模拟试题附带答案详解
评论
0/150
提交评论