第四讲 数值变量资料的统计推断 06-03-6_第1页
第四讲 数值变量资料的统计推断 06-03-6_第2页
第四讲 数值变量资料的统计推断 06-03-6_第3页
第四讲 数值变量资料的统计推断 06-03-6_第4页
第四讲 数值变量资料的统计推断 06-03-6_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲数值变量资料的统计推断10/15/20231统计推断Statisticalinference

是用样本信息推论总体特征的过程。(一)参数估计(二)假设检验10/15/20232一、参数估计(一)点估计(二)区间估计(置信区间)10/15/20233二、假设检验又称显著性检验,是指由样本均数间存在的差别对样本所代表的总体均数间是否存在着差别所做出判断的分析推断方法及过程。10/15/20234

样本均数与总体均数之间的差异或样本均数之间的差异,称为均数的抽样误差(samplingerrorofmean)。

均数的标准误()是描述均数的抽样误差大小的统计指标。一、均数的抽样误差与标准误10/15/20235统计理论表明:

1.从正态总体中随机抽取例数为n,样本均数也服从正态分布;2.从均数为μ,标准差为σ的正态或近似正态的总体中抽取例数为n的样本,样本均数的总体均数为μ,标准差。标准误的计算公式为:

10/15/20236

由于在实际抽样计算中,σ常属未知,而通常仅用一个样本的标准差S作为σ的估计值,其计算公式为:

均数标准误的用途:

1.可用来衡量样本均数的可靠性。2.结合样本均数和正态分布曲线下的面积分布规律,可用与估计总体均数的置信区间。3.可用于均数的假设检验。4.可作实验室的质量控制

10/15/20237

二、t分布

采用变换,则将一般的正态分布N(μ,σ2)变换为标准正态分布N(0,1),u叫作标准正态变量。正态分布N(μ,),同样可对正态变量采用u变换,,将N(μ,)变换成标准正态分布N(0,1),即U分布。10/15/20238在实际工作中,往往是用来估计的,这时对正态变量采用的不是u变换,而是t变换,即:

10/15/20239

t分布是一簇对称于0的单峰分布曲线。自由度(实际上是样本含量n-1)越小,曲线越扁平,随着自由度的增大,t分布曲线逐渐逼近标准正态曲线。

t分布主要用于总体均数的区间估计和

t

检验。10/15/202310三、总体均数的估计(参数估计)

参数估计有两种方法:

点估计和区间估计

1.点估计(pointestimation)以样本统计量直接估计总体参数。未考虑抽样误差的存在。即:

μ

2.区间估计(intervalestimation)以预先给定的概率估计总体参数在哪个范围内的估计方法称为区间估计。10/15/202311(1)σ已知时,按正态分布原理,用公式估计总体均数的95%的置信区间。(2)σ未知、且样本例数较小时,按t分布原理,估计总体均数的95%置信区间。

(3)σ未知,但样本例数n足够大时,按正态分布原理,估计总体均数95%置信区间。10/15/202312区间估计(置信区间)例9-13(P289)健康男子20人,即n=20ν=n-1收缩压均数为:

标准差为:

代入公式:

10/15/202313以14岁130例女孩计算指标:

10/15/202314四、假设检验的基本步骤

1.建立检验假设:无效假设H0

备择假设H1

2.确定检验水准:

α=0.053.选定检验方法和计算检验统计量4.根据自由度确定P值5.判定统计结果,定专业结论10/15/202315

第四节t检验和u检验

t

检验(t-test)的应用条件:当样本例数较小(n<30),样本来自呈正态分布的总体,总体标准差未知。在做两个样本均数比较时,还要求两样本相应的总体方差相等()。

一、样本均数与总体均数的比较

样本均数与总体均数比较的目的是推断样本所代表的未知总体均数μ与已知的总体均数μ0是否有差别。10/15/202316例9-15

P291建立检验假设:定检验水准:计算t值

4.定P值,判定结果:

t<t0.05∴P

>0.05,差别无显著性

在的水准上,接受H0,该法测得均数与真值相同

10/15/202317二、配对资料的比较

配对设计的均数的假设检验有三种情况:

1.自身比较;

2.同一样品用两种方法检验的结果;3.对成对设计的两个受试对象分别给予两种处理,目的都是推断两种处理的效果有无差别。统计量的计算公式为:

10/15/202318例问该药是否对高血压患者治疗前后舒张压

是否有影响?1.建立检验假设,定检验水准:2.计算t值3.定P值:4.判定定结果:t>t0.01,73.99∴P<0.01,

差别有高度显著性在的水准上,拒绝H0,接受H1,差别有高度显著性,该药有影响。10/15/202319三、

两个小样本均数的比较

10/15/202320

表用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数

高蛋白组1341461041191241611078311312997123

低蛋白组7011810185107132941.建立检验假设,定检验水准:α=0.05

2.计算t值:10/15/2023213.定P值:

t=1.894.定结果:在α=0.05的水准上,接受H0,t<t0.05,172.11,∴P>0.05,差别无显著性,不能认为两种饲料对大白鼠有影响。

10/15/202322

U检验(U-test)应用条件:当样本例数较大(n>30),样本来自呈正态分布的总体,总体标准差未知。在做两个样本均数比较时,要求两样本相应的总体方差相等(),变量为独立的随机样本。10/15/202323一、大样本均数与总体均数的比较

例题:已知一般正常成年男子脉搏均数74次/分,现测得某山区100名正常成年男子脉搏65.26次/分,标准差为7.2次/分,问:山区正常成年男子脉搏均数是否比一般正常成年男子脉搏跳动得较慢?已知:(1)总体均数:μ=74次/分;(2)样本均数:=65.26次/分;(3)样本均数的标准差:S=7.2次/分n=10010/15/202324分析计算大样本10/15/202325建立检验假设:2.定检验水准:3.计算u值:

4.定P值,判定结果:

u=12.14>u0.01∴P<0.01,差别有高度显著性

在的水准上,拒绝H0,

接受H1,山区正常成年男子脉搏均数是比一般正常成年男子脉搏跳动得较慢。

10/15/202326

2.两个大样本均数的比较10/15/202327例题9-17

男女新生兒甘油三酯浓度测定值如下:男婴n1=175女婴n2=167(一)建立检验假设(二)定α水准(三)选方法,求检验统计量(四)定P值,判定结果10/15/202328在α=0.05的水准上,接受H1,U<U0.051.96,∴P>0.05,差别无显著性,男女新生兒甘油三酯浓度相同。10/15/202329四、假设检验应注意的问题

1.资料必须合乎随机化抽样原则2.选用的假设检验方法应符合其基本应用条件3.实际差别大小与统计意义的区别4.进行假设检验时对差异有无显著性或有无统计意义的判断不能绝对化5.假设检验的单侧检验与双侧检验的选择10/15/202330

方差分析(F-检验)

方差分析(analysisofvariance,ANOVA

)能用于两个或两个以上样本均数的比较,还可分析两个或多个研究因素的交互作用以及回归方程的线性假设检验。

应用的条件是:

1.各样本的每个变量值是相互独立的随机变量2.各样本都来自呈正态分布的总体3.各个总体方差齐10/15/202331一、方差分析的基本思想

把全部观察值之间的变异----总变异,按设计和需要分为两个(组间、组内-误差)变异或多个变异部分,其自由度也分解为相应的部分。计算变异间的比值(F值),若F值接近于1,可认为处理因素无作用;若F值远大于1,且大于或等于F界值表中的某界值时,可认为处理因素有作用。10/15/202332变异分割10/15/202333二、单因素的方差分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论