第四章 统计推断_第1页
第四章 统计推断_第2页
第四章 统计推断_第3页
第四章 统计推断_第4页
第四章 统计推断_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计推断第1页,共65页,2023年,2月20日,星期三第一节统计推断的意义与原理一、统计推断的意义和内容

统计推断,就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。统计推断包括统计假设检验和参数估计两部分内容。

第2页,共65页,2023年,2月20日,星期三

统计假设检验又称显著性检验,它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计包括两个方面,一是参数的点估计,二是参数的区间估计。二、统计量的抽样分布与统计推断的关系第3页,共65页,2023年,2月20日,星期三图1随机抽样和统计推断示意图假设检验(定性)参数估计(定量)样本特征(统计量)可知总体特征(参数)一般未知样本1样本2样本Nn随机抽样样本容量n统计推断

总体(N)样本3第4页,共65页,2023年,2月20日,星期三第5页,共65页,2023年,2月20日,星期三三、假设检验1.假设检验的基本原理我们结合一个实例说明统计假设检验的基本原理。例如:将20只老鼠随机分为数目相等的两组,一组作对照不注射催产素,另一组注射,然后在规定的时间内测定每组各个体的血糖值。假定测定的结果对照组平均值为:=109.17,注射催产素组为:=106.88,两样本平均数并不相等,其差值(表面效应)为:

=109.17-106.88=2.29,第6页,共65页,2023年,2月20日,星期三这是否意味着注射与不注射催产素两种不同的处理,老鼠体内血糖含量一定存在有显著差异,即两相应总体血糖含量不等(≠)呢?由于抽样的原因,两样本平均数之差(),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分,到底后者存在与否,需要进行统计分析。计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成,也就是假设两样本所属总体无差异。抽样误差出现的概率可利用前面所介绍的抽样分布来计算,这里只要设定一概率标准,例如,表面效应由误差造成的概率不大于5%便可推断表面效应不大可能由误差所引起第7页,共65页,2023年,2月20日,星期三

统计假设检验的基本原理:

是根据试验目的对要比较的总体提出假设,先承认待检验的假设成立,然后观察在此假设前提下样本的出现是否属于小概率事件,如果是小概率事件,则有充分的理由怀疑或否定原假设,反之则不能否定原假设。

第8页,共65页,2023年,2月20日,星期三

2.统计假设检验基本步骤

例:

设某一肉用仔鸡常规饲养条件下50d体重的总体平均值为:=2250g,方差为:=62500g2。从该群体中随机选择25羽初生雏鸡,在常规饲养基础上添加某种中药添加剂饲养50d,测得该样本平均值为:=2375g,问添加中药添加剂是否对仔鸡50d体重有影响?假设检验的基本步骤为:

第9页,共65页,2023年,2月20日,星期三(1)根据实际需要对未知或不完全知道的总体提出假设无效假设H0:对需推知的总体参数提出的假设。(被直接检验的假设称为原假设)

备择假设HA:在拒绝无效假设后可供选择的假设。

H0和HA是一对立事件,且构成完全事件系,即否定H0

就意味着接受HA,接受H0

就意味着否定HA。本例,无效假设H0为:,即用中药饲养的25羽雏鸡组成的样本所属的总体平均值与指定的正常饲养情况下的总体平均值之间无实质差异。备择假设HA为:,即用中药作添加剂和不用中药作添加剂,该肉鸡种50d体重的确存在着显著差异。第10页,共65页,2023年,2月20日,星期三(2)在假定H0成立的前提下,根据统计量的抽样分布,计算实得差异由抽样误差造成的概率。(构造合适的统计量)第11页,共65页,2023年,2月20日,星期三第12页,共65页,2023年,2月20日,星期三在总体平均数为2250g(在H0成立下),方差为62500g2的正态总体中以样本容量为25进行抽样,抽得的一个样本平均数与总体平均数相差125g以上,由抽样误差造成的概率为0.0124。第13页,共65页,2023年,2月20日,星期三(3)根据小概率事件实际不可能性原理判断是否接受H0

本例,在假定H0成立的前提下,经计算一个样本平均数与总体平均数相差125以上,这一事件由抽样误差造成的概率为0.0124,小于0.05,所以是一个小概率事件,根据小概率事件实际不可能性原理,可以获得如下结论:

在H0成立的前提下饲喂含中药添加剂的一个样本,其平均值与没有饲喂中药添加剂的总体平均值相差125g以上不是由抽样误差所造成,的确是由饲喂中药添加剂所造成的。因此可以否定H0,接受HA。

第14页,共65页,2023年,2月20日,星期三在H0成立的前提下,根据统计量的分布,计算实得差异(表面效应)由抽样误差造成的概率大于0.05,则实得差异(表面效应)由抽样误差造成的可能性较大,没有理由认为实得差异(表面效应)由两总体平均值不同而造成,检验的结果应当接受H0,两个总体平均值“差异不显著”;如果实得差异(表面效应)由抽样误差造成的概率在0.01~0.05之间,表示两个总体平均值“差异显著”,应否定H0,接受HA;如果其概率值小于0.01,同样否定H0,接受HA,表示两总体间存在“极显著差异”。第15页,共65页,2023年,2月20日,星期三

统计上,把否定H0的概率标准叫显著水平。用表示,是个小概率,在生物学研究中,一般取0.05和0.01两个等级。假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0,并设立备择假设HA;(2)确定检验的显著水平,在假定H0成立的前提下,根据统计量的抽样分布,计算实得差异(表面效应)由抽样误差造成的概率;(3)根据这个概率与显著水平比较的结果,由小概率事件实际不可能性原理进行差异显著性推断。(4)根据统计推断结果,结合相应的专业知识,给出一个专业的结论。第16页,共65页,2023年,2月20日,星期三3.假设检验的几何学意义假设检验是将统计量的分布分成两个不同的区域,一个为接受H0的区域,另一个是否定H0的区域。图2u分布统计假设检验的几何意义第17页,共65页,2023年,2月20日,星期三

由标准正态分布(u分布)概率计算可知,P(||>)=,所以接受区域和否定区域的临界值是和,统计假设检验可由样本计算的||与比较,确定是接受还是否定H0。上例中2.5,大于u0.05=1.96,所以u落在否定区域内,但又小于u0.01=2.58,所以实得差异由误差造成的概率在0.01~0.05间,“差异显著”。故否定H0。假设检验的第二步也可以不直接计算实得差异(表面效应)由抽样误差造成的概率,而是用实得差异相对应的检验统计量的值与假设检验的临界值比较,判断差异显著性。方法如下:

第18页,共65页,2023年,2月20日,星期三第19页,共65页,2023年,2月20日,星期三因此,假设检验步骤简写成:1、建立假设;2、计算检验统计量;3、确定否定域(临界值),作出统计推断第20页,共65页,2023年,2月20日,星期三4.两尾(双侧)检验和一尾(单侧)检验既考虑左边否定域又考虑右边否定域,即考虑统计量抽样分布曲线两侧(两个尾部)的检验称之为两尾检验。在生物学研究中两尾检验应用最为广泛。

第21页,共65页,2023年,2月20日,星期三在假设检验中,只有一个否定域(一侧)的假设检验叫一尾检验。即否定域在检验统计量抽样分布的一侧.

第22页,共65页,2023年,2月20日,星期三一尾检验与两尾检验的步骤相同,不同的是一尾检验将显著水平的概率值放到一侧,而不是将其均分到左、右两侧,因此实际上采用的假设检验临界值是和。在相同水平下,一尾检验否定区范围大于两尾检验,所以一尾检验更易否定H0(对差异识别能力强),因此,选用一尾检验,应根据专业知识和试验目的来判断是否有充足的依据。第23页,共65页,2023年,2月20日,星期三第24页,共65页,2023年,2月20日,星期三相伴概率:是指在原假设成立时检验统计量观测值以及所有比它更为极端的可能值出现的概率之和,用P表示。第25页,共65页,2023年,2月20日,星期三5.假设检验的两类错误第26页,共65页,2023年,2月20日,星期三第27页,共65页,2023年,2月20日,星期三第28页,共65页,2023年,2月20日,星期三第二节对单个和两个总体平均数的假设检验一、单个平均数的假设检验单个平均数的假设检验是检验一个样本所属的总体平均数μ与一个特定总体平均数μ0间是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定总体的统计分析方法。根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(表面效应)由抽样误差造成的概率。(一)、总体方差已知时单个平均数的假设检验

当总体方差已知时,根据样本平均数抽样分布的性质,无论样本容量是大是小,均可用u分布计算实得差异由抽样误差造成的概率,所以称u检验。第29页,共65页,2023年,2月20日,星期三

例1:测定了某品种37头犊牛100g血液中总蛋白的含量,其平均数为4.263g;该品种成年母牛100g血液中总蛋白含量为7.570g,标准差为1.001。问该品种犊牛和成年母牛血液中总蛋白含量是否存在显著差异?

1、建立假设

H0:犊牛和成年母牛间血液中总蛋白含量无显著差异;

HA:犊牛和成年母牛间血液中总蛋白含量存在显著差异。

第30页,共65页,2023年,2月20日,星期三(二)、总体方差未知时单个平均数的假设检验

例2:某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平均体重为100kg,现随机抽测10头猪进行称重,得体重数据如下:115,98,105,95,90,110,104,108,92,118(kg),试检验此收购人员的估计是否正确?

1、建立假设

H0:这批猪的平均体重为100kg;

HA:这批猪的平均体重不等于100kg。

2、计算检验统计量第31页,共65页,2023年,2月20日,星期三

第32页,共65页,2023年,2月20日,星期三

例3:正常情况下成年男子的脉搏数为72次/min,现随机检查25名慢性胃炎所至脾虚男病人的平均脉搏数为75.2次/min,标准差为6.54次/min,问此类脾虚男病人脉搏数是否显著地高于正常情况下测定的成年男子脉搏数?本例研究者的目的是推断此类脾虚男病人脉搏数是否快于正常成年男子的脉搏数=72次/min,所以应该用一尾检验。现在25名慢性胃炎所至脾虚男病人其平均脉搏数超过了正常测定值,一种可能由于抽样造成,实质此类男病人的脉搏数仍然正常或不高于,也有可能是由于身体内部生理等机制的共同作用,造成其显著高于。另外由于总体的方差未知,且样本不大,故用t检验。第33页,共65页,2023年,2月20日,星期三第34页,共65页,2023年,2月20日,星期三二、两个总体平均数的比较该类型的比较其实质是检验两独立样本所属总体平均数间是否存在显著差异。即检验第一个样本的平均值其总体平均值与第二个样本的平均值其总体平均值间差异是否显著。它经常用于生物学研究中比较两种不同处理其效应的差异显著性。生物学上,通常是将一定数量的试验单位(一般为试验动物的个体)随机分成两组,其中一组接受一种处理,另一组接受另一种处理,比较它们的总体平均值。

第35页,共65页,2023年,2月20日,星期三第36页,共65页,2023年,2月20日,星期三第37页,共65页,2023年,2月20日,星期三第38页,共65页,2023年,2月20日,星期三第39页,共65页,2023年,2月20日,星期三第40页,共65页,2023年,2月20日,星期三

例5:测定了31头犊牛和48头成年母牛血液中血糖的含量,得犊牛的平均血糖含量为81.23,标准差为15.64。成年母牛的平均血糖含量为70.43,标准差为12.07。犊牛和成年母牛间血糖含量有无显著差异?

1、建立假设2、计算检验统计量第41页,共65页,2023年,2月20日,星期三3、查表推断

实得差异由抽样误差造成是小概率事件,否定H0,接受HA。即:犊牛和成年母牛血液中血糖含量存在极显著差异。第42页,共65页,2023年,2月20日,星期三第43页,共65页,2023年,2月20日,星期三

第44页,共65页,2023年,2月20日,星期三第45页,共65页,2023年,2月20日,星期三t检验t值计算公式如下:t分布的自由度:

第46页,共65页,2023年,2月20日,星期三例6:研究两种不同中药添加剂饲料对香猪生长的影响,随机选择了12头香猪并随机分成两组,一组喂甲种饲料,另一组喂乙种饲料。饲养6周后增重(kg)结果如下:甲种饲料:6.65,6.35,7.05,7.90,8.04,4.45;乙种饲料:5.34,7.00,7.89,7.05,6.74,7.28。设两样本所属总体服从正态分布,且方差相等,试比较两种不同饲料对香猪生长的影响是否有显著差异。

本例总体方差未知,但,两样本含量相等且均较小,用合并均方计算t值。

1、建立假设

第47页,共65页,2023年,2月20日,星期三2、计算检验统计量3、查表推断

第48页,共65页,2023年,2月20日,星期三

例7:测定金华猪与长白猪肌内脂肪含量(%),金华猪共10头,平均值为3.93,标准差为0.4;长白猪4头,其平均值为2.56,标准差为0.4。试检验两品种猪的肌内脂肪含量是否存在显著差异。

第49页,共65页,2023年,2月20日,星期三第50页,共65页,2023年,2月20日,星期三第三节配对资料两平均值检验一、配对试验设计的设计方法

所谓配对试验设计,是先将试验条件尽可能相同的试验单元配成一对,然后将每一个对子内的两个试验单元独立随机地接受两个处理中的一种。配对设计的要求是:配成对子的两个试验单元的初始条件应尽可能一致;不同试验对子间的初始条件允许存在差异(有时为了使试验结果有更广泛的适应性,还应有意识地扩大对子间的差异)。每一个对子就是试验的一次重复。第51页,共65页,2023年,2月20日,星期三

配对的方式有以下几种:

1.同源配对可以将同窝或有一定亲缘关系的同性别、体重接近的两头动物配成一对,若干对这样的动物组成的配对叫同源配对,又称亲缘配对。

2.条件配对实际工作中,如达不到亲缘配对要求,也可将具有相近条件的试验单位配成对子,若干对这样的动物组成的配对叫条件配对。如动物可按同种属、同性别、同年龄、同体重进行配对。

第52页,共65页,2023年,2月20日,星期三

3.自身配对自身配对是指同一试验单位接受试验处理前后的两次测定值构成的配对;也可以是同一个动物个体对称的两个器官、组织、部位等构成的配对;同一份样品分成两半,一份接受一种处理,另一份接受另一种处理构成的配对。如n只小白鼠,同一个体X射线照射前后的两次体况测定值属自身配对;研究兔不同的拔毛方式对毛囊结构的影响,可以选择兔背中线两侧对称的区域作为配对的试验单位,也属于自身配对;两种不同方法分别测定n个动物个体药物残留所得数据,属于自身配对。第53页,共65页,2023年,2月20日,星期三二、配对设计资料的假设检验第54页,共65页,2023年,2月20日,星期三处理配对观测值(xij)样本容量样本平均数1

2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论