第五章 生物学统计推断_第1页
第五章 生物学统计推断_第2页
第五章 生物学统计推断_第3页
第五章 生物学统计推断_第4页
第五章 生物学统计推断_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学主讲教师:宋喜娥第五章统计推断☺统计推断的概念与内容☺

平均数的假设测验☺参数的区间估计☺样本容量的确定☺方差的统计推断第一节统计推断的概念与内容

统计推断的概念假设测验参数估计第五章一、统计推断的概念

统计推断:是指用一个或一系列样本的结果去估计总体可能的结果的过程。统计推断基本上包括两大部分的内容,一是假设测验,二是参数估计。二、假设测验(1)概念假设测验:判断统计假设是否正确的过程称为假设测验。3参数估计

参数估计:就是用样本的统计数来估计总体的参数。试验中常常遇到点估计和区间估计。点估计:所谓点估计就是利用样本的一个统计数直接对总体的相应参数进行估计。区间估计:所谓区间估计就是在一定概率保证下,利用样本结果估算出一个区间,使该区间包含被估计的参数。假设测验的推理方法具有以下两个特点:(1)用了反证法的思想,为了检验一个“假设”是否成立,我们就是假定这个假设是成立的,而看由此会产生什么后果,如果导致了一个不合理现象的出现,那就表明原来的假定是不正确的,也就是说“假设”是不能成立的。因此,我们拒绝这个假设。相反如果由此没有导致不合理现象发生,则不能拒绝原来的假设,称原假设是相容的。(2)它又区别于纯数学中的反证法,因为我们这里的所谓不合理,并不是形式逻辑中绝对的矛盾,而是基于人们在实践中广泛采用的一个原则:小概率事件在一次观察中可以认为基本上不会发生。第二节假设测验的类型与错误一、无效假设与备择假设无效假设:就是假设处理无效。用的药剂失效,或者新品种并不比原有品种高产等。总之假设总体参数与某一指定值相等,或者说实得差异是由于误差引起的。这种假设称为无效假设,用“H0“来表示。即H0:1=2.备择假设:一般来说和无效假设对应的有一个假设,我们把它叫做对应假设或者备择假设。其实就是假设药剂有效,或者新品种确实高产,也就是说实得差异不是由误差引起的,而是真正存在差异。用“HA”来表示。即HA:12。

第五章二、双尾测验与单尾测验虽然假设测验种类繁多,但从形式上看,只有两种类型,单尾测验和双尾测验。单尾测验:若备择假设只含有大于号或小于号,如HA:12或1-20等,对其相应的无效假设即:H0:12。在实践中,检验成批农产品质量是否符合某一规格要求,检验技术革新或栽培方式后农产品质量有无显著提高,或成本有无显著降低等,常常属于单尾测验。双尾测验:若备择假设同时含有大于号和小于号,如HA:1277或1277,对其相应的无效假设即H0:=1277等诸如此类者称为双尾测验。单尾测验与双尾测验的方法与步骤非常相似,只是在如何确定小概率事件的边界问题上不同,这将在后面的章节中介绍。三、假设测验的基本方法

①对所研究的总体首先提出一个无效假设

②规定测验的显著水平(一般=0.05有时=0.01)

③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计算假设正确的概率

④根据“小概率事件实际上不可能发生”的原理接受或否定无效假设如小麦品种旧品种:0=300kg/亩=75kg

新品种:1=330kg/亩y=330kg第一步:首先提出假设:H0:1=0=300kgHA:10第二步:平均数的抽样分布,计算概率:样本容量n=25四、假设测验的两类错误

概念①第一类错误(错误):如果假设是正确的,但通过试验结果的测定却否定了它就造成所谓的第一类错误,即错误。②第二类错误(错误):如果假设是错误的,而通过试验结果的测验后却接受了它,这就造成所谓的第二类错误,即错误。

大小犯第一类错误的大小恰好等于显著水平,而犯第二类错误的大小用表示。

降低在样本容量固定时,减小第一类错误的概率必然增大犯第二类错误的概率,反之亦然,但如果样本容量增加,则两类错误的概率都可减小。当固定时,单尾测验的小于双尾测验的。综合起来可以归纳如下:样本容量n固定的情况下,提高显著水平,如从5%提高到1%,则将增大第二类错误的概率值。在n和显著水平相同的情况下,真总体平均数和假设平均数0的相差越大,则犯第二类错误的概率值愈小。为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05,同时适当增加样本容量。改进试验技术,增加样本容量。第三节平均数的假设测验☺单个平均数的假设测验测验t测验☺两个平均数相比较的假设测验成组资料的假设测验成对资料的假设测验第五章一、单个平均数的假设测验(一)测验测验适用于以下两种情况(1)总体方差已知(2)总体方差虽未知,但样本方差已知,样本容量又很大(30),这时可以用样本方差代替总体方差(下面举例说明)。(二)t测验t测验适用于以下情况总体方差未知,而样本容量又很小,这时如果用样本方差估计总体方差,就会使其标准化离差的分布不呈正态,而是呈现t分布,具有自由度DF或v=n-1。例题某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数0=300kg,并从多年种植结果获得其标准差=75kg,而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即,那么新品种样本所尾总体与原当地品种这个总体是否有显著差异呢?在此例中,总体方差已知,故用测验查附表,当=2时,概率P介于0.04和0.05之间,即这一试验结果属于误差的概率介于0.04和0.05之间,根据小概率事件不可能发生的原理可以推断此差异是由于本质的原因引起的,即新品种比原品种能高产30kg/667m2。例题

用山楂加工果冻儿,传统工艺平均每100g山楂出果冻儿500g.现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻儿平均数为520g,标准差为S=12g,问新工艺与传统工艺之间有无显著差异?在此例中,总体方差未知,而样本容量又不大,所以应该用t测验。其测验步骤如下:.提出假设.H0:=0,即新工艺和传统工艺之间无显著差异;对HA:0,即新工艺和传统工艺之间存在显著差异..确定显著水平..检验计算.均数标准误统计量t值自由度df=n-1=16-1=15(t0.01(df=15)=2.947).统计推断.本例推断否定H0而接受HA.即新工艺和传统工艺之间存在极显著差异.二、两个样本平均数的假设测验

两个样本平均数的假设测验就是由两个样本平均数之差去推断两个样本所属总体平均数有无差异。根据试验设计不同而分为成组数据和成对数据。(一)、成组数据的平均数比较

两个处理为完全随机设计,供试单位彼此独立,不论其样本容量是否相同,所得数据皆称为成组数据。以组平均数作为比较的标准。

(1)如果两个样本所在总体为正态分布,且总体方差12和22已知时用测验。(2)如果两个样本所在总体为正态分布,虽总体方差未知,但两个样本容量都很大时用测验。(3)如果两个样本所属总体为正态分布,总体方差未知而且样本容量又不大时用t测验.

甲生产线(y1)747156547178625762697363617262707874776554586362596278536770乙生产线(y2)655354605669584951536662585866715356607065585669687052555557某食品厂在甲、乙两条生产线上各测了30个日产量,试检验两条生产线的平均日产量有无显著差异。.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著差异.对HA:1-20,即两条生产线上的平均日产量有显著差异..确定显著水平.=0.01..检验计算..统计推断.由于=3.28>0.01=2.58,故推断接受HA否定H0,即两条生产线日产量达极显著差异.

海关检查某罐头厂生产的出口红烧花蛤罐头时发现存在质量问题,故抽取了6个罐头并随机抽取6个正常罐头测定其SO2含量,结果如下,试检验两种罐头的SO2含量是否有显著差异.正常罐头100.094.298.599.296.4102.5异常罐头130.2131.3130.5135.2135.2133.5正常罐头与异常罐头SO2含量记录(二)、成对资料平均数的假设测验

若试验设计是将性质相同的两个供试单位配成一对,并设多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,所得的观察值为成对数据。

品种号12345678910电渗处理22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d)4.193.103.615.003.081.995.921.712.444.14电渗处理草莓果实钙离子含量

为研究电渗处理对草莓果实中钙离子含量的影响,选用10个草莓品种来进行电渗处理与对照的对比试验,结果如下,问电渗处理对草莓钙离子含量是否有影响?第四节参数的区间估计参数估计:就是用样本的统计数来估计总体的参数。试验中常常遇到点估计和区间估计。点估计:所谓点估计就是利用样本的一个统计数直接对总体的相应参数进行估计。区间估计:所谓区间估计就是在一定概率保证下,利用样本结果估算出一个区间,使该区间包含被估计的参数。这个区间称为置信区间,区间的上下限称为置信限。一般用L1和L2分别表示区间的上、下限。表示该区间能覆盖参数的概率用P=1-表示,称为置信系数或置信度。第五章一、总体平均数的区间估计

如果样本资料服从正态分布,总体方差已知的情况下用“测验”。如果样本资料服从正态分布,总体方差未知,但样本容量相当大时,用“测验”。这时其总体平均数的置信区间为:如果样本资料不服从正态分布,总体方差又未知,而样本容量又很小时,用“t测验”.这时总体平均数的置信区间为:

某罐头厂生产肉类罐头,其自动装罐机在正常工作状态时每罐净质量具正态分布N(500,64)(单位为克).某日随机抽查了10瓶罐头,得结果如下:505,512,497,493,508,515,502,495,490,510.问装罐机正常工作状态下所装罐头净质量在95%概率保证下的置信区间.其在95%概率保证下的置信区间为

用山楂加工果冻儿,传统工艺平均每100g山楂出果冻儿500g.现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻儿平均数为520g,标准差为S=12g,现在问采用新工艺后每100g山楂出果冻儿量的总体平均数的置信度为99%的置信区间.二、总体平均数差数的区间估计成组资料成对资料

在选择酱油蛋白质原料时,分别从花生饼和菜子饼中各随机抽取了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论