方差分析与回归分析1课件_第1页
方差分析与回归分析1课件_第2页
方差分析与回归分析1课件_第3页
方差分析与回归分析1课件_第4页
方差分析与回归分析1课件_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

勤学好问必有所获第八章方差分析与回归分析单因素方差分析回归分析的基本概念一元线性回归模型的建立与检验方差分析的概念与基本思想勤学好问必有所获第八章方差分析与回归分析单因素方差分析回消费者对四个行业的投诉次数观测值零售业旅游业航空公司家电制造业12345766494034683929455631492134404451657758

例8.1为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共16家企业投诉的次数如下表四个行业之间的服务质量是否有显著差异?一、方差分析的概念与基本思想

1.问题的提出消费者对四个行业的投诉次数观测值零售业旅游业航空公司家电制分析四个行业之间的服务质量是否有显著差异作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等?均值相等均值不全相等服务质量没有显著差异服务质量有显著差异分析四个行业之间的服务质量是否有显著差异作出这种判断最终被归例题8.2

在饲料养鸡增肥研究中,某饲料研究所提出三种配方:A1以鱼粉为添加料,A2以槐树粉为添加料,A3以苜蓿粉添加料。为比较三种饲料的效果,特选24只相似的雏鸡随机分为三组,每组用一种饲料喂养,60天后测其体重,获得数据如下表饲料A鸡重/gA110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048比较三种饲料的增重效果是否一致利用样本比较三个总体均值是否相等例题8.2在饲料养鸡增肥研究中,某饲料研究所提出三种配

直观上看该问题可以用两个总体均值差异显著性检验解决,但细想想还是存在一定问题,因为这样的比较能增大犯错误的概率。为解决这类问题,英国统计学家R.A.Fisher于1924年提出了解决此类问题的通用方法-方差分析法。2.方差分析的概念试验指标:试验结果。可控因素:在影响试验结果的众多因素中,可人为控制的因素。单因素试验:如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为单因素试验。直观上看该问题可以用两个总体均值差异显著性检验解决,水平——可控因素所处的各种各种不同的状态。每个水平又称为试验的一个处理。随机误差——因素的同一水平(总体)下,样本各观察值之间的差异这种差异可以看成是随机因素的影响,称为随机误差

系统误差——因素的不同水平(不同总体)下,各观察值之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差水平——可控因素所处的各种各种不同的状态。每个随机误差——因数据的误差用平方和(sumofsquares)表示,称为方差组内方差(withingroups)

因素的同一水平(同一个总体)下样本数据的方差比如,零售业被投诉次数的方差组间方差(betweengroups)因素的不同水平(不同总体)下各样本之间的方差比如,四个行业被投诉次数之间的方差数据的误差用平方和(sumofsquares)表示,称为若不同行业对投诉次数没有影响,则组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1若不同行业对投诉次数有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响判断行业对投诉次数是否有显著影响,实际上也就是检验被投诉次数的差异主要是由于什么原因所引起的。如果这种差异主要是系统误差,说明不同行业对投诉次数有显著影响3.方差分析的思路若不同行业对投诉次数没有影响,则组间误差中只包含随机误差,没4.方差分析的基本思想试验指标的变化可以用指标值的方差反映,导致指标值发生变化的原因有两方面:一是可控因素,二是不可控因素。方差分析就是将指标值的方差分解成组间方差与组内方差,然后依据概率比较组间方差与组内方差的大小关系,从而决定引起指标值的变化的主要原因。5.方差分析的基本假定不同因素对试验指标值的影响作用是加性效应,即试验指标值的变化是各种因素所起作用的累加;试验指标服从正态分布;试验数据是随机的,并且可控因素不同水平的试验数据具有方差齐性。4.方差分析的基本思想二:单因素方差分析的统计模型

1.单因素方差分析的数据结构因素-水平试验数据和平均二:单因素方差分析的统计模型1.单因素方差分析的数据结构因

2.单因素方差分析的统计模型

在方差分析统计模型下,方差分析要解决的问题转化为下列假设检验问题:2.单因素方差分析的统计模型在方差分析统计模型下

三、单因素方差分析的原理

1.试验数据离差平方和分解离差平方和分解式三、单因素方差分析的原理1.试验数据离差平方和分解离差第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件2.方差分析原理2.方差分析原理记号及其含义记号及其含义在实际应用中,方差分析结果以方差分析表形式给出。单因素方差分析表方差来源平方和自由度均方F临界值或Sig组间SSAa-1SSA/(a-1)MSA/MSe组内SSea(r-1)SSe/a(r-1)总和SSTar-1在实际应用中,方差分析结果以方差分析表形式给出。单因素方差分例题8.2

在饲料养鸡增肥研究中,某饲料研究所提出三种配方:A1以鱼粉为添加料,A2以槐树粉为添加料,A3以苜蓿粉添加料。为比较三种饲料的效果,特选24只相似的雏鸡随机分为三组,每组用一种饲料喂养,60天后测其体重,获数据如下表,试以此数据判定不同饲料是否有差异?饲料A鸡重/g-1000A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363例题8.2在饲料养鸡增肥研究中,某饲料研究所提出三种配饲方差分析表方差来源平方和自由度均方F临界值组间9660.0822830.043.59*3.47组内28215.96211343.62总和37876.0423方差分析表方差来源平方和自由度均方F临界值组间9660.08

四、单因素方差分析模型参数的估计

当方差分析结果为否定原假设时,就需要估计模型的有关参数,下面就讨论方差分析模型参数的估计。四、单因素方差分析模型参数的估计当方差分析结果为五、多重比较法拒绝H0,接受H1,表示总体均数不全相等哪两个平均数之间相等?哪两个平均数之间不等?

————>需要进一步作多重比较。方差分析结果不拒绝H0,表示拒绝总体均数相等的证据不足,

————>分析终止。

常用多重比较法最小显著差数法(Leastsignificantdifference,简称LSD法)

五、多重比较法拒绝H0,接受H1,表示总体均数不全相等方差q法(又称SNK(student-Newman-Keuls)检验法)

q测验方法是将r个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的。q法(又称SNK(student-Newman-KeulTukey法(又称honestlysignificantdifference,简称HSD)Tukey法(又称honestlysignificantBonferroni法Bonferroni法是根据所比较的两个处理平均数的个数k,将检验水平缩小k倍做为真实比较水平,确定是几个平均数间的极差分别确定最小显著差数LSDα值的。Bonferroni法Bonferroni法是根据所比较的多重比较法选择1.试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法LSDa法;2.根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。参考以下观点:根据试验的侧重点选择。三种方法的显著尺度不相同,LSD法最低,HSD法次之,SNK法最高。故对于试验结论事关重大或有严格要求时,用SNK法,一般试验可采用HSD法。当比较次数不多时,Bonferroni法的效果较好;但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。多重比较法选择1.试验事先确定比较的标准,凡是与对照相比较例题8.3试以LSD法测验各种药剂处理的苗高平均数之间的差异显著性。r(m-1)=12时,t0.05(12)=2.179,t0.01(12)=3.055故LSD0.05=2.179×2.02=4.40

LSD0.01=3.055×2.02=6.17处理苗高平均数差异显著性0.050.01D29aaB23babA18cbcC14cc例题8.3试以LSD法测验各种药剂处理的苗高平均数之间的差异双因素方差分析背景双因素方差分析的类型若把品种看成影响产量的因素A,肥料则是影响产量的因素B。对因素A、因素B和二者互作同时进行分析,就属于双因素方差分析。在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。如研究小麦产量问题,除了关心品种对产量的作用之外,我们还想了解化肥的使用对产量的作用,有时甚至要考虑品种与肥料的相互促进作用。如果不同品种、不同施肥量对产量作用存在显著的差异,就需要分析原因。选择合适的品种,决定恰当的施肥量,以达到增产的目的。双因素方差分析双因素方差分析背景双因素方差分析的类型若把品种看成影响产双因素方差分析的类型无交互作用的双因素方差分析

有交互作用的双因素方差分析

假定因素A和因素B的效应之间是相互独立的,不存在相互关系

假定因素A和因素B的结合会产生出一种新的效应(交互效应)

交互作用的概念有人在研究油菜产量受氮肥与磷肥影响问题时,获得如下试验数据。显然512-470-2-10=30既不是单纯氮肥引起的产量变化,也不是单纯磷肥引起的产量变化,这就是交互作用。氮肥磷肥06047047215480512双因素方差分析的类型无交互作用的双有交互作用的双假定因素A不考虑交互作用的双因素方差分析

因素B

数据因素A

双因素不考虑交互作用方差分析的数据结构双因素不考虑互作方差分析试验数据具有下列结构模式。不考虑交互作用的双因素方差分析因素B双因素双因素不考虑交互作用方差分析的统计模型双因素不考虑交互作用方差分析的统计模型该形式称为双因素不考虑交互作用方差分析的统计模型。

在方差分析统计模型下,方差分析要解决的问题转化为下列假设检验问题:双因素不考虑交互作用方差分析原理试验数据离差平方和分解该形式称为双因素不考虑交互作用方差分析的统计模型。双因素不第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件双因素不考虑交互作用方差分析表方差来源平方和自由度均方F临界值或Sig因素ASSAa-1SSA/(r-1)MSA/MSeMSB/MSe因素BSSBb-1SSB/(b-1)误差SSe(a-1)(b-1)SSe/(a-1)(m-1)总和SSTab-1双因素不考虑交互作用方差分析表临界值因素ASSAa-1SSA例8.4

对于四种不同种源的油松种子,在三种不同土质的土壤上进行育苗试验,两年后测定苗木高度,所得试验数据如表所示。假定试验数据满足正态、等方差条件试在检验水平0.05下,分析种源、土质对油松苗木高度的影响?

因素B

数据因素A因素BB1B2B3因素AA144534714448.0A237443511638.7A336473311638.7A445483112441.316219214650040.548.036.541.7例8.4对于四种不同种源的油松种子,在三种不同土质的土壤第八章方差分析与回归分析1课件双因素方差分析的模型双因素方差分析的模型数据结构A因素B因素总和Ti..平均B1B2…BbA1x111x121…x1b1T1..x112x122…x1b2︰︰︰︰x11rx12rx1brTij.T11.T12.T1b.︰︰︰︰︰︰︰Aaya11xa21…xab1Ta.xa12xa22…xab2︰︰︰︰xa1rxa2r…xabrTij.Ta1.Ta2.Tab.T.j.T.1.T.2.…T.b.T...平均…数据结构B因素总和平均B1B2…Bbx111x121…x1

离差平方和的分解 离差平方和的分解第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件例8.5

用3种深翻,4种施肥方案组成12种育苗作业方式试验,所得试验数据如表所示。假定试验数据满足正态、等方差条件试在检验水平0.05下,分析深翻、施肥及其它们之间的交互作用对苗木高度的影响?

施肥A深翻BA1A2A3A3B1524339483729344236455842B2414753504130363944444660B3393842364847374032435641例8.5用3种深翻,4种施肥方案组成12种育苗作业方式试验第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件

在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:

相关关系表现为这些变量之间有一定的依赖关,但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。他们之间相互依赖但又不能有一个确定另一个。因此,相关关系的分析根据研究的目的不同分为相关分析(平行分析)和回归分析(因果分析)。相关关系与回归关系(1)确定性关系——函数关系;(2)非确定性关系——相关关系。在现实问题中,处于同一个过程中的一些变量,往往是相互依相关关系举例

例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量Y与施肥量X之间有一定的关系,但施肥量相同,亩产量却不一定相同。亩产量是一个随机变量。

又如:人的身高Y与人的腿长X之间具有一定的依赖关系,一般来说,身高越高,其腿越长,但身高相同的两个人的腿长不一定相等;同样腿长一样的两个人的身高也未必一样,X与Y是一个随机变量。

农作物的亩产量与施肥量、身高与腿长之间的这种关系称为相关关系。在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,可控变量称为自变量,不可控变量称为因变量。相关关系举例例如:在气候、土壤、水利、种子和耕作技相关关系的检验在概率论中,我们已经学过两个随机变量线性相关性强弱可利用相关系数来衡量。在已知随机变量二阶矩的情况下,两个随机变量间的相关系数为样本相关系数相关关系的检验在概率论中,我们已经学过两个随机变量线性相关第八章方差分析与回归分析1课件利用样本相关系数检验线性相关性利用样本相关系数检验线性相关性例8.5

某项研究需了解水稻品种播种至齐穗的天数x与播种至齐穗的总积温y之间是否有关系,实测如下数据,试以此数据检验x与y的线性相关性强弱。xi70.067.055.052.051.052.051.060.064.0yi1616.31610.91440.01440.71423.31471.31421.81547.11533.0例8.5某项研究需了解水稻品种播种至齐穗的天数x与播种xi每月家庭可支配收入X800110014001700200023002600290032003500每月消费支出Y561638869102312541408165019692090229959474891311001309145217381991213423216278149241144136415511749204621782530638847979115513971595180420682266262993510121210140816501848210123452860某社区家庭每月可支配收入和消费统计表引例8.6回归分析每月家庭可支配收入X8001100140017002回归关系与回归分析回归关系在相关关系中,如果关心的是容易测定或控制变量X对变量Y的决定作用大小,将X看成一个普通变量,这时变量X与Y之间就成为回归关系。回归模型如果普通变量x与随机变量Y具有回归关系,则Y除过受变量x的作用以外,还受到控制不严格和未知因素的作用。所以,x与Y应满足关系式回归关系与回归分析回归模型对于回归模型,显然有回归方程反映了因变量随自变量的变化而变化的平均变化情况。对于回归模型,显然有回归方程反映了因变量随自变量的变回归模型分类回归分析研究一个随机变量与一个或几个可控变量之间回归关系,从而找出回归关系的模型,用于预测、优化和控制,这种统计方法称为回归分析。回归分析主要解决三个问题:提供建立具有回归关系的变量之间的数学关系式(称为经验公式)的一般方法;判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著;利用所得到的经验公式进行预测和控制。回归模型分类回归分析研究一个随机变量与一个或几个可控变量一元线性回归一元线性回归模型一元线性回归一元线性回归模型一元线性经验回归方程及其建立最小二乘法(Theleastsquaremethod)一元线性经验回归方程及其建立最小二乘法(Theleasyxo············yxo············yxo············yxo············第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件某企业对车间9名学徒工进行调查,得到学徒工与每天产量情况如下表,要求建立以日产量为因变量的回归方程。引例8.7回归分析编号123456789学徒期(年)0.5111.52222.52.5日产量(件)5080100130150170180220240某企业对车间9名学徒工进行调查,得到学徒工与每天产量引建立经验回归方程

确定回归系数和

编号123456789x0.5111.52222.52.515y50801001301501701802202401320x20.25112.254446.256.2529xy25801001953003403605506002550建立经验回归方程确定回归系数和:编号1234所以,所求的经验回归方程为

所以,所求的经验回归方程为一元线性回归有关检验离差平和分解一元线性回归有关检验离差平和分解离差平方和的分解离差平方和的分解第八章方差分析与回归分析1课件第八章方差分析与回归分析1课件回归显著性检验F检验T检验回归显著性检验F检验T检验相关系数检验相关系数检验编号123456789脂肪含量%15.417.518.920.021.022.815.817.819.1蛋白质含量%44.039.241.838.937.438.144.640.739.8试求出与的关系,并判断是否有统计学意义。

例题8.7

为了研究大豆脂肪含量和蛋白质含量的关系,测定了九种大豆品种籽粒内的脂肪含量和蛋白质含量,得到如下数据编号123456789脂肪15.417.518.920.02解(1)作散点图,确定回归模型解(1)作散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论