




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验设计数据的方差分析第1页,共35页,2023年,2月20日,星期六试验设计在几乎所有领域都有各种试验。比如如何对不同的土壤、气候等各种条件找出最合适的作物,使得收益最大如何使得工业产品优质、价廉什么环境下,儿童才能在心理上健康成长企业采取的什么主动措施能够增加收益第2页,共35页,2023年,2月20日,星期六一个例子一个养蟹户要遇到许多影响生产的因素或因子(factor),比如水温,饲料,水质,疾病等各种问题。要想稳定高产,就要进行各种因素的不同水平(level)的搭配(组合)试验。这里的“水平”就是一个因素可能取的值。比如对于饲料这个因素,每个水平就是一种饲料;如果有三种可供选择的饲料,该因素就有三个水平。而如果水温有四种水平,则水温和饲料就有12种可能的搭配(组合)这里,因素就是变量,水平就是该变量的取值;这些名词是属性变量所特有的。第3页,共35页,2023年,2月20日,星期六试验设计模型就是回归模型在上面例子中,因变量是产量,自变量是水温,饲料等。描述试验设计的模型就是回归模型的一种但试验设计问题本身有很大一部分是如何设计试验,使得人们有可能用最少的资源得到最好的结果。当然,我们不打算详细讨论如何设计试验,而把主要精力放在试验设计数据的方差分析上。
第4页,共35页,2023年,2月20日,星期六方差分析方差分析(analysisofvariance,ANOVA)是分析各个自变量对因变量影响的一种方法。这里的自变量就是定性变量的因子及可能出现的称为协变量(covariate)的定量变量。分析结果是由一个方差分析表给出的。第5页,共35页,2023年,2月20日,星期六方差分析分解因素贡献的机理原理为:因变量的值随着自变量的不同取值而变化。我们把总变化(差的平方和)按照自变量(因素)进行分解,显示每一个自变量的贡献;最后剩下无法用已知的因素解释的则看成随机误差的贡献。然后用各自变量的贡献和随机误差的贡献进行比较(F检验),以判断该自变量的不同水平是否对因变量的变化有显著贡献。输出就是F-值和检验的一些p-值。下面看一个例子。第6页,共35页,2023年,2月20日,星期六单因素方差分析回顾
饲料比较数据,n=19头猪,用p=4种饲料喂养一段时间后的重量增加(data12.01)问题:四种饲料是否不同?
饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6
第7页,共35页,2023年,2月20日,星期六饲料例子(继续):
饲料(fodder)为自变量(单因子),重量增加(weight)为因变量(一个数量变量)(SPSS计算机数据形式有所不同)饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6
均值A=133.36均值B=152.04均值C=189.72均值D=220.78第8页,共35页,2023年,2月20日,星期六各种SPSS输出:
(ANOVA-CONTRASTS/POSTHOC-LSD,T2/OPTION-DES.,HOMO./MEANPLOT)
DescriptivesWEIGHT
NMeanStd.DeviationStd.Error95%ConfidenceIntervalforMean
MinimumMaximum
LowerBoundUpperBound
A5133.366.807943.04460124.9068141.8132125.3143.1B5152.046.957233.11137143.4015160.6785143.8162.7C5189.726.350352.83996181.8350197.6050182.8198.6D4220.786.105943.05297211.0591230.4909212.3225.8Total19171.5234.311377.87157154.9730188.0481125.3225.8第9页,共35页,2023年,2月20日,星期六四种饲料的箱图四种饲料的均值图第10页,共35页,2023年,2月20日,星期六假设:检验:H0:m1=…=mp线性模型:第11页,共35页,2023年,2月20日,星期六公式:总平方和=组间平方和+组内平方和其中,SST有自由度n-1,SSB有自由度p-1,SSE有自由度n-p,在正态分布的假设下,如果各组增重均值相等(零假设),则
有自由度为p-1和n-p的F分布.第12页,共35页,2023年,2月20日,星期六(比较一元总体的)ANOVAWEIGHT(重量)
由SPSS可以得到方差分析表:
SumofSquares(平方和)Df自由度MeanSquare(均方)FSig.BetweenGroups(处理)SSBP-1MSB=SSB/(p-1)F=MSB/MSEP(F>Fa)WithinGroups(误差)SSEn-pMSE=SSE/(n-p)
Total(总和)SSTn-1
这里n为观测值数目p为水平数,Fa满足P(F>Fa)=a.这是自由度为p-1和n-p的F-分布的概率第13页,共35页,2023年,2月20日,星期六F0.05(3,15)面积=0.05F
(3,15)分布密度图第14页,共35页,2023年,2月20日,星期六ANOVAWEIGHT
由SPSS可以得到方差分析表:
SumofSquaresDfMeanSquareFSig.BetweenGroups20538.69836846.233157.467.000WithinGroups652.1591543.477
Total21190.85818
该表说明各饲料之间有显著不同.第15页,共35页,2023年,2月20日,星期六TestofHomogeneityofVariances(Arobusttest)这是SPSS输出之一,明白即可,不用记住LeveneStatisticdf1df2Sig..024315.995第16页,共35页,2023年,2月20日,星期六SPSS操作
CompareMeans→OneWayANOVA:
fodder(饲料)→Factor
Weight(重量)→DependentList
Options:
Descriptive
HomogeneityofVariance
MeanPlot第17页,共35页,2023年,2月20日,星期六销售数据(sales.sav)
研究这个数目的主要目的是看销售额(因变量)是否受到促销方式、售后服务和奖金这三个自变量的影响(头两个是定性变量,亦称为因子,分别有3个和2个水平;而定量变量奖金是协变量)以及怎样的影响。第18页,共35页,2023年,2月20日,星期六Excel数据第19页,共35页,2023年,2月20日,星期六第20页,共35页,2023年,2月20日,星期六多因素方差分析
(只考虑主效应,不考虑交互效应及协变量)首先假定自变量受到的仅仅有不同因素的主效应(maineffect)而没有交互效应(interaction)和协变量(covariate)的影响。主效应就是每个自变量对因变量的单独影响,而交互效应是当两个或更多的自变量的某些水平同时出现时除了主效应之外的附加影响(“正面”或者“负面”的影响)。第21页,共35页,2023年,2月20日,星期六多因素方差分析
(只考虑主效应,不考虑交互效应及协变量)拿我们例子来说,当单独考虑时,假定主动促销比被动促销可以多产生8万元效益,而有售后服务比没有售后服务多产生9万元效益。那么在没有交互作用时,同时采取主动促销和售后服务会产生8+9=17万元的效益(称为可加的)。如存在交互效应,那么同时采取主动促销和售后服务会产生一个附加的效应即交互效应(可正可负),这时的总效应就不是17万元了。
第22页,共35页,2023年,2月20日,星期六方差分析(只考虑主效应,不考虑交互效应及协变量)如要分析的只是因变量销售额和自变量促销和售后服务的主效应。用y表示销售额,ai表示促销(下标表示不同水平),bj表示售后服务;则相应的只有主效应的线性模型为:
这里的下标i代表促销的水平,下标j代表是否有售后服务,下标k代表每种ij组合中的第几个观测值。这里的最后一项eijk为随机误差项。第23页,共35页,2023年,2月20日,星期六公式:总平方和=组间平方和+组内平方和其中,SSA有自由度p-1,SSB有自由度q-1,SSE有自由度(p-1)(q-1),在正态分布的假设下,如果各组增重均值相等(零假设),则
分别有自由度为p-1
和(p-1)(q-1)
及自由度为q-1
和(p-1)(q-1)的F分布.第24页,共35页,2023年,2月20日,星期六TestsofBetween-SubjectsEffectsDependentVariable:XXX
SPSS:
GLM-GeneralFactorial-Model,custom(maineffect)
Note:SS.c=SSA+SSB
SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModelSS.cP+q-2MSS.cMSS.c/MSEIntercept…1……EffectASSAp-1MSAMSA/MSEEffectBSSBq-1MSBMSB/MSEErrorSSE(p-1)(q-1)MSE
Total…pq
CorrectedTotalSST=SSA+SSB+SSEPq-1
第25页,共35页,2023年,2月20日,星期六对于这个模型,SPSS输出为促销(promot)的F检验统计量(其自由度来自promot和error的自由度:2,20)取值为13.880,p-值为0.000(更精确些是0.0001658).而售后服务的F检验统计量为25.497,p-值为0.000(更精确些是0.00006135).
R2为0.981.第26页,共35页,2023年,2月20日,星期六这里的估计只有相对意义。一定要放在模型中,或者考虑同一因子水平之间的差,比如a1-a3、a2-a3、b1-b2等等。上面的模型还可以有截距有截距时的SPSS默认约束是固定a3=b2=0;而目前的没有截距的a1,a2,a3的估计实际上等于截距的估计加上有截距时的a1,a2,a3的估计。由于约束条件不一样,所以各种软件的各种选项的估计不尽相同,但相对大小是不会变的。对于这个模型,参数估计为第27页,共35页,2023年,2月20日,星期六根据上面估计,我们的模型为(各个参数仅有相对意义,常数项混合在其中)第28页,共35页,2023年,2月20日,星期六没有交互作用的模型可以从下面点图中直观看出。图10.1中下面一条折线连接了没有售后服务时三种促销状况的销售均值,而上面一条连接了有售后服务时三种促销状况的销售均值。由于模型选择为无交互作用,所以这两条线是平行的。从该图可以看出,两个因子效应综合效应是简单的加法。第29页,共35页,2023年,2月20日,星期六SPSS实现(只有因子主效应的方差分析)拿sales.sav为例,在SPSS中选Analyze-GeneralLinearModel-Univariate进入主对话框;然后把sales选入DependentVariable,把promot和service选入FixedFactors;然后点击Model,选择Custom,在BuildTerms中选择Maineffects,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年补偿贸易借款合同协议书样本
- 语出建筑(山东联盟)知到课后答案智慧树章节测试答案2025年春潍坊科技学院
- 毕业答辩开题报告-1
- 2024年浙大宁波理工学院招聘事业编制工作人员真题
- 第六单元 美丽的校园-认识方向(教案)-二年级上册数学青岛版
- 2024年山东省精神卫生中心招聘真题
- 2024年宁德市闽东医院聘用烧伤科副主任医师招聘笔试真题
- 水表出售合同范本
- 2024年临沧市市属事业单位考试真题
- 2024年拉萨市市属事业单位考试真题
- 工程经济学(第6版)全套教学课件
- 2024年腐植酸尿素行业分析报告及未来发展趋势
- 高中单词速记3500表打印
- 反派研究报告by纸上谱
- 五年级下册数学北师大版教材习题参考答案
- 五年级下册科学全册知识点总结与梳理(新改版苏教版)
- 能源管理体系培训课件(2023年EnMS)
- 【获奖】英语跨学科项目式作业设计
- 2022年江苏省南京市中考语文真题(解析版)
- 山西省繁峙县鑫秀矿山有限责任公司香台-康家沟铁矿矿产资源开发利用和矿山环境保护与土地复垦方案
- 国家开放大学《成本管理》形考任务(1-4)试题答案解析
评论
0/150
提交评论