版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
农机试验学宁夏大学机械工程学院张佃平E-mail:zhangdp82@163.comTelunday,February5,2023农机实验
?《现代汉语词典》的释义:【实验】为了检验某种科学理论或假设而进行某种操作或从事某种活动。【试验】为了察看某事的结果或某物的性能而从事某种活动。参考书目1.
何月娥,杨文孝等.农机试验设计.北京:机械工业出版社,1986.
2.李云雁,胡传荣.试验设计与数据处理(第2版).北京:化学工业出版社,2008.3.王松桂,陈敏等.线性统计模型:线性回归与方差分析.高等教育出版社,1999.农机试验设计的任务1.介绍如何科学地、合理地编制农机试验计划2.如何用统计分析方法分析试验结果主要内容1.三种设计方法:正交设计法、区组设计法、回归正交设计法2.三种分析方法:极差分析法、方差分析法、回归分析法目录0绪言第一章农机试验的正交试验设计法第二章试验数据的结构第三章农机试验的区组设计第四章方差分析第五章一元回归分析第六章多元线性回归分析及计算程序第七章回归的正交设计第八章正交多项式回归设计一、农机试验的目的探索未知寻求规律作出评价0绪论二、农机试验的种类1.根据试验目的分为:科研性试验(探索性试验)鉴定性试验(验证性试验)2.根据试验环境分为:室内试验田间试验0绪论二、农机试验的种类1.科研性试验是为了探索农业机械的结构原理,运动规律,以及其性能指标与外界因素的相互关系影响程度,寻求最佳结构,最佳工艺方案,最佳配方的试验。2.验证性试验是通过试验验证基础理论,理论分析和理论公式。在农机试验中,主要是评价判定农机具是否适应当地农艺要求,设计图纸和技术文件是否符合国家相关标准,是否具有经济效益。0绪论三、试验的一般程序1、编写试验大纲,试验大纲是试验的指导性文件和依据。内容:包括试验目的,试验项目,试验条件,试验方法,以及数据处理的方法等,要求:必须科学,明了,可行。有国家标准的则在国家标准的基础上制定,或直接采用国家标准,没有标准的应根据试验目的和要求进行试验设计,编制试验大纲。0绪论2、试验条件的准备,试验条件要符合试验大纲规定的要求,要具有代表性。田间试验,要选好试验地,做好试验地的区划,所选试验地应具有代表性。土壤质地,地块大小,地表起伏,植被情况都能代表该地区的基本特征,并能满足试验的要求。试验对象和机组的准备,制定抽样方案,按标准和大纲的要求按规定对机组进行认真调整,并达到试验要求。人员准备,试验人员要熟悉试验内容和试验方法,技术熟练,经验丰富,要有处理突发事件的能力,试验要有安全防护措施的准备。对环境等相关因素进行测定和记录。三、试验的一般程序3、按试验大纲的规定和要求进行正式试验。试验中必须认真观测和记录试验大纲规定的试验项目的各项数据和指标。一般试验内容包括技术测定,性能试验和生产试验。技术测定:一般指对样机零件尺寸、安装尺寸以及整体参数的测定。性能试验:一般指对样机动态情况下的试验测定,不同的机械有不同的试验项目。生产试验又分生产考核和生产查定。生产考核一般指样机在实际生产情况下在规定作业量和规定作业时间内,测定机组的班次作业量、作业时间、能源消耗、使用可靠性、调整方便性、时间利用率、作业效率、故障率等技术经济指标,测定样机主要零件的磨损,变形和损坏情况。生产查定的时间一般不应小于3个班次,每个班次不小于6小时的作业时间,主要记录每个班次内各类时间的消耗,作业量以及能源消耗。三、试验的一般程序
4、按试验大纲和标准的规定和要求,汇总整理数据,并进行数据处理和分析,在此基础上写出试验报告。试验报告的内容包括:前言:写明试验目的要求,样机名称,台数,研究单位和样机提供单位,试验依据,时间、地点、工作量的完成情况等。样机简介:介绍样机的结构,主要特点参数以及工作原理。试验条件和试验情况:简述试验条件,分析其是否具有代表性,以及对试验的影响。写明试验所用仪器设备是否结果标定和检定。试验进行情况。试验结果和分析:根据试验测得的数据和观察到的现象,进行系统地数据处理和综合分析,对试验进行评价。结论:根据试验目的和对试验结果的分析,对试验作出明确结论。附件:包括试验数据、图表、参考文献、照片等。三、试验的一般程序0绪论《农机试验设计》的主要任务:在农机试验时,如何科学地、合理地编制方案,如何对其试验结果进行统计分析,从而使试验工作达到又省又好的一门学问。换句话说:1.合理的安排最少的试验——试验设计2.科学、准确的分析试验结果,得到有效和满意的结果——试验结果分析《农机试验设计》要解决的问题举例PⅠ~Ⅱ:研究收割机切割器的性能:试验条件众多,逐一试验不现实;犁头性能对比试验:试验结果用简单方法不能得出对比结果。《农机试验设计》要解决的问题:1.以最少的试验次数来获得足够的有效数据,并对其进行科学的统计分析,从而得出比较可靠地结论;2.对在不均一的试验条件下获得试验结果可以做出正确的判断。为什么学习农机试验设计?对农机试验进行设计是由农机和其使用的环境所决定的。1.影响农机试验结果的不可控因素多而复杂,且变动大;2.农机试验受季节制约。Ⅱ常用术语的介绍试验指标--在一项试验中,根据试验目的,所考察的试验结果的特征量或者现象。定量指标:可以用数量表示的试验指标1.试验指标
定性指标:不能用数量表示的试验指标2.因素:在试验中需要考察的、对试验指标可能有影响的原因。因素常用大写英文字母A、B、C……表示。Ⅱ常用术语的介绍3.水平:因素在试验中所选取的状态或条件。水平常用该因素字母加上下角标来表示,如A1表示A因素的一水平,B3表示B因素的三水平。在试验中需要考察某因素的几种状态时,则称该因素为几水平的因素。如某一发动机的转速取50rpm,700rpm,1000rpm三种状态进行试验即转速为三水平Ⅱ常用术语的介绍4.多因素试验:在一项试验中需要考察多个因素,且每个因素又有多个水平的试验。5.交互作用:一般在一项试验中,不仅各个因素单独起作用且因素间有时联合起来影响某一试验指标,这种联合作用叫交互作用。第一章农机试验的正交试验设计法第一节农机正交试验设计的基本方法和极差分析第二节有交互作用的正交试验设计第三节因素水平数不等的正交设计第四节多指标试验的分析第一节
农机正交试验设计的基本方法和极差分析(1)正交试验设计:应用数学工作者编制的正交表来安排多因素试验,并用数理统计方法来分析试验数据,从而以较少的试验次数获得全面信息的方法。
正交试验设计的主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。(2)正交试验设计法的用途正交试验设计主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。(3)正交表的由来正交表的来源正交拉丁方,而拉丁方名称的由来:古希腊是一个多民族的国家,国王在检阅臣民时要求每个方队中每行有一个民族代表,每列也要有一个民族的代表。数学家在设计方阵时,以每一个拉丁字母表示一个民族,所以设计的方阵称为拉丁方。
什么是n阶拉丁方?用n个不同的拉丁字母排成一个n阶方阵(n<26),如果每行的n个字母均不相同,每列的n个字母均不相同,则称这种方阵为n×n拉丁方或n阶拉丁方。每个字母在任一行、任一列中只出现一次。
什么是正交拉丁方?设有两个n阶的拉丁方,如果将它们叠合在一起,恰好出现n2个不同的有序数对,则称为这两个拉丁方为互相正交的拉丁方,简称正交拉丁方。
例如:3阶拉丁方
ABC
ABC
BCA
和
CAB
CAB
BCA
用数字替代拉丁字母:
1
2
3
1
2
3
(1,1)
(2,2)
(3,3)
2
3
1
和
3
1
2
---->
(2,3)
(3,1)
(1,2)
3
1
2
2
3
1
(3,2)
(1,3)
(2,1)
日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的试验,按全面试验要求,须进行33=27种组合的试验,且尚未考虑每一组合的重复数。若按L9(34)正交表安排试验,只需作9次,按L18(37)正交表进行18次试验,显然大大减少了工作量。因而正交试验设计在很多领域的研究中已经得到广泛应用。
一、正交表(附表P253)
——正交试验法的基本工具第一种:各列水平数均相同的正交表
Ln(qp)正交表的列数每一列的水平数试验的次数正交表的代号第二种:混合水平正交表
各列水平数不相同的正交表,叫混合水平正交表。下面就是一个混合水平正交表名称的写法:
L8(41×24)2水平列的列数为44水平列的列数为1试验的次数正交表的代号一、正交表(附表P253)
——正交试验法的基本工具正交表举例如L4(23)n=4,q=3,t=2正交表的两个特点1.每一列中,不同的字码出现的次数相等——同一因素的水平考察次数相等2.任两列同一横行两数码所组成的有序数对必然是完全有序数对,且各种有序数对出现次数相同正交表是一种特别的表格,是正交设计的基本工具。它是规格化的一种表,不能自己设计,只能选用。
正交表的代号n为正交表的行数代表试验次数p为正交表的列数(最多能安排的因素个数,包括交互作用、误差等)q为各因素的水平数(各因素的水平数相等)对正交表的说明:正交表选择的一般要求要求:因素数≤正交表列数因素水平数与正交表对应的水平数一致选较小的表二、正交试验设计的基本方法1.正交试验方案的设计2.试验结果的极差分析1.正交试验方案的设计正交试验方案的设计步骤如下:(1)明确试验目的,确定试验指标(2)选因素、定水平(3)选择合适的正交表(4)确定试验方案表(5)对试验结果进行统计分析(6)进行验证试验,作进一步分析举例说明正交试验方案的设计例1-1在5HN-1.5暖风粮食烘干机的研究中,为了提高单位时间的粮食脱水率,降低烘干耗电量,对烘干机的导向管的结构参数进行试验研究。这里先假设因素间没有交互作用。(1)明确试验目的,确定试验指标本例试验目的:提高单位时间粮食脱水率。降低烘干耗电量。确定试验指标:
一般耗电量增加,单位时间内的脱水率也增加。所以只能确定某一单位时间内的脱水率后,研究如何降低耗电量。因此指标选耗电量。(2)选因素、定水平当指标确定后,就要确定影响试验指标的因素,然后选水平。本例对耗电量有影响的导向管结构参数:导向管直径mm导向管长度mm导向管开孔率%因此,可以确定三个因素:A-导向管直径B-导向管长度C-导向管开孔率(2)选因素、定水平依据掌握的资料和经验,确定三个因素分别为二水平,即,A1:190mmA2:210mmB1:3020mmB2:3500mmC1:0.6%C2:0.9%(2)选因素、定水平列出因素水平表(3)选择合适的正交表选表原则:选适用的最小号正交表。该例是选定三个2水平因素,又不考虑交互作用,因此可以选用最简单的L4(23)表。(4)确定试验方案表表头设计
就是将试验因素分别安排到所选正交表的各列中去的过程。说明:当不考虑交互作用时,原则上各因素可以任意填排到各列。(4)确定试验方案表对试验方案表的说明试验方案确定后须严格按照每个试验号规定的试验条件进行试验;试验号是试验条件的代号,不是试验顺序;试验号数与试验次数是两个不同的概念,无重复试验时,试验号数与试验次数相等。试验方案表的特点在每一列中每个因素的各个水平,在试验中出现的次数是相同的;在任意两列间,同一横行的任意两因素的不同水平所有可能搭配组合都出现了,且出现的次数相等;当某一因素的一个水平出现时,其他因素的所有水平都出现,且各出现一次。对于L4(23)型正交表,可以用一个立方体来表示,平面表示各个因素的水平,顶点表示试验条件,独立占有两个边的顶点作为编排试验的试验条件。2.试验结果的极差分析极差分析的目的:1.确定因素的主次。2.分清水平的优劣。3.初选较优生产条件(或设计方案)。4.展望进一步试验方向并确定最优生产条件。试验结果
由表可以看出,单独的由某一个因素的两个水平来比较试验结果没法比较2.试验结果的极差分析(1)符号说明Kji:表示第j列中i水平的试验结果之和。kji:kji=Kji/s,其中s为任一列上各水平出现的次数R(极差):在任一列上
R=max{K1,K2,K3}-min{K1,K2,K3},或R=max{k1,k2,k3}-min{k1,k2,k3}
(2)结果计算及主次因素确定(2)结果计算及主次因素确定由极差确定因素的主次:
主次
ACB
由指标值之和或其平均值对主要因素选取最优水平,次要因素选取好水平,或有利于节约成本或便于操作等方面的水平。A2C2B2
A2C2B1
(3)进行验证试验,作进一步的分析优方案往往不包含在正交试验方案中,应验证优方案是在给定的因素和水平的条件下得到的,若不限定给定的水平,有可能得到更好的试验方案对所选的因素和水平进行适当的调整,以找到新的更优方案例1-2某农药厂为提高一种农药收率而进行试验1.明确试验目的,确定试验指标目的:提高农药的收率。指标:收率(%)。2.选因素,定水平根据实际经验选因素水平如下3.选择合适正交表本例选L8(27)4.确定试验方案表5.进行试验,测定结果6.分析试验数据,选较优生产条件7.关于空列的讨论本例中3、5、6没有排因素,为空列。由于空列不涉及因素的水平改变,R应为零,但从本例中看出空列R不为零。R3=5还很大,如何解析?一般认为:(1)R空值较小时,如本例R6=1.5,可以认为R空不为零是由于试验误差引起的,这时可以把R空作为试验误差界限,用它来判断各试验因素是否对指标有影响,当R空(小)≥R因时,认为没有影响,如RD=1.5=R空(小),即可认为D因素对指标没什么影响,RD存在也是误差引起的。(2)当R空值较大时,表示有不可忽略的原因对试验指标有较大影响,必须重新分析,确定较优生产条件。如本例的R3比RA,RB,RD都大,应进一步进行分析。(如何进行分析,下节讲)7.关于空列的讨论
第二节有交互作用的正交试验设计一、交互作用的概念交互作用----因素之间互相促进或互相制约来影响某一指标的作用。例:在土地情况大致相同的田块里进行大豆种植试验,用不同方法施氮肥(N)和磷肥(P)。(1)P=0,N=0y=200kg/亩(2)P=0,N=3kgy=215kg/亩P=2kg,N=0y=225kg/亩(3)(4)P=3kg,N=2kgy=280kg/亩可知:只加3kg(N),增产:215-200=15kg/亩只加2kg(P),增产:225-200=25kg/亩单独分别加3kg(N),2kg(P)共增产15+25=40kg/亩而同时加3kg(N),2kg(P)增产280-200=80kg/亩联合作用效果:80-40=40kg/亩在正交试验设计中,把这个值的一半叫N和P的交互作用,记为N×P,即N×P=(1/2)×40=20kg/亩同理我们也可以算出例1-2中农药收率试验中A和B因素的交互作用。第二节有交互作用的正交试验设计首先根据上表算出A,B因素各水平搭配下的指标平均值。如下令(y7+y8)/2=85.5令AB联合作用效果=AB同时变动引起的结果变动量Q-A单独变动时引起的结果变动量Q1-B单独变动时引起的结果变动量Q2=-10A×B=(Q-Q1-Q2)/2=(-10)/2=-5看前表
表明R3和A×B的交互作用是相同的,即第3列反映A和B的交互作用。由于A,B分别在1,2列,所以第3列也叫第1,2列的交互作用列。同理都可以算出。
即第5列为1,4列交互作用列,第6列为2,4列的交互作用列。讨论1)对于两水平正交表而言,两个因素的交互作用也占一列,应当把它作为一个因素看待,交互作用列的极差大小反映出交互作用对指标的影响大小,可在正交表上直接算出。2)当交互作用列的极差较大时,比如R3>RB>RA>RD,说明A×B超过A,B单独对指标的影响,这时A和B的不同水平搭配是重要的,必须考虑。而A×C,B×C的极差比RA,RB,RC小得多,可以忽略,视RA×C,RB×C是由误差引起的。3)在多因素试验中,两个因素间的交互作用叫一级交互作用,如A×B。三个因素间的交互作用叫二级交互作用,如A×B×C等。二级以上的交互作用叫高级交互作用。一般高级交互作用不考虑。讨论二、考虑交互作用的试验设计设计时注意事项:1.在安排试验方案和分析结果时,把交互作用当作一个因素处理,但它不是具体因素,对试验条件不发生影响。2.表头设计时,对所考虑的因素以及它们交互作用不能随意安排。任意两列的交互作用列的位置由所选的正交表对应的交互作用列表确定。例—农药厂提高农药收率试验这里除考虑四个二水平因素外,还考虑交互作用A×B,B×C由于把A×B,B×C当因素看待,即必须选用多于6列的二水平正交表。这里选L8(27)表头设计方案1AB由交互作用列表得A×B占第三列。A×BCB×CD方案2BCB×CAA×BD表头设计要点:先排重点考察交互作用及涉及交互作用较多的因素,接着排它们的交互作用,最后排不考虑交互作用的因素。涉及交互作用的因素越多,占正交表的列也越多,要选的正交表越大,试验次数越多。表头设计完后,将安排因素的各列中的数字换成各列因素的相应水平即可得到试验方案表。例1-2某农药厂为提高一种农药收率而进行试验1.明确试验目的,确定试验指标目的:提高农药的收率。指标:收率%。2.选因素,定水平根据实际经验选因素水平如下如下表A×BB×C三、试验结果的极差分析根据Rj的大小得因素主次顺序:C、A×B、B、A、D(B×C).显然A×B对指标影响远远大于A,B,这时,A,B的较优水平必须分析A和B的不同搭配效果,才能确定。
这个A2B1C2D2和没考虑交互作用搭配得出的较优生产条件C2B1A1D2不同,因此在交互作用较显著的情况下,必须考虑交互作用因素的搭配,否则将产生错误结果。A和B搭配表如下A2B1最好,因此较优产生条件为:A2B1C2D2第三节因素水平数不等的正交设计一、直接选用混合型正交表----并列法如:选用L8(4×24),可安排一个四水平因素和四个二水平的因素做正交试验。又比如L34(3×4×24)可安排一个三水平因素、一个四水平因素和四个二水平因素的正交试验。例1-3为减少玉米收获机的收获损失率,对摘穗装置进行改进试验。1)试验指标:玉米损失率%2)根据经验确定试验因素水平表如下3)选正交表可选L8(4×24)4)确定试验方案试验方案如下表所示5)试验测定和试验结果6)结果分析二、拟水平法1.拟水平法的定义:将水平数少于其他因素的因素水平数增加个数(拟水平),使其水平数与其他因素的水平数相同的正交试验设计方法。2.拟水平的含义:将水平数少于其他因素的因素水平数作为虚拟水平重复进行试验二、拟水平法例1-4东方红-75拖拉机与1LD4-35悬挂犁机组配套进行最大耕深试验研究。1.试验指标:最大耕深2.确定因素、水平表根据经验选择的因素和水平如下表所示3.选择正交表及确定试验方案采用拟水平法进行试验,现选L9(34)(锐)4.做试验,测定结果5.结果分析6.结果分析说明在拟水平法中,极差分析只能作粗略的估计,要准确判断主次顺序要用方差分析进行。在试验结果分析中将虚拟水平试验结果与被虚拟水平试验结果放在一起分析。第四节多指标试验的分析
在实际工作中,有些试验的指标往往不止一个。比如一次试验要同时考虑产品的几项性能、产量、成本等,象这种试验叫多指标试验。由于试验中每一个因素水平对各项指标的影响往往是不同的,有些对某一项指标好,而对另一项指标不好,因此在多指标试验的分析中,必须根据试验结果,生产实践及各种条件兼顾平衡,选出使各项指标都尽可能好的较优组合。
综合平衡法----在多指标试验中,先逐一按单指标试验分析出各项较优组合,然后根据因素主次、水平优劣和各项指标的重要性、实践经验等进行综合平衡,选出整个较优组合。例1-5探索水田收获机械行走机构及整机参数的合理选择,从而提高行走机构的通过性能。一、综合平衡法1)指标:滚动阻力、滑转率、下陷深度2)因素水平表3)试验方案及结果4)结果分析滚动阻力滑转率下陷深度主次顺序:BCA优水平:B3C1A1主次顺序:ABC优水平:A1B3C1主次顺序:BAC优水平:B1A1C1综合平衡:主次顺序:BAC较优组合:B3A1C1
二、综合加权评分法综合加权评分法:先评估各项试验指标在整个试验中的重要性,确定各项指标所占重要性的比例系数(权值),然后根据指标权值及试验指标实测值,算出综合加权评分值,再将多指标化为单指标,最后按单指标分析。综合加权评分法分析步骤:例1-5总权为1,令各指标的权为WK,即现取:W1(滚动阻力)=0.50W2(滑转率)=0.30W3(下陷深度)=0.201.确定各项指标的权式中,Rk---第k项指标极差(yM)k---第k项指标中的最大值(ym)k---第k项指标中的最小值(yi)k---第i号试验第k项试验指标观测值目的:实现指标无量纲化,使各指标数量级相同。2.计算各项指标观测值的评分值(yi)´k如:3.计算综合加权评分值同理4.按单指标进行分析主次顺序:BAC较优组合:B3A1C1结果和综合平衡法的一样。第二章试验数据的结构第一节试验数据的结构式实践和理论证明任何试验都是随机试验,试验结果为一随机值y。当设观测值为:y1,y2,y3……yn即它们是不一样的,即使在同一条件下的重复试验,结果也不完全一样,但它们绕某一中心值波动。如中心值即:
y=m+ε实测值应有理论值随机误差最简单数据结构式m---因素水平对试验指标总影响的结果。ε---随机误差对试验指标的影响。
因此要了解各因素水平对试验指标影响到底有多大,就要对m进行分解,下面分几种请况说明。(1)例2-1为寻找高产油菜品种,选了五种不同的油菜品种进行试验,每一品种在四块试验田上种植,得到结果如下:显然yij=mi+εiji=1,2,3….n;j=1,2,3….kn=5,k=4第i种油菜品种应有产量(2)ij一、单因素重复试验的数据结构式令:------一般平均μ可以理解为该因素取一个中等水平或平均水平时,试验结果应有的理论值。A因素i水平的效应为:ai=mi-μ
它表示A因素在i水平下的试验结果究竞比中等水平下的试验结果多多少或少多少的一个量。yij=mi+εij=μ+ai+εij单因素重复试验数据结构式其中:(3)(4)(5)yij=mi+εij二、双因素试验的数据结构式L4(23)y1=m11+ε1y2=m12+ε2y3=m21+ε3y4=m22+ε4yt=mij+εt(6)其中:mij---A因素取i水平,B因素取j水平条件下的应有理论值。εt---随机误差双因素试验的一般平均为:(7)其中:k---A因素的水平数。L---B因素的水平数。μ可以理解为A,B因素都取中等水平或平均水平时,试验结果应有的理论值。设:(8)分别表示A取i水平时,试验结果应有理论值和B取j水平时,试验结果应有理论值。水平效应:(9)ai---A取i水平时的水平效应bj---B取j水平时的水平效应其中:这时双因素试验数据结构式分两种情况。1.无交互作用时(10)mij2.有交互作用时(11)同理多因素的试验数据结构式(如有一级交互作用,三因素,二水平试验)为:(12)第二节用数据结构式说明几个问题一、说明正交设计极差分析的利弊用L4(23)为例说明当安排双因素且无交互作用时那么A因素对指标的影响随机误差的影响同理B因素对指标的影响随机误差的影响当误差较小时即极差实际上是水平效应之差,从而通过分析极差大小可以确定因素的主次。但实际上极差中包含着随机误差对指标的影响,而极差分析又不能把因素和随机误差对指标的影响分开,所以极差分析的精度较低。二、说明正交试验设计空白列可以估计误差还是用L4(23)为例说明说明R空大,误差影响大,反之相反。二、说明正交试验设计空白列可以估计误差三、估计试验结果的理论值例1-2农药收率试验中,最后得出的最优组合为A2B1C2D2,但这个组合不在8个试验号中,那么A2B1C2D2这一组合的试验结果应该是多少,如果不想再做试验,可以利用已有的试验结果推测出来。求A2B1C2D2组合的结果?四、利用试验数据的结构式补偿缺失数据
正交试验设计对数据进行统计分析时,数据必须齐全。但由于某种原因造成某一号试验数据丢失,则必须补齐,才能分析。一般可以重新做一次试验获得数据,但在条件不允许重新做试验时,可以利用结构式和参数估计法来补偿。补偿方法:现假设5号试验数据丢失,即要求求出y5即令即可用此估计值作缺失数据补偿。(y5=91)第三章试验的区组设计第一节区组和区组设计干扰----试验中不予考虑的因素对试验结果的影响。
区组----指人为划分的试验时间、空间、设备和人员的范围。区组因素----试验过程中那些不需考察的、但又影响试验指标的干扰原因。如地就是一个区组因素松软坚硬Ⅰ区组Ⅱ区组Ⅲ区组区组设计----为了防止不需考察而又不可控制的试验条件和考察因素的混杂,对试验结果产生影响,而采取划分区组来安排试验,以分开或消除干扰影响的技术措施。第二节非田间试验的区组设计定义:在室内试验时,把人员或设备设置成区组,作为一个因素排在正交表的一个列号上进行的试验设计。排区组因素的列称区组列。区组数=水平数如:在室内土槽试验,由于测试麻烦、又费时间,我们把试验人员分组进行试验。现采用L9(34)正交表进行试验,这样人员应分为三组(三水平),如下所示人员分组abc技术高技术低测犁耕阻力试验做试验时:a组人员做1,6,8号试验;b组人员做2,4,9号试验;c组人员做3,5,7号试验;
做完试验,进行试验结果统计分析时,当精度要求不高时,无需对区组列进行计算。但如果精度要求高,要用区组列的水平效应对试验数据进行矫正,消除区组因素对结果影响。方法下节讨论注意:1.区组设计时,区组因素不能和试验因素混杂。2.一般一个区组因素占一列。但有些不同区组因素可共占一列(如人员、设备),目的是能选小号正交表进行试验。第三节田间试验的区组设计一、试验地在一个方向有变化的区组设计1.完全区组设计例3-1为寻找水田收获机械的最佳行走机构方案,进行实地试验研究。所谓最佳行走机构是指行走阻力小的行走机构。因素水平表如下。用L4(23)安排试验,方案如下调查发现土壤坚实度变化如下松软坚硬区组Ⅰ区组Ⅱ区组Ⅲ每区组分四个小区松软坚硬区组Ⅰ区组Ⅱ区组Ⅲ每区组分四个小区每区组完成一次全部试验,三个区组要做三次重复试验。象这样全部试验排在一个区组内进行,每多一个区组就多一次重复试验的试验设计叫完全区组设计。123412341234最好随机安排试验,如134224131324但有时也可随机加人为安排结果分析:把同号的试验结果相加取平均值,后按没有重复试验情况一样分析即可。注意:1)完全区组设计,当试验号数大时,试验次数增加很多。所以当试验号数大时,不易作完全区组设计2)区组多,试验次数也多,所以区组也不应太多。2.不完全区组设计不完全区组设计----把区组因素看作一个因素排在正交表上,占正交表一列,把区组因素所在列处于同一水平的各号试验安排在同一区组内,因此每个区组内只安排部分试验。这样的区组设计叫不完全区组设计。例3-2将例3-1每个因素取三个水平,其因素水平表如下:试验地的情况如下:松软坚实用L9(34)进行试验,不考虑交互作用。把地视为区组因素,把它分为三个区组,每区组分三个小区。ⅠⅡⅢ试验方案如下:松软坚实ⅠⅡⅢ1,5,9号在Ⅰ区组内做2,6,7号在Ⅱ区组内做3,4,8号在Ⅲ区组内做试验及结果分析矫正值:其中:比如:…对yt进行矫正(扣除区组因素的影响)用矫正值进行结果分析D因素的R=0,说明区组对试验结果已没有影响。第四章方差分析方差分析----将因素水平(包括交互作用)变化所引起的试验指标波动与误差所引起的试验指标波动区分开来的一种统计分析方法。方差分析主要解决的问题:1.分析各因素水平的改变对指标的影响和误差对指标的影响。2.把上述两种影响进行比较,从而判断因素对指标影响是否显著,给出所作结论的置信度。3.确定因素主次和较优组合条件。第一节单因素试验的方差分析例4-1.播种深度是播种机设计和使用调整的重要因素,现考察小麦播种深度对出苗率的影响,找出最佳播种深度。试验地分12个小区,取四种播种深度,每种深度重复3个小区。试验指标:出苗率%,试验结果如下:ji一、试验误差的总估计A1(土壤条件一致):三次重复结果不同A2(土壤条件一致):三次重复结果不同A3(土壤条件一致):三次重复结果不同A4(土壤条件一致):三次重复结果不同说明试验中存在误差。下面来估计这种误差。按道理应该相同数据结构式:yij----i水平j次重复试验的指标值εij---相应的误差mi---i水平下试验指标的理论值则:mi用重复试验均值来估计,即ni:重复试验次数。可见εij有正、有负,为了避免在误差求和时,正负抵消,取它们的平方后再相加,得:叫偏差平方和,它表示A1水平下误差所引起的数据总波动,用S1表示。即:同理:令:误差平方和一般式r:水平数ni:重复数(1)二、因素水平变动引起试验数据波动的估计试验数据可以分为理论值和误差两部分,理论值就是在没有误差干扰情况下应有的结果。它可以用同一水平下重复试验结果的平均值来估计。比如:A1:1,2,3号试验结果的理论值≈60.8A2:1,2,3号试验结果的理论值≈80.0A3:1,2,3号试验结果的理论值≈57.8A4:1,2,3号试验结果的理论值≈57.7下面用同一水平下重复试验的平均值来代替试验数据得:
各列数据不一样,表明因素水平的改变引起了试验结果波动。那么如何表示试验数据的波动呢?用因素水平的偏差平方和来表示一般式:(2)r水平数ni重复试验数总平均值三、试验数据的总波动
试验数据如没有误差和因素水平效应影响,全部的试验数据都应一样,为因此试验数据yij与总平均值之差可以反映出总波动。取它们的平方后相加即得总偏差平方和(3)i=1,2,3……r水平数j=1,2,3……ni重复试验数进一步推导得:n试验数据总的个数当令:得:S总=W-PS因=Q-PS误=W-Q计算式四、自由度和平均偏差平方和
知道了误差和因素水平分别对指标的影响之后,还需将两者进行比较,以判断因素水平对指标的影响是否显著。但不能通过直接比较S误和S因的大小来进行。因为它们的大小不仅和参与计算的数据大小有关,且还与参与计算的数据个数有关。而一般计算S因和S误所含数据的个数不同,因此要进行比较时,首先要消除数据个数的影响。为此提出自由度概念。自由度-----独立的数据个数。比如:计算A1的S误(S1)时,用了三个数据(68.9,51.1,62.4),但它们有如下关系:(68.9+51.1+62.4)/3=60.8平均值(应有的理论值的估计)应有的理论值是一定值,即三个数据中只要知道两个,第三个也就确定了,所以只有两个数据是独立的。即:S1的自由度=3-1=2同理:S2,S3,S4的自由度也分别=3-1=2而S误=S1+S2+S3+S4所以S误的自由度=2+2+2+2=8类似:计算S因时,使用了60.8,80,57.8,57.7
四个数据所以S因的自由度=4-1=3而计算S总时用了12个数据,即S总自由度=12-1=11自由度用f表示S总=S因+S误f总=f因+f误一般:f总=总试验次数-1f因=因素水平数-1f误=f总-f因=n-rS/f-----平均偏差平方和(均方和)由于均方和消除了数据个数的影响,所以可以通过比较S因/f因和S误/f误,来判断因素对指标影响是否显著五、F比和显著性检验令:F=(S因/f因)/(S误/f误)统计量F比对于上例FA=(S因/f因)/(S误/f误)如果FA大,说明因素A的水平改变对指标影响大,显著。反之,相反。
那么FA多大,才可以认为因素A作用显著,显著程度如何,所作的结论有多大把握?这时就需要一个标准来衡量F比。利用F分布表可查出临界值Fα当FA≥Fα(f因,f误)约有(1-α)×100%的把握认为A对指标影响显著。比如:α=0.05(α称为信度,或显著性水平)认为有95%的把握判断A对指标影响显著。对于不同的α(信度),有不同的F分布表。α大小选择:问题重要α选小些,问题不太重要α选大些。对于本例:FA=(S因/f因)/(S误/f误)=(1033/3)/(341.42/8)=8.067查表得:F0.01(f因,f误)=F0.01(3,8)=7.59F0.05(f因,f误)=F0.05(3,8)=4.07FA=8.067>F0.01=7.59有高度显著的影响:**一般:有高度显著的影响:**有显著的影响:*有一定的影响:*上述的检验一般用表格进行第二节双因素试验的方差分析双因素试验方差分析和单因素方差分析基本相同,不同的是总体偏差平方和S总分解项增多了。一般情况(有交互作用、重复试验情况)。如表所示k:重复试验数i:A的水平数j:B的水平数S总=W-PSA=QA-PSB=QB-PSA×B=QA×B+P-QA-QBS误=Se=S总-SA-SB-SA×B=W-QA×B所有数据平方和本例:r=2,a=3,b=3A取a个水平B取b个水平r:重复试验次数f总=abr-1fA=a-1fB=b-1fA×B=(a-1)(b-1)f误(e)=f总-fA-fB-fA×B例:第三节正交试验的方差分析正交试验具有三个特点:1.任何一个因素,它的不同水平试验的次数是相同的。2.任两个因素之间的水平搭配都包括了全面搭配,且重复次数相等。3.有综合可比性,即对于每列的各水平相应的指标和(K值)比较时,其它因素的影响不混杂。即正交试验时:其中:---各因素偏差平方和之和。---各交互作用的偏差平方和之和。由推导可得各列因素的偏差平方和:(1)ni---各水平的重复试验次数。j---正交表列号。r---因素水平数。Ki---第j列、i水平的数据和。(g=1,2,3…..n)n---正交表的试验号数。yg---指标值。(2)下面分别讨论无交互作用、有交互作用、有重复试验三种情况下的S和f的计算方法。1.无交互作用情况令:g=1,2,3…….n(试验号数)i=1,2,3…….r(水平数)ni---水平重复数。Ki---同一水平数据和。即:例1方差分析Sj=Qj-P方差分析表2.有交互作用的情况S因=Sj和上面一样计算由于交互作用在正交表中占有一列或几列,在方差分析时,可把它们当作因素看待。但各交互作用所占的列数是随水平数的增加而增加的,水平数为r时,一个交互作用占r-1列,因此,每个交互作用偏差平方和等于它们各交互作用列偏差平方和之和。
如r---因素水平数。----正交表上代表该两个因素交互作用的某一列的偏差平方和(计算方法和因素列一样)例.某农药厂为提高某种农药收率的试验。实例在第一章已作过极差分析,下面作方差分析。考虑A×B,A×C,B×C,选用L8(27)正交表,试验结果及计算如表所示。作F检验时,由于SA×C,SB×C,SD都比较小,为了提高分析精度,可将SA×C,SB×C,SD合并起来作为Se的估计值。如果不这样,就要选大的表(留有空列,算Se1)或做重复试验,给出Se2.方差分析表有空列时,S空可和较小的S因合起来作为Se.确定最优组合由于A×B交互作用对指标影响明显,所以必须考虑A、B的组合。A2B1最好最优组合:A2B1C2D2例2.电镀前金属零件要去油去锈,原工艺去油去锈分别进行,现探索去油去锈一步进行,为此对影响去油去锈时间的因素A(酸:ml/l),B(OP乳化剂:ml/l)和C(硫尿:g)进行了正交试验,并要求分析它们间的交互作用。因素水平表试验方案及结果方差分析表3.有重复试验的情况令:yg---第g号数据和m---重复试验次数ygk---第g号k次重复试验数据。第g号平均值:总平均值:n--试验号数第二类偏差现令空白列的误差平方和为Se1(第一类偏差)即:
Se=Se1+Se2同样:fe=fe1+fe2fe2=n(m-1)当设正交表某列(j列)有r个水平,每个水平有ni个试验号,则该列的偏差平方和为:Ki----第j列、i水平的所有数据和(包括重复试验数据)自由度q--正交表总列数令:即(注:空列也按这个式子计算)例:m=2,n=4如:如:.也可用计算.也可用算Se=Se1+Se2=Se2fe=fe1+fe2=n(m-1)=4(2-1)=4..第四节不等水平正交试验的方差分析1.用混合正交表试验的方差分析例4-2.情况和例1-3相同,要求进行方差分析。.A4B2C1方差分析表因素主次:ACB2.拟水平法正交试验的方差分析例4-3.同例1-4情况一样,试作方差分析。Sj=Qj-P
说明还存在试验误差(Se2)或田间试验不可避免的干扰没有考虑。这时Se取8.82或5.72都可以,但取8.82精度高。取8.82时,fe=f总-fA-fB-fC=3取5.72时,fe=r-1=2在0.1下都不显著,所求的优组合只能作参考。可做重复试验,再分析。第五章
回归分析“回归”溯源:英文regression。提出者,英生物兼统计学家高尔顿,研究父亲与儿子的身高关系发现的规律:身高超过平均值的父亲,他们的儿子的平均身高将低于父亲的平均身高。反之,相反。结论:大自然具有一种约束力,使人类身高的分布在一定时期内相对稳定而不产生两极分化,所谓的回归效应。Y=35+1/2X
在生产实践和科学试验中,人们为了表示各变量之间的相互关系,往往希望通过试验获得一组数据,然后定量地建立起各变量之间的关系式(经验公式).比如当我们运用正交表试验法找出了影响指标的显著因素之后,还希望找出指标和一个或几个显著因素的关系式,以便更深刻地反映事物内部规律。又比如对于生产过程中积累起来的大量数据,希望通过分析把产品指标与生产条件之间的定量关系找出来以便进行预测和控制生产等等,这样就要进行回归分析。回归分析---对大量的观测数据进行分析处理,从而建立起变量间关系式的一种数学方法。一、变量间的关系1.完全确定性关系即已知的函数关系。一个变量的取值,完全由另一个或几个变量的取值依某种确定的关系而精确确定。2.相关性即存在着某种相当密切的关系,又不能完全确定。二、回归分析主要研究内容1)从一组数据出发,确定这些变量间的定量关系式;2)对确定出来的关系式的可信度进行统计检验;3)判断定量关系式中哪些变量是显著的,哪些并不显著;4)用所求的定量关系式对生产过程的自然现象等进行预测和控制。三、回归方程的确定1.一元一次方程的一般形式y=a+bx(数学模型)2.在实际中取得n组独立的数据(Xi,Yi)求参数a和b令:则:四、显著性检验(相关系数)1>R>0,R愈接近零,x与y之间的线性相关度愈小,反之相反。预测:当给定一个x0,预测y0的区间为:控制:当给定y1、y2:求x1、x2的控制区间。五、特殊一元非线性回归将具有非线性相关关系的散点,经过变量置换转化为线性关系,用线性回归的方法,求出非线性曲线。1.双曲线令
则
转化为
转化为
则
令,
2.幂函数3.对数函数令:
转化为则:
令:转化为则:
4.指数函数令:
转化为则:
令:
转化为则:
第一节直线回归直线回归(一元线性回归)要解决的是两个变量间的相关关系问题。
一、散点图与数学模型1.散点图例5-1.由新疆-5自走式联合收割机田间作业性能试验,测出脱不净损失率与喂入量间关系。表5-1是实测记录。
表5-1yx0.050.12468散点图X和y大概成一直线关系。2.直线回归数学模型上例中由于x和y约为一直线关系,我们可以假设它们之间有如下的结构式:i=1,2,…,n
其中::是随机误差,相互独立服从N(0,σ2)
(1)式(1)的回归数学模型。对于式(1)的回归方程为:(2)那么如何估计β0,β?用最小二乘法来估计。由式1可写出各观察点的误差平方和:
Q是β0和β的二次函数。如果β0和β的最小二乘估计分别为b0和b,则b0、b应使(3)2.直线回归数学模型为最小。
即应满足正则方程组:
化简整理上式得:
(4)其中:即:(5)代入Q式得:(6)显然,只要算出从而算出b和b0例3直线回归计算Q=3900.94
散点图和回归直线二、残差分析残差是yi与的差值
方差为:
剩余标准差:se=23.6令标准化残差
例3残差为:
残差图
xie'当时,说明拟合的方程是适合的。如果个别点,为极端值。除去,否则模型失真。如果回归直线拟合不好,e′会随着x以某趋势变化,如呈马蹄形“∩”或“∪”,或呈由小到大、由大到小的梯形分布等。三、参数的统计性质
由推导得:S总=lyy=Q+U其中:(S剩:剩余平方和)(S回:回归平方和)(总偏差平方和)(总自由度)fU--回归平方和自由度;f剩(fe)---剩余平方和自由度fT=n-1fU=1fe=n-2方差σ2的无偏估计为:剩余标准差1、回归直线的显著性检验统计量:当时,
回归直线在α水平上显著,回归方程有意义,反之不能断定X和Y之间有线性相关关系。回归方程意义不大。例3
说明回归直线(方程)非常显著。例3
2.b的显著性检验检验的统计量为:当t>tα(n-2)时,认为b是显著的。说明x对y影响显著。b的标准差为:当b显著时,β的(1-α)×100%的置信区间为:
对于例3
x对y有极显著的决定作用。
例3中β置信区间
3.b0的显著性检验
b0的标准差为:检验的统计量为:
当t>tα(n-2)时,b0显著,直线不过原点。β0的(1-α)×100%的置信区间为:对于例3:
即b0显著,直线不过原点。β0的99%的置信区间为:
一、农机鉴定的作用农机化科学体系的重要组成部分;是为使用者提供选择质优价廉的农机产品的必经程序;评价农机产品效益的主要手段;促进农机产品提高质量的有效措施。第六章农机鉴定概论二、农机鉴定主要考核内容:(五性)作业性能可靠性安全性经济性适应性以此对农机产品作出综合评价和鉴定结论;发布“农机鉴定通报”;对符合推广要求的农机产品经农机主管部门审批后核发“农机推广许可证”。第六章农机鉴定概论三、农机鉴定的发展概况农机鉴定是根据中国农村的实际国情,随着我国农机工业的建立和农机化事业的发展而建立和发展起来的;解放初,中国95%的人口是农民;农村人口众多,生活水平、知识水平、生产水平低;1951年在北京成立第一个农具试验鉴定组;1957年第一次召开全国农机化工作会议,农机试验鉴定组发展到69个;1978年成立国家级农机鉴定总站,各省市自治区成立省级农机鉴定站;目前已逐步发展成为农机鉴定检验推广站。第六章农机鉴定概论四、农机鉴定的种类1.按性质分: 2.按级别分:①科研鉴定; ①厂级鉴定;②新产品鉴定; ②省部级鉴定;③推广鉴定; ③国家级鉴定。④对比鉴定;⑤专项鉴定;⑥仲裁鉴定。
第六章农机鉴定概论四、农机鉴定的种类1.科研鉴定(科研成果鉴定)由科研主管部门主持进行。主要内容:是验证样机性能(成果)是否达到设计(项目)任务书的指标要求,审查评定设计是否先进合理,图纸和技术资料是否正确和齐全,并做出相应的结论。第六章农机鉴定概论四、农机鉴定的种类2.新产品鉴定由企业主管部门或委托专门的鉴定部门主持进行。主要内容:除对机具性能作出测试和考核,对图纸和技术文件进行审查外,还要考查机具性能的可靠性,是否具有良好的工艺工装保证,并对能否批量生产提出结论。第六章农机鉴定概论四、农机鉴定的种类3.推广鉴定由农机主管部门主持进行。主要内容:是按照选择性推广适用农业机械的原则,对机具的“五性”,特别是经济性和适应性进行全面鉴定和综合评价,确定是否可以推广,对符合推广使用的机具发放推广许可证。第六章农机鉴定概论五、农机鉴定的意义为设计新机器,改进现有机器提供理论依据;为农民选择适用机型;有效监督企业提高产品质量;提高农业技术装备水平。第六章农机鉴定概论六、国内农机装备产业发展概况近年来我国农机产品销量平均增长达24.3%,远大于GDP增幅;拖拉机的销售额占农机销售总额的21.9%,是我国主要的农机销售产品;拖拉机和农用运输机械出口具有很强的竞争优势;农机工业企业效益得到明显改善,行业利润超过3%,总额达到43.7亿元,同比增长了38.7%,远大于机械行业的平均增长率。第六章农机鉴定概论1.国内农机技术发展趋势
①机械制造自动化水平进一步提高;
②制造技术在讲求精益生产的同时,制造系统的柔性也应加强;
③制造管理模式转向一体化集成管理。
第六章农机鉴定概论2.拖拉机及柴油机市场
3.拖拉机配套农具市场4.联合收割机的市场60~80马力的联合收割机是市场热点,为满足2010年小麦、水稻、玉米机械化收获水平分别达到90%、55%和10%以上的国家农机化规划目标,联合收割机的总拥有量将稳步增长,年需求量在8万~10万台;多功能型联合收割机将是未来5年研究的重点;玉米联合收割机刚刚起步,现在的机械化收获水平不足2%,2010年拥有量有望超过2万台。一旦核心技术突破,玉米联合收割机的市场需求将大幅攀升;小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《政治心理学》课程教学大纲
- 2024年出售小吃街摊位合同范本
- 2024年出售风力发电立柱合同范本
- 2024年承接营养土种植合同范本
- 地高辛药物护理
- 2024-2025学年四川省达州市高二上学期11月期中考试数学试题(含答案)
- 冠状动脉造影手术配合
- 团日活动四式教育
- 西部开发省际公路通道银武线十堰至漫川关段水土保持方案报告书
- 【高中数学课件】排列与组合的应用
- 肠易激综合征疗
- 2024天猫男装行业秋冬趋势白皮书
- 运营内控副行长/经理资格认证考试题库(2021版)
- 办公技能竞赛试题
- 2024年绵阳科技城新区事业单位考核公开招聘高层次人才10人(高频重点复习提升训练)共500题附带答案详解
- 韶关市仁化县教育局招聘中小学临聘教师笔试真题2022
- 七年级英语上册(人教版2024)新教材解读课件
- 新大象版六年级上册科学全册知识点 (超全)
- 电力专业数据传输(EPDT)通信系统 空中接口呼叫控制层技术规范 标准编制说明
- 2024年东南亚集装箱班轮运输市场深度研究及预测报告
- 建筑项目安全风险分级管控清单建筑风险分级管控清单(范例)
评论
0/150
提交评论