材料实验设计优化与数据处理_第1页
材料实验设计优化与数据处理_第2页
材料实验设计优化与数据处理_第3页
材料实验设计优化与数据处理_第4页
材料实验设计优化与数据处理_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、材料实验设计优化与数据处理 1材料实验设计优化与数据处理学时:32学时 学分:2教材:试验设计与数据处理,郑少华,中国建材工业出版社,2004教学目的:1)掌握数据处理的基本知识2)通过该课能自主设计实验方案以及进行数据处理教学内容:1)误差分析及结果表达2)统计检验与区间估计、方差分析3)试验设计方法4)正交实验设计与数据处理5)回归分析2教学参考书:试验设计,茆诗松,化学工业出版社,2003实验设计与数据处理,刘振学等,化学工业出版社,2005概率论与数理统计,鲍祥霖 ,上海交通大学出版社,2004 3第1章 概论主要内容:1.1 数据测量的基本概念(自学)1.2 误差的基本知识本章重点:

2、误差的表达方式及计算,及误差的分类41.2 误差的基本知识1.2.1 误差的概念真值:某物理量客观存在的实际大小。注意:真值是未知的。实验中,真值就是在无系统误差的情况下,观察无限多时所求得的平均值。实际上,只能使用有限次测量求得的平均值作为近似真值。51.2.2 误差的表示方法什么是误差?其中通常人们用来表示。(1)绝对误差:绝对误差测量值真值(2)相对误差(3)引用误差在电工仪表中,通常分为0.1,0.2等七个等级,表示该仪表最大引用误差的大小,如0.1,0.2。仪表使用时要尽可能靠近量程的区域,为什么?例:现在欲测量大约90伏的电压,实验室有0.5级0300V和1.0级0100V的电压表

3、,选哪种更好?6(4)偏差: 测量值与平均值的差值,用 d表示d = xi - xdi = 0(5)平均偏差: 各单个偏差绝对值的平均值 7(6)偏差平方和和自由度8总体(母体)的标准偏差实际中的,样本的标准偏差(7)方差: 单位自由度的偏差大小(8)均方差:标准差9(9)平均值的标准差:根据数理统计理论,随着测定次数的增多,测定精密度增加,求得的算术平均值越接近于真值,算术平均值的精密度要高于单次测定值的精密度,因此,平均值的标准误差由下式求得。 101.2.3 按性质,测量误差的分类(1)系统误差,系统误差是由较确定的原因引起的,可校正和消除。 特点 a.对分析结果的影响比较恒定; b.在

4、同一条件下,重复测定, 重复出现; c.影响准确度,不影响精密度; d.可以消除。11(2) 随机误差正态分布性质:原因:环境误差、使用误差处理:统计分析、计算处理 减小对称性有界性抵偿性单峰性绝对值相等的正负误差出现的次数相等绝对值小的误差比绝对值大的误差出现的次数多偶然误差绝对值不会超过一定程度当测量次数足够多时,偶然误差算术平均值趋于012 由粗心大意引起,可以避免的(3)过失误差131.3 分析方法的评价指标1 精密度 精密度(Precision)是指在相同条件下,对同一量进行多次重复测定时,测定值的偏散程度;测定值越集中,测定精密度越高。精密度通常用标准差来量度。 表达了测定结果的重

5、复性和再现性。2 准确度准确度 (Accuracy)是表示在一定测定精密度条件下多次测定平均值与真值相符合的程度,用误差或相对误差表示。 14测量精度举例不精密(随机误差大) 准确(系统误差小) 精密(随机误差小)不准确(系统误差大)不精密(随机误差大)不准确(系统误差大)精密(随机误差小)准确(系统误差小)15是与测量结果相联系的参数,是表示对测得值不能肯定的程度的分散性参数。3 测量不确定度16测量不确定度反映了对被测量真值不能肯定的程度,或者说测量值作为被测量真值的估计值可能存在的一个散布范围并在这个散布范围内以一定的概率(如68.3)包含被测量真值。这个范围可表述为 测量结果(.)式中

6、:是测量值;是测量不确定度;是包含真值的概率。17第2章 误差理论及数理统计基础1 有界性:误差的绝对值不会超过一定的界限。2 单峰性:随机误差的概率分布呈单峰性。3 对称性:正负误差出现次数大致相等。4 抵偿性:绝对值相等的正负误差出现的次数相等, 随着测量次数的增加趋于零。2.1误差理论2.1.1 随机误差的特性及分布18相同条件下多次测量与随机误差的分布特征,例:100次测定下表为某灯泡的使用寿命2-1 测量数据表19直方图做法:A 找出样本数据的最大和最小值B 确定分组组数和组距x。C 统计落在各组的数据个数i,i称为分组频数。分组频数i除以数据总数,得相对分组频数ii,i又称经验概率

7、。D 以ix(即单位组距的相对频数)为纵坐标作图,得统计直方图。根据上表作统计直方图和正态分布概率密度曲线202-2 频数分布表 2122 其中为总体的标准偏差,总体均值,都为参数。 它们的变化使得f(x)曲线的高矮胖瘦发生变化。正态分布的概率密度函数f(x)由下式给出:随机误差的分布之一 正态分布23 其中和为参数,可记为随机变量 ,其中正态分布曲线与横坐标在整个数轴上所夹的面积就是测量值出现的概率的总和,其值为1。 测量值在某一范围内出现的概率,就等于f(x)在该范围内的积分数,我们也称之为分布函数。 如果令 ,得到标准正态曲线,得到24为了便于以后的应用,对于标准正态随机变量 ,可引入下

8、百分位点(侧位点)的定义。设 ,Za满足 则称Za为标准正态分布的下a侧位点。如Z0.05=Z0.005=1.642.5725z0.000.010.020.030.040.050.060.070.080.090.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.90.50000.53980.57930.61790.65540.69150.72570.75800.78810.81590.84130.86430.88490.90320.91920.93320.94520.95

9、540.96410.97130.97720.98210.98610.98930.99180.99380.99530.99650.99740.99810.50400.54380.58320.62170.65910.69500.72910.76110.79100.81860.84380.86650.88690.90490.92070.93450.94630.95640.96480.97190.97780.98260.98640.98960.99200.99400.99550.99660.99750.99820.50800.54780.58710.62550.66280.69850.73240.76

10、420.79390.82120.84610.86860.88880.90660.92220.93570.94740.95730.96560.97260.97830.98300.98680.98980.99220.99410.99560.99670.99760.99820.51200.55170.59100.62930.66640.70190.73570.76730.79670.82380.84850.87080.89070.90820.92360.93700.94840.95820.96640.97320.97880.98340.98710.99010.99250.99430.99570.99

11、680.99770.99830.51600.55570.59480.63310.67000.70540.73890.77030.79950.82640.85080.87290.89250.90990.92510.93820.94950.95910.96710.97380.97930.98380.98740.99040.99270.99450.99590.99690.99770.99840.51990.55960.59870.63680.67360.70880.74220.77340.80230.82890.85310.87490.89440.91150.92650.93940.95050.95

12、990.96780.97440.97980.98420.98780.99060.99290.99460.99600.99700.99780.99840.52390.56360.60260.64060.67720.71230.74540.77640.80510.83150.85540.87700.89620.91310.92780.94060.95150.96080.96860.97500.98030.98460.98810.99090.99310.99480.99610.99710.99790.99850.52790.56750.60640.64430.68080.71570.74860.77

13、940.80780.83400.85770.87900.89800.91470.92920.94180.95250.96160.96930.97560.98080.98500.98840.99110.99320.99490.99620.99720.99790.99850.53190.57140.61030.64800.68440.71900.75170.78230.81060.83650.85990.88100.89970.91620.93060.94300.95350.96250.97000.97620.98120.98540.98870.99130.99340.99510.99630.99

14、730.99800.99860.53590.57530.61410.65170.68790.72240.75490.78520.81330.83890.86210.88300.90150.91770.93190.94410.95450.96330.97060.97670.98170.98570.98900.99160.99360.99520.99640.99740.99810.99863.00.99870.99900.99930.99950.99970.99980.99980.99990.99991.0000标准正态分布表2627例题2.1 已知xN(4,62),求F(6).例题 已知某试样中

15、Co的标准值为1.75,0.10,又已知测量时没有系统误差,求分析值落在(1.75 0.15)范围内的概率。28什么是母体(总体)?什么是子样(样本)?总体(母体)的无偏估计值:样本的平均值但由于样本平均值不可能恰好等于,故用一个平均值的邻域去包含,计算出这个区间包含的概率,这就是区间估计,用来包含的概率,称之为置信概率或置信度。2.1.2 随机误差的数理统计29 例题2.2某工厂生产滚珠,测量其直径X,XN(,0.062)从某一天的产品中随机抽取六件样品,测得其直径为(单位:mm) 14.60 15.10 14.90 14.80 15.20 15.10 求其的置信度1-a0.95的置信区间。

16、例题2.3见上题,其他数据不变,只设2未知,求其的95的置信区间?返回30大样本,总体均值的区间估计 ( 根据总体方差是否知道,估计分两种情况)1. 已知 未知,用 代替 31小样本,且为正态总体 ,总体均值的区间估计(用 分布)322.1.4 t分布(学生分布) 一般总体的标准误差是不可能求得,因此当未知时,要引入一个新的统计量 t ,它只与样本的容量(样本个数)及样本的标准偏差有关。 它的概率密度函数为: t曲线随着自由度f的不同而不同, f=n-1,叫做自由度,n为样本的容量。限于了解33自由度f和a时,可以查出所对应的x轴上的t值。 t分布示意图34例题 钢中铬的6次测定结果为1.12

17、,1.15,1.11,1.16,1.12,1.12。根据这批数据估计铬的含量范围(P95)。352.1.5 F分布(Fisher函数) 两个随机变量X与Y都符合正态分布, ,选统计量F:其概率密度函数值取决于F值及自由度f1和f2。 用于比较两个样本的精密度有无显著差异。36 F分布概率密度函数示意图10.0512.852.019372.3 统计检验 内容:先对总体分布的某些参数或总体的分布函数的形式作某种假设,然后利用样本的有关信息对所作假设的正确性进行推断.例: 某树脂厂用自动打包机包装PP树脂,每包标准重量50kg,抽样6包:49.65 49.35 49.85 50.15 50.25 问

18、包装机的工作是否正常? 38 意义:数据是波动的,有差异的关键是区分随机误差系统误差区分这两种误差是关键,但往往难以区分,统计检验可以解决问题. 39 推理方法:反证法:带概率性质的反证法概率反证法的逻辑是:小概率事件是不可能产生的.40在提出原假设H0后,如何作出接受和拒绝H0的结论呢?在假设检验中,我们称这个小概率为显著性水平,用 表示.常取 的选择要根据实际情况而定。41 如果H0 是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件. 如果该统计量的实测值落入W,也就是说, H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它. 否则我们就不能否定H0 (

19、只好接受它).这里所依据的逻辑是:42提出假设 根据统计调查的目的, 提出原假设H0 和备选假设H1作出决策抽取样本检验假设拒绝还是不能拒绝H0显著性水平总 结432.2.1 z 检验(u检验)适用范围:总体(母体)的标准方差 已知; 选用的统计量为 检验方法:查出临界点 ,当统计量 时,则否定假设,说明出现了显著差异。(双边检验)44H0Ha显著性水平下的拒绝域=00z z /2=00 z z =00 z -z Z检验表45例: 某树脂厂用自动打包机包装PP树脂,每包标准重量50kg,抽样9包:49.65 49.35 50.25 50.60 49.85 49.15 49.75 51.05 5

20、0.25 问包装机的工作是否正常?=0.6 P=0.95建立假设H0:=0相反假设Ha: 0显著性水平=0.05检验的拒绝域Z z /2= z 0.025=1.96计算统计量z故接受原假设,包装机的工作正常,置信度为95%462.2.2 t检验适用范围:总体(母体)的标准方差 未知; 选用的统计量为 检验方法:查出临界点 ,当统计量 时,则否定假设,说明出现了显著差异。470.20.10.050.020.010.00113.07768 6.31375 12.70620 31.82052 63.65674 636.61925 21.88562 2.91999 4.30265 6.96456 9.

21、92484 31.59905 31.63774 2.35336 3.18245 4.54070 5.84091 12.92398 41.53321 2.13185 2.77645 3.74695 4.60409 8.61030 51.47588 2.01505 2.57058 3.36493 4.03214 6.86883 61.43976 1.94318 2.44691 3.14267 3.70743 5.95882 71.41492 1.89458 2.36462 2.99795 3.49948 5.40788 81.39682 1.85955 2.30600 2.89646 3.3553

22、9 5.04131 91.38303 1.83311 2.26216 2.82144 3.24984 4.78091 101.37218 1.81246 2.22814 2.76377 3.16927 4.58689 111.36343 1.79588 2.20099 2.71808 3.10581 4.43698 121.35622 1.78229 2.17881 2.68100 3.05454 4.31779 131.35017 1.77093 2.16037 2.65031 3.01228 4.22083 141.34503 1.76131 2.14479 2.62449 2.97684

23、 4.14045 151.34061 1.75305 2.13145 2.60248 2.94671 4.07277 161.33676 1.74588 2.11991 2.58349 2.92078 4.01500 171.33338 1.73961 2.10982 2.56693 2.89823 3.96513 181.33039 1.73406 2.10092 2.55238 2.87844 3.92165 191.32773 1.72913 2.09302 2.53948 2.86093 3.88341 201.32534 1.72472 2.08596 2.52798 2.84534

24、 3.84952 211.32319 1.72074 2.07961 2.51765 2.83136 3.81928 221.32124 1.71714 2.07387 2.50832 2.81876 3.79213 231.31946 1.71387 2.06866 2.49987 2.80734 3.76763 241.31784 1.71088 2.06390 2.49216 2.79694 3.74540 251.31635 1.70814 2.05954 2.48511 2.78744 3.72514 261.31497 1.70562 2.05553 2.47863 2.77871

25、 3.70661 271.31370 1.70329 2.05183 2.47266 2.77068 3.68959 281.31253 1.70113 2.04841 2.46714 2.76326 3.67391 291.31143 1.69913 2.04523 2.46202 2.75639 3.65941 301.31042 1.69726 2.04227 2.45726 2.75000 3.64596 T 分布表48H0Ha显著性水平下的拒绝域=00t t /2, (f)=00 t t , (f)=00 t -t , (f)t检验表49例 某厂生产新型塑料板,厚度要求为2.40mm

26、,对某批产品进行抽样检测,实测数据为2.37,2.41,2.39,2.39,2.41。问这批产品是否合格(a=0.05)?50 两个总体的检验:检测不同实验室,不同操作者,不同方法测定的样本平均值之间是否有显著差异。 选择的统计量为51H0Ha显著性水平下的拒绝域1=212t t /2, (f)1=212 t t , (f)1=212 t -t , (f)t检验表(两个总体)52例 一分析人员用新方法和标准方法测定了某试样中的含铁量,得到了如下结果(): 新方法:23.28,23.36,23.43,23.38,23.30标准方法:23.44,23.41,23.39,23.35问:两种方法有无显

27、著差异,即新方法是否存在系统误差(P95)?532.2.3 F检验法定义:两个样本都来自同一个总体,方差分别为 ,两个方差之比用F表示,即,适用范围:反应产品稳定性的重要指标,主要表征精密度是否有显著差异。 F的值随着测定次数增多接近1,但在有限次测定中,该值不可能正好为1,但应在有限的范围波动; 若 注意:F的单边检验。54 例2.19 某橡胶配方,改变氧化锌的用量后,两种配方抽样实验,得到橡胶的指标值如下表,问:在a=0.05下,两种配方指示值的总体标准偏差有无显著性差异?配方1540533525520545531541529534配方156557758057555654256053257

28、056155 两个总体的t检验和F检验的区别: t检验是检验两个样本的均值是否相等; F检验是检验两个样本代表的总体的方差是否相等。56 例 对平炉炼钢进行工艺改革,先用原方法炼一炉,再用改革工艺后得方法炼一炉,以后这样进行交替进行,各炼10炉,考察指标如下表: 假设两个样本互相独立,问分别用t检验和F检验判断两个工艺方法有无显著性的差异(a=0.01) 思考:用t和F检验差异性,分别是检验什么的差异性?原方法78.172.476.274.377.478.476.075.576.777.3新方法79.181.077.379.180.079.179.177.380.282.157练习1 用某仪器

29、间接测量温度,重复测量5次,得以下数据():1250,1265,1245,1260,1275, 若用别的精确方法测得温度为1277,可看作温度的真值,问此仪器间接测量有无系统偏差? 2 已知某标样的二氧化硅含量的标准值为34.33,现用新方法测得8个数据:34.30,34.32,34.26,34.35,34.38,34.28,34.29,34.23,问:新方法是否可靠?(P95)3 分别使用A B 两台仪器测定某一物理量,测得如下数据:A 20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2 B 17.7 20.3 20.0 18.8 19.0 20.2 19.1 2

30、0.1 19.4试问这两台仪器的数据稳定性是否相同(P95)582.3 方差分析 定义 数据参差不齐引起差异,称之为误差。 它们偏差的总量度可以用误差平方和S来表示, 为了使之同测量数目无关,提出:相对偏差平方和: 注意:这里的系统误差主要是由于试验因素的变化引起实验结果的差异,用来评价因素效应。59 几个常用的术语试验指标:为 衡 量 试 验结果的好坏或处理效应的高低 ,在试验中具体测定的性状或观测的项目称为试验指标。 试验因素:影响试验指标的因素叫试验因素。 试验水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。 60 引例 解: 因素: 水平: 指标: 随机误差: 系统误

31、差:催化剂12345收率 0.860.800.830.760.960.890.830.900.810.950.910.880.940.840.930.900.840.850.820.94平均值0.89000.83750.88000.80750.9450催化剂5种收率每一种催化剂所得结果的标准偏差各催化剂所得平均值 的差异612.3.1 单因素方差分析目的:考察一个因素的r个水平对实验结果是否存在显著性差异。表 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.8

32、29.632.431.732.8例 试分析饮料的颜色是否对销售量产生影响?62检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同设1为无色饮料的平均销售量,2粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设H0: 1 2 3 4 H1: 1 , 2 , 3 , 4不全相等检验上述假设所采用的方法就是方差分析表 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732

33、.863(1)方差分析的基本思想和原理随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异系统误差在因素的不同水平(不同总体)下,各观察值之间的差异表 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.864组内方差因素的同一水平(同一个总体)下样本数据的方差比如,无色饮料A1在5家超市销售数量的方差组内方差只包含随机误差组间方差因素的不同水平(不同总体)下各样本之间的方差比如,A1、A2、A3、A4四种颜色饮料销售

34、量之间的方差组间方差既包括随机误差,也包括系统误差(两类方差)65如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异(方差的比较)66每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每种颜色饮料的销售量必需服从正态分布各个总体的方差必须相同

35、对于各组观察数据,是从具有相同方差的总体中抽取的比如,四种颜色饮料的销售量的方差都相同观察值是独立的比如,每个超市的销售量都与其他超市的销售量独立(2)方差分析中的 基本假定表 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.867 如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分样本均值越不同,我们推断总体均值不同的证据就越充分 表 该饮料在五家超市的销售情

36、况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.868 如果原假设成立,即H0: m1 = m2 = m3 = m4四种颜色饮料销售的均值都相等-没有系统误差 这意味着每个样本都来自均值为、差为2的同一正态总体 Xf(X)1 2 3 4 69如果备择假设成立,即H1: mi (i=1,2,3,4)不全相等至少有一个总体的均值是不同的有系统误差 这意味着四个样本分别来自均值不同的四个正态总体 Xf(X)3 1 2 4 70(3)单因素方差分析的步骤步骤:

37、1 提出假设 2 构造检验统计量 3 统计决策观察值 ( j )因素(A) i 水平A1 水平A2 水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n x2n xkn71H0: m1 = m2 = m3 = m4颜色对销售量没有影响H0: m1 ,m2 ,m3, m4不全相等颜色对销售量有影响构造统计量需要计算水平的均值全部观察值的总均值偏差平方和均方2 构造检验的统计量提出假设72(计算水平的均值 )ni为第 i 个总体(水平)的样本观察值个数 xij 为第 i 个总体(水平)的第 j 个观察值 (计算全部观察值的总均值 )73表 四种颜

38、色饮料的销售量及均值超市( j )水平A ( i )无色(A1)粉色(A2)橘黄色(A3)绿色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合计136.6147.8132.2157.3573.9水平均值观察值个数x1 =27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5总均值x =28.695前例计算结果74计算总偏差平方和 ST全部观察值 与总平均值 的偏差平方和反映全部观察值的偏散状况其计算公式为 前例的计算结果: ST

39、 = (26.5-28.695)2+(28.7-28.695)2+(32.8-28.695)2 =115.929575计算误差项平方和 SE每个水平或组的各样本数据与其组平均值的偏差平方和反映每个样本各观察值的偏散状况,又称组内偏差平方和该平方和反映的是随机误差的大小计算公式为 前例的计算结果:SE = 39.08476(计算水平项平方和 SA)各组平均值 与总平均值 的偏差平方和反映各总体的样本均值之间的差异程度,又称组间平方和该平方和既包括随机误差,也包括系统误差计算公式为 前例的计算结果:SA = 76.845577构造检验的统计量(三个平方和的关系)总偏差平方和(ST)、误差项偏差平方

40、和(SE)、水平项偏差平方和 (SA) 之间的关系ST = SE + SA782 三个平方和的自由度分别是ST 的自由度为n-1,其中n为全部观察值的个数SA的自由度为k-1,其中k为因素水平(总体)的个数SE 的自由度为n-k1 为了消除观察值个数对偏差平方和大小的影响,需要将其平均,这就是均方,也称为方差(计算均方 MS)79构造检验的统计量(计算均方 mS)SA的均方也称组间方差,记为mSA,计算公式为SE的均方也称组内方差,记为mSE,计算公式为80构造检验的统计量(计算检验的统计量 F )将mSA和mSE进行对比,即得到所需要的检验统计量F当H0为真时,二者的比值服从分子自由度为k-

41、1、分母自由度为 n-k 的 F 分布,即 81构造检验的统计量(F分布与拒绝域)如果均值相等,F=mSA/mSE1a F 分布F(k-1,n-k)0拒绝H0不能拒绝H0F若FF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响若FF ,则不能拒绝原假设H0 ,表明所检验的因素(A)对观察值没有显著影响 82单因素方差分析表(基本结构)方差来源平方和S自由度均方mSF 值临界值Fa显著性组间(因素影响) 组内(随机误差) 总和SA=76.8455SE=39.0840ST=115.9300k-1=3n-k=16n-1=19mSA=25.6150mSE=2.4

42、4283.23显著影响*83 显著性判别:P5184等重复数单因素方差分析计算观察值 ( j )因素(A) 水平A1 水平A2 Ai 水平Ak12j:N x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1N x2N xkN原:n1=n2=n3=.=nk=N85观察值 ( j )因素(A) 水平A1 水平A2 Ai 水平Ak12j:N x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1N x2N xkN x1 x2 xk 1 ()2 (x1 ) 2 (x2 ) 2 (xk )22 2 x21j x22j x2kj386催化剂12

43、345收率 4.36.16.59.39.57.87.38.38.78.83.24.28.67.211.46.54.18.210.17.8等重复数单因素方差分析计算举例某项催化剂实验,用五种不同配方的催化剂,在其它条件不变的情况下,测得转化率数据如下表所示,试分析催化剂的不同对转化率有无显著影响?上表中 k=5 N=4 kN=20H0: 1=2=3=k87列表计算催化剂12345收率 4.36.16.59.39.57.87.38.38.78.83.24.28.67.211.46.54.18.210.17.8 21.8 21.7 31.6 35.3 37.5 1 (147.9) ()2 475.2

44、4 470.89 998.56 1246.09 1406.252 (4597.03) 2 131.82 124.95 252.34 316.03 358.49 3 (1183.63)88查附录 F0.01(4,15)=4.89由于F F0.01(4,15) ,故拒绝原假设, 即为催化剂的不同对原料的转化率的影响特别显著列方差分析表方差来源平方和S自由度均方mSF 值临界值Fa显著性组间 组内 总和SA=55.54SE=34.37ST=89.91k-1=4n-k=15n-1=19mSA=13.88mSE=2.296.064.89显著影响*89不等重复数单因素方差分析计算n1+n2+n3+nr=n

45、观察值 ( j )因素(A) 水平A1 水平A2 Ai 水平Ar12j:ni x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n1 x2n2 xknk90 x1 x2 xk 1 ()2 (x1 ) 2 (x2 ) 2 (xk )2 nj n1 n2 nk ()2 /nj (x1 ) 2 /n1 (xk ) 2 /nk2 2 x21j x22j x2kj3观察值 ( j )因素(A) 水平A1 水平A2 Ai 水平Ak12j:ni x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n1 x2n2 xknk91不同生产线1234

46、 橡胶的断裂伸长率0.580.750.630.850.700.800.610.870.710.720.590.720.520.710.560.780.750.560.420.630.780.680.400.900.610.660.530.610.55不等重复数单因素方差分析计算举例测得四条生产线上橡胶的断裂伸长率如下表所示,试分析不同生产线的橡胶的断裂伸长率是否有明显差别?上表中 k=4 n=29H0: 1=2=3=k92列表计算 4.61 5.49 4.29 4.751 (19.14) ()2 21.25 30.14 18.40 22.56 nj 7 8 8 629 ()2 /nj 3.03

47、6 3.767 2.301 3.7602 (12.86) 2 3.099 3.809 2.351 3.8193 (13.08)催化剂1234收率 0.580.750.630.850.700.800.610.870.710.720.590.720.520.710.560.780.750.560.420.630.780.680.400.900.610.660.530.610.5593查附录 F0.01(3,25)=4.68由于F F0.01(3,25) ,故拒绝原假设94方差分析表误差来源偏差平方和自由度均方差F值F临界值显著性组间0.2330.0778.754.68*组内0.22250.0088

48、总和0.4528952.3.2 双因素方差分析分析两个因素(因素A和因素B)对试验结果的影响 分别对两个因素进行检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素都不起作用如果A和B对试验结果的影响是相互独立的,称为无交互作用的双因素方差分析因素A和因素B的搭配还会对销售量产生一种新的影响,称为有交互作用的双因素方差分析 对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果相同96双因素方差分析的数据结构 平均值 : :平均值 B1 B2 Br x11 x12 x1k x21 x22 x2k : : : : : : : : xr1 xr2 xrkA1A2:Ak 因素(B) j 因素A(i) 平均值 : :平均值 B1 B2 Br x11 x12 x1r x21 x22 x2r : : : : : : : : xk1 xr2 xkrA1A2:Ak 因素(B) j 因素A(i) 97这里不考虑交互作用98构造检验的统计量(计算SA、SB和SE)因素A的偏差平方和SA因素B的偏差平方和SB误差项平方和SE99三个平方和的自由度分别是总偏差平方和ST的自由度为 kr-1因素A的偏差平方和SA的自由度为 k-1因素B的偏差平方和SB的自由度为 r-1随机误差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论