版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机在材料科学中的应用概论材料的分类 有机高分子材料:有机分子、聚合物(塑料、橡胶、黏合剂、涂料、纤维)、高聚物 (非晶态、晶态、液晶、合金) 生物活性材料:谷氨酸被颉氨酸取代导致镰刀型贫血症、DNA、基因组 金属材料:有色金属、黑色金属、合金材料 无机非金属材料:从硅酸盐材料到功能材料、半导体 复合物:有机金属化合物(五十年代的二戊铁)材料研究的层次 材料工程:制备工艺与用途 材料科学:化学组成、性能、显微结构 材料化学:元素组成、分子结构、化学键 材料物理:电子结构、场力、能量计算机技术在材料中的应用 材料物理计算 材料化学计算 材料结构与性能计算 材料工艺设计 材料工艺控制 材料数据库
2、 材料数据挖掘举例 陶瓷材料设计 金属材料设计 耐火材料设计 防腐蚀材料设计 功能材料设计 电池材料设计 材料性能预报计算机在材料科学中的应用 计算机辅助试验设计:正交设计与均匀设计 实验数据的处理与分析:准确度与精确度 数学模型的建立与评价:最小二乘与回归分析 数学规划与配方计算:规划的解法与配方实例 基于计算机的实验模拟:应用实例 材料性能的预报与评估:应用实例 材料化学的理论计算:模式识别、人工神经网络、遗传算法 材料物理的理论研究:量子力学与量子化学 新材料的设计与开发:进展计算机辅助试验设计试验设计之源起 20世纪30年代,由于农业试验的需要,R.A.Fisher在试验设计和统计分析
3、方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支 F. Yates, R.C. Bose, O. Kempthome, W. G. Cochran, D. R. Cox和G. E. P. Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛 1960年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,使得试验设计得到广泛的普及与应用国内试验设计简史 60年代由华罗庚教授倡导与普及的“优选法”,即国外的斐波那契方法 70年代我国的数理统计学者在工业部门中普及的“正交设计”法都是人们熟悉的试验设计法 70年代末期由方开泰教授和王元教授倡导和推广的均
4、匀设计也是一种常用的试验设计方法。 “优选法”是单变量的最优调试法,“正交设计”是基于拉丁方理论和群论的多因素试验设计方法,“均匀设计”则是基于数论方法的另一种多因素试验设计方法。 利益所在 试验设计得好,会事半功倍,反之就会事倍功半了。好的试验设计方案可以大大减少试验次数,得到充分的信息,简化数据处理过程,节省人力、物力和时间。正确合理的试验设计,可以使试验结果的可靠性显著提高。试验设计还可以为迅速寻求参数的优化数值和选择最佳工艺方案指明方向。 材料科学与材料工业中经常会出现各种试验设计问题,例如配方试验或称混料试验(Experiments with Mixtures),就是在材料科学中经常
5、遇到的问题之一。 基本概念 指标:在试验设计中,人们把判断试验效果好坏所采用的标准称为试验指标,或简称为指标 因素:或称为因子,有可能影响试验指标的条件,称作因素。通常情况下固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素 水平:或称为处理,能影响试验指标的因素,通常人为地给予控制、分组,在统计学上,统称其为因子的水平基本要求 进行不同处理的实验单元间,要有相同的系统 要有明确的试验目的、恰当的指标 要挑选因子,适当确定水平。使试验范围尽可能大一点,试验范围太小的缺点是不容易获得比已有条件有显著改善的结果。每一个因素的水平个数最好适当多一些,水平的间隔大小和生产控制精度是密切相关的
6、。同时,因素和水平的含意可以是广义的 处理实验数据要能配上相应的数理统计方法,以达到预期的试验目的因素的主效应和因素间的交互效应 各因素的水平所对应的目标值称为主效应,各个因素除了对目标值有独立的影响外,还可能共同对目标值产生作用,即交互作用。交互作用通常表现为因素的乘积对指标的影响,其系数为正称为正交互作用,其系数为负称为负交互作用。 试验设计方法的发展过程 全面试验法 将每一个因素的不同水平组合做同样数目的试验。一般说m个因子n个水平的全面试验需要做nm次试验。当因素的个数不多,每个因数的水平数也不多时,用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因素较多,
7、水平数较大时,全面试验要求的试验数目可能非常大,虽然最后能够早出最好的搭配方案,但费时费工,往往不可能实现,因此除了一些比较简单的情况外,一般不进行全面试验 简单对比法 又称孤立因素法,是将因子中只变化一个,其余的固定,然后逐步地得到好的搭配的方法。这种方法一般也能得到一定的效果,而且比全面试验的次数少,但也有缺点,就是对待各因子和水平不是均等的。并且先固定那些因子,后变化那些因子,都会影响试验结果,因此最后的结果是不是最好的,还不能充分肯定 随机试验法 完全随机试验法:是一种最基本的试验设计,即各因素的水平完全随机分配 随机区试验法:在划分区间后,用随机数字表或抽签法来确定顺序的试验设计方案
8、拉丁方试验法 将一定数的文字排成正方形,每个文字在各行各列都出现一次而且只出现一次,这样的方格称为拉丁方。第一行与第一列相同的顺序排列的拉丁方称为标准型拉丁方。对于因子数多于3的实验,实验数将随着因子数的增加而快速地增加,采用拉丁方试验法,可以大大减少实验数。组成拉丁方区的必要条件是,在拉丁方区内行数等于列数等于水平数。拉丁方是供不存在交互作用的因子的实验设计用的。拉丁方设计的主要目的是研究单因素不同水平对实验结果的影响。 拉丁方举例 3*3拉丁方 A B C B C A C A B 4*4拉丁方 A B C D B A D C C D A B D C B A正交拉丁方法 正交拉丁方是指两个或
9、两个阶数相同的拉丁方之间呈正交关系而言的 正交拉丁方试验一般在5*5,7*7,8*8中进行 正交拉丁方的个数不超过拉丁方字母的个数减1 对于6*6的拉丁方,则不存在正交拉丁方法, 拉丁方或正交拉丁方试验,可用随机法安排试验正交试验设计正交试验设计及其数据分析正交试验设计 正交试验设计方法,就是利用数理统计学与正交性原理,从大量的试验点挑选适量的具有代表性、典型性的点,应用“正交表”合理安排试验的一种科学的试验设计方法。 统计学家将正交设计通过一系列表格来实现,这些表格叫做正交表,记为Lt(me),其中L表示正交表,t表示总共做t次试验,m表示每个因素都有m个水平,e表示表中有e列,最多可以安排
10、e个因素。常用正交表 二水平正交表:L4(23),L8(27),L16(215),L32(231) 三水平正交表:L9(34),L27(313) 四水平正交表:L16(45) 五水平正交表:L25(56) 混合水平的表:L8(424),L12(2331),L16(4423),L16(4326),L16(4229),L16(41212),L18(8128),L18(2137)正交表L9(34) No. 1 2 3 4 1 1 1 1 1 2 1 2 2 2 3 1 3 3 3 4 2 1 2 3 5 2 2 3 1 6 2 3 1 2 7 3 1 3 2 8 3 2 1 3 9 3 3 2 1正
11、交设计的特征 正交设计是利用数学上的正交性确定的设计方法,本质上具有“均匀分散、整齐可比”的特点。具体表现为: 水平均匀性:每个因子和因子的每个水平都是均匀分配的 搭配的均匀性:每个因子的各个水平出现的次数都是相同的,任何两个因子的搭配也都以相同的次数出现 正交试验点的分布正交试验过程 就是在确定指标、因子和水平后,用正交表安排试验方案。它主要要求解决三个方面的问题 分析因子与指标的关系,即当因子变化时,指标是怎样变化。找出这种变化的规律,可以利用它能动地指导生产 分析因子影响指标的主次,即分析哪个因子是影响指标的主要因素,哪些是次要因素。找出主要影响因素常常是生产中关键问题之一 寻找好的生产
12、工艺,即找到每个因子各取什么水平,会得到最好的指标。也就是选出最优方案,这是生产中最需要解决的问题用正交表安排试验的步骤 根据因子数和水平数以及试验条件的限制,选择合适的正交表 将各因子放到表头的各列中 将各因子的水平安排到相应的表格中 形成试验方案 正交试验设计的评价 正交试验设计缺点在于它只适合于水平数不多的试验。通常情况每个因子有q个水平,用正交表安排试验,至少要作q2次试验,当q较多时,q2非常大,很多情况无法进行试验 正交试验设计只考虑全局平衡,只得到可能的优化方向 直观分析 利用正交表进行试验设计并分析结果一般有两种方法,即直观分析与方差分析。 直观分析就是通过计算将各个因子、水平
13、对试验结果质量指标影响的大小,用图形表示出来,通过直观分析,综合比较,以确定最优化试验方案的方法。 直观分析的目的 因子与指标的变化规律,从k1,k2,k3与因子的关系图来考察 因子影响指标的主次顺序,从极差R来考察,R越大,影响越大 选顶最优方案,看各个因子中哪些水平的平均指标最高,来获得最优方案 以实验验证最优方案 正交试验设计直观分析例题 研究温度、压力、配比及时间四个因子对某种材料质量指标的影响:温度取430、450、4700C,压力取10、20、30kg,配比取3%、5%、7%,时间取1、2、3小时,质量指标越大越好设计试验v 根据因子和水平数选用可以安排四因子、三水平的正交表L9(
14、34) v 将温度、压力、时间和配比随机安排在正交表的各个列上 v 安排各因素的水平v 得到试验方案 试验试验号号 列列号号 A(温度)(温度) 1 B(压力)(压力) 2 C(配比)(配比) 3 D(时间)(时间) 4 试验方案试验方案 质量指标质量指标 1 1 1 1 1 A1B1C1D1 22 2 1 2 2 2 A1B2C2D2 52 3 1 3 3 3 A1B3C3D3 43 4 2 1 2 3 A2B1C2D3 58 5 2 2 3 1 A2B2C3D1 61 6 2 3 1 2 A2B3C1D2 61 7 3 1 3 2 A3B1C3D2 55 8 3 2 1 3 A3B2C1D
15、3 70 9 3 3 2 1 A3B3C2D1 64 K1 117 135 153 147 K2 180 183 174 168 K3 189 168 159 171 总和总和 486 k1 39 45 51 49 k2 60 61 58 56 k3 63 56 53 57 总平均总平均 54 R 24 16 7 8 直观分析对各个因子的每个水平所对应的质量指标求和得到K1, K2, K3在每一列中计算的K1, K2, K3平均值k1, k2, k3 在每一列中计算极差,即用每一列的k1, k2, k3中最大者减去最小者所得到的值,记为R用每一个因子的k值对该因子的水平作图,观察各个因子与指标
16、的变化规律 分析结果 由极差R决定因子影响指标的主次顺序:温度压力时间配比 选择最优方案:由各个因子中平均指标最高的水平组合而成试验方案: A3B2C2D3 实验验证优选方案 正交试验设计程序流程 程序说明 开始 控制读入数据 读入因子数、水平数、试验数、指标数 数组定维 读入正交设计因子、水平数字信息和指标信息 计算并打印K值 选择最大K值和最小K值 计算并打印因子极差R 打印直观分析图 结束多指标试验设计的分析方法 在实际问题中,用来衡量试验效果的指标往往不止一个,而是多个,这类试验叫做多指标试验,进行多指标试验设计的分析方法有综合评分法和综合平衡法: 综合评分法:是将多指标化为一个评分指
17、标来进行直观分析的方法 综合平衡法是先分别将各个指标按单指标进行计算和分析,再将各指标的分析结果进行综合平衡,以得到“最优”试验方案 综合评分法和综合平衡法所得到的结论,一般是一致的,在实际应用中综合评分法用得较多,因为计算上比较方便综合评分法的程序设计 程序说明 开始 控制读入数据 读入因子数、水平数、试验数、指标数 数组定维 读入正交设计因子、水平数字信息和指标信息 综合评分 计算并打印k值和K值 选择最大K值和最小K值 计算并打印因子极差R 打印直观分析图 结束综合平衡法的程序设计 开始 程序说明 数据控制 进入循环 进行每个单指标的直观分析并打印相应图形 结束注 意 有些试验中有的因子
18、可以取较多的水平,但是也有的因子受条件的限制,不能多选水平,这就遇到水平数不同的情况。解决不同水平数问题的方法:可以直接用不同水平混合型的正交表;也可以采用拟水平方法,即将水平一律补齐为相同水平再加以解决。 对于因子间有相互作用,即存在交互作用的正交试验设计,采用专门的有交互作用的正交表。交互作用放在哪一列上,由二列间交互作用表决定。 方差分析 直观分析方法,其优点是简单、直观、计算量较小。但是,直观分析不能给出误差大小的估计,也就不能知道结果的精度。方差分析可以弥补直观分析的不足之处。 在一批实验数据中,数据的算术平均值代表了数据的平均水平,反映了数据的集中性;而数据的方差,反映了数据的波动
19、性,即数据的分散性,方差大小表明数据变化的显著程度,而数据变化的显著程度,又反映了因素对指标影响的大小。 T8钢淬火试验(四因素二水平) 其中A和B有交互作用,而且需要考虑其误差,测试淬火硬度,硬度越大越好。 正交表的选择 共计考虑7个因素,每个因素有两个水平,因此选用L8(27)进行试验设计。首先进行表头设计正交试验设计、实验结果与方差分析计算过程 表中Ti=mi-(T/8)(i=1,2) 以A因素为例,令硬度值分别为Y1, Y2, Y3, Y4, Y5, Y6, Y7, Y8,则 IA=Y1+Y2+Y3+Y4, IIA=Y5+Y6+Y7+Y8 T= Y1+Y2+Y3+Y4+ Y5+Y6+Y
20、7+Y8 SA=4(IA/4)-(T/8)2+(I IA /4)-(T/8)2 =4 (IA 2+I IA 2)/16-T(IA +I IA)/16+T2/32 =4 (IA 2+I IA 2)/16- T2/32 = (IA 2+I IA 2)/4 T2/8 即: S = (I2+II2)/4 T2/8 由此计算出: SA=121/8, SB=81/8, SA*B=361/8, SC=81/8, SD=81/8, SE= 9/8 + 25/8 =34/8 因素对指标影响 用F检验法检验各个因素对指标影响的显著性: F = (各因素方差/因素方差的自由度):(误差方差/误差方差自由度) 即:
21、F = (S/f) / (Se/fe) 由此计算结果如下表: 分析结果 查表可以得到F检验值:F0.25(1,2)=2.57, F0.05(1,2)=18.51, F0.01(1,2)=98.5 F值大的因素对指标的影响大,F值小的因素对指标的影响小。由此可以得到,C和A*B对硬度指标的影响较显著,A和B、D的影响依次减小。 筛选最优方案:C是最显著因素,先选C,C列的m2m1,故此选C2方案;A*B也是显著因素,A*B的m2m1,选二水平得到A、B的搭配A1B2或A2B1,A比B重要,先选A,A的m1m2,故选定A1B2;D不显著,可以选D2,因此最优方案是A1B2 C2D2 。 方差分析的
22、程序流程 程序说明 开始 控制读入数据 J=P:Yes or No 读入Ai,Bi,Ci,Di和指标Yi(I=1,M) 计算指标加和Y0=Y/O 计算各因子对指标的影响K(I,J)(I=1,2;J=1,N) 计算H(I,J)=K(I,J)*K(I,J); U(I,J)=K(I,J)/(O/M) T(I,J)=U(I,J)-Y0 计算S(J)=H(I,J)+H(I,J)/N-Y(0)*Y(0)/O 误差E=S(5)+S(6) 计算各因子F值,并对显著性因子,打印“*”标记 结束均匀试验设计均匀设计的缘起 所有的试验设计方法本质上就是在试验的范围内给出挑选代表点的方法。正交设计是根据正交性准则来挑
23、选代表点,使得这些点能反映试验范围内各因素和试验指标间的关系。正交设计在挑选代表点时有两个特点:均匀分散,整齐可比。均匀分散时试验点有代表性;整齐可比便于试验数据的分析。为了保证整齐可比的特点,正交设计至少要求做q2次试验。若要减少试验的数目,只有去掉整齐可比的要求。均匀设计就是只考虑试验点在试验范围内均匀散布的一种试验设计方法。均匀设计表每一个均匀设计表都有一个代号Un(qs)或Un*(qs),其中“U”表示均匀设计,“n”表示要做n次试验,q表示每个因素有q个水平,s表示该表有s列;U的右上角加“*”和不加“*”代表两种不同类型的均匀设计表,通常加“*”的均匀设计表有更好的均匀性,应优先选
24、用。但是不加“*”的均匀设计表表能安排更多的因素,所以当因素数s较大,且超过加“*”的均匀设计表的使用范围时,可使用不加“*”的均匀设计表每一个均匀设计表都附有一个使用表,它指示我们如何从均匀设计表中选用适当的列,以及由这些列所组成的试验方案的均匀度。使用表最后一列D表示刻划均匀度的偏差 (discrepancy),偏差值越小,表示均匀度越好 均匀设计的特征均匀设计有其独特的布点方式,其特点表现在: 每个因素的每个水平做一次且只做一次试验 任何两个因素的试验点点在平面的格子上,每行每列有且仅有一个试验点 均匀设计表的任何两列组成的试验方案一般并不等价,因此每个均匀设计表必须有一个使用表 当因素
25、的水平数增加时,试验数按水平数的增加量在增加 均匀设计实验结果需要应用回归分析方法来处理,由于没有正交性,不能使用直观分析或方差分析性质(1)和(2)反映了试验安排的均衡性,即对各因素,每个因素的每个水平一视同仁;均匀设计表U6*(64) 及其使用表 均匀设计表U7(74)及其使用表 均匀设计表U7*(74)及其使用表 均匀设计举例 在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比(A)、吡啶量(B)和反应时间(C)三个因素,它们各取了7个水平如下: A: 1.0, 1.4, 1.8, 2.2, 2.6, 3.0, 3.4 B(ml):10, 13, 16, 19, 22, 25, 28
26、 C(h): 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 试验方案的确定 根据3个因素和7个水平,我们可以选取均匀设计表U7*(74)或U7(74),由它们的使用表可以查到,当s=3时,两个表的偏差分别为0.2132和0.3721,故应当选用U7*(74) 来安排试验,其试验方案列于下表。该方案是将A、B、C分别放在U7*(74)表的后3列而获得的。 试验方案试验数据分析 回归分析拟合出指标与各个因素的关系式Y=f(x1, x2, , xn)Y=a1*x1+a2*x2+anxn 通过关系式揭示指标与各个因素之间的定性关系或定量关系:系数的大小决定因素对指标影响的大小,系
27、数的正负决定因素对指标影响的趋势 非线性关系式表征交互作用影响或非线性因素的影响 最优工艺条件的确定:用各种最优化算法求关系式的极值;用微积分算法求极值;条件有限时可以用网格求极值正交设计与均匀设计的比较 正交设计和均匀设计是目前最流行的两种试验设计的方法,它们各有所长,互相补充,给使用者提供了更多的选择 正交设计具有正交性,如果试验按它设计,可以估计出因素的主效应,有时也能估计出它们的交互效应 均匀设计是非正交设计,它不可能估计出方差分析模型中的主效应和交互效应,但是它可以估计出回归模型中因素的主效应和交互效应进一步的比较 正交设计用于水平数不高的试验,因为它的试验数至少是水平数的平方;均匀
28、设计适合于多因素多水平试验 均匀设计提供的均匀设计表在选用时有较多的灵活性均匀设计的试验次数随水平数呈连续性增加,正交设计呈跳跃性增加 正交设计的数据分析程式简单,直观分析可以给出试验指标随每个因素的水平变化的规律;均匀设计的数据处理要用回归分析来处理,计算复杂,必须有计算机的帮助,试验数相同时的偏差的比较水平数相同时偏差的比较偏差相近时试验次数的比较数据特征与实验数据的取舍 有效数字 实验数据有效位数的确定的正确作法是所取位数除末一位数字为测量时的可疑数或估计数外,其余各位数字都是准确可靠的,通常末一位可疑数字上下可以有一个单位的误差,这样的数字称作有效数字。 舍入误差 舍入误差是人为的引入
29、误差,引入一种人为的误差总是希望它在多次实践中的均值基本上等于零才好。古典的“四舍五入”法则并不是具有所期望的性质。其舍入误差的期望值等于第n+1位单位的二分之一,此乃其结症所在。为了适应生产与科学技术工作的需要,国家数学修约规则规定了“四舍六入五单双”的法则:四舍六入五考虑,五后非零必进一;五后皆零视奇偶,五前为偶应舍去,五前为奇则进一。 有效数字的确定方法 在加减计算中,各数所保留的小数点后的位数,应与所给各数中小数点后位数最少的相同 在乘除法计算中,应以有效数字最少的或百分误差最大的数字为准,对其它各数值按上述取舍规则处理后,再进行乘除运算,所得积或商的精确度也不应该大于相乘、除各数值中
30、精确度最小的数字的精确度 在对数计算中,真数与对数的有效位数相同 在计算均值时,若为四个或多于四个数平均时,则平均数的有效位数可增加一位 对常数、e及、等的有效数字位数,可以根据需要任意确定 界限数值不得修约 数据的表示方法 实验数据是实验信息与结果的记录,要准确、简明、形象地表示出来,通常可以采用列表、作图和经验公式三种方法来表示 列表法 列表法的优点在于,简单易作,简明紧凑,便于比较。一般常用的有统计式、定性式、定量式及函数式,后两种用的较多。实验数据列表时应当注意: 表的名称与项目要简明,必要时可在表名下或下加附注说明数据来源,编列的表号应写在表名之前,表中的项目应包括名称及单位,一般应
31、采用符号表示之,表中主项代表自变量,负项代表因变量 数字的写法应注意整齐统一、正确 有效数字应当取舍适当 自变量应取整数或其它较方便的数值,按递增或递减的顺序排列 如果实验数据的自变量与因变量都不够规则,不便应用列表法 作图法 作图法优点在于,形象简明,便于直观比较。作图法的坐标有直角坐标法、单对数坐标、双对数坐标、三角坐标、极坐标及立体坐标等,最常用的是直角坐标。 作图法应当注意: 横坐标代表自变量,纵坐标代表因变量,坐标分度应使坐标纸的最小分格相应于实验数据的精确度,应尽量将变数加以变换,使所得图形为直线或近似直线 用实验数据描点时,应能表示出实验数据的误差范围,同一坐标纸内描绘几条曲线时
32、,不同曲线的描点应用不同画法予以区别 根据各描点作曲线时,如数据过少不足以确定自变量和因变量之间关系时,最好将各点用直线连接,如果描点足够多,描出光滑连续曲线,不必通过所有各点,特别是两端的描点,但是应使曲线尽可能地与所有各点相接近,并使两边的点数及点与曲线的距离乘积的总和近于相等。 经验公式表示法 经验公式表示法是用一个方程式来表示实验数据或实验数据曲线: 经验公式的选择一般没有简便的方法可获得一个理想的公式,通常是根据解析几何原理和经验来推测公式应有的形式; 经验公式中常数的求法:经验公式中常数的求法有图解法、选点法、平均法、最小二乘法等多种方法 数字特征的计算与检验 数据是实验的信息,是
33、事物内在规律性的外部表现。研究、处理数据是为了认识事物的内在规律,以促进科学研究和指导生产。 事物的本质,现象的内在规律,往往隐藏在大量的数据之中。因此,对数据做科学的整理与分析,去粗存精,去伪存真,方能得到由表及里的科学认识 位置特征参数的计算 实验数据的位置特征参数是用来描述实验数据的平均位置与特定位置的,其中常用的有算术平均值、均方根均值、计权均值、中位值、几何平均值等 算术平均值 算术平均值一般用表示,是实验数据x1,x2,xn的代数和除以样本量N,即用来表示总体的平均水平 常常同一观测值在同一测量过程中出现多次。如果观测的实验数据xi,重复出现vi次,则vi即为 niinixNxxx
34、xNx1211)(1xnvxxii均方根均值 均方根均值简称均方根值,用下式表示 如果观测值xi重复出现频率为vi时,则 nxnxxxxini )(2222221nxii)(2计权均值 又称加权均值,对同一物理量用不同方法或设备,或由不同人员进行测量,在计算均值时常对可靠的数值给以比较大的比重(),所得平均值称作计权均值(加权均值),即 其中1,2,n为给予各观测值的相应比重,称作权数。权数不能任意给定,必须考虑各有关因素,权衡该观测值的可靠程度,予以恰当的处理 iiinnniixxxxxW3212211几何平均值 几何平均值是将n个观测值联乘后并开n次方所得的数值,即 如果以对数形式表示,则
35、 平均值类型的选择主要取决于一组观测值的分布类型 nniinnigxxxxxx 121nxxigloglog平均值的计算方法 平均值的计算方法有直接算法、递推算法和二次均值算法三种,以算术平均值为例 直接算法 nxxnii1平均值的计算方法 递推算法 二次均值算法 )(11111111iiiiiiiiixxixixxx ixixiixiixxNxx)(1)1()1(离散特征参数的计算 样本的离散特征参数是用来描述数据的分散程度,常用的离散特征参数有极差、标准差、标准均差及变异系数等 极差 极差(L)是一个最简单的离散特征参数,它是样本中数据的最大值(Xmax)与最小值(Xmin)之差 L=Xm
36、ax-Xmin 由于极差L是由个别的实验数据所决定的,未能充分利用数据提供的信息,其代表性较差 方差(s2)与标准差 方差 标准差 对于有限个数的样本,应以代替较为合适,即 iiNiixxNxxNs22122)(1)(1iixxNs2)(1iixxNs22)(11标准均差和变异系数 标准均差 变异系数 方差、标准均差及变异系数都是以均值为中心的离散特征参数,尤其以方差的计算与应用最为普遍 )2)(1(211NiisxxNNMxsC离散特征参数的算法 离散特征参数的算法主要有直接算法、递推算法和移去均值算法,以方差为例 直接算法 递推算法,令 和 ,则 移去均值算法 式中 用二次均值法求出 ii
37、xxNs22)(100 x020siixxNs22)(1inixxNs22)(1nx分布特征参数的计算 分布特征参数是用作描述实验数据的概率密度函数f(x)图形特征的,常用的有偏度系数(G1)与峰度系数(G2) 标准偏度系数 通常用标准偏度系数(G1),作为分布不对称的检验 按照G1取值符号的不同,可分为负偏度分布、对称分布及正偏度分布。标准偏度系数G1的直观意义如下图 NiisxxNG131)(61峰度系数 G2作为分布特征的另一重要参数,描述概率密度函数f(x)图形顶峰的凸平度。按照G2取值符号的不同,可以看出G2=0时为标准正态分布。G20时,顶端的凸度大,当G20时,顶峰的凸度小 Ni
38、isxxNNG1423124相关特征参数的计算 通常计算相关特征参数,用意描述实验数据相互之间或实验数据Xi与实验编号i之间可能存在的相关关系 线性时关系数的计算 如果把实验数据Xi的下标编号i视为实验观测进行的相对时间,从而分析Xi与相对实验时间i之间的关系。为研究实验数据Xi有无随时间i改变的系统误差与趋势性变化的存在,提供定量依据 Rxt数值的大小,表示了实验数据Xi与时间i之间可能存在的线形关系的强弱 21121NisxxNRiixt线性相关系数的计算 R(j)为总体相关系数(j)的估计值。总体相关系数(J)作为实验数据各次实验之间相关性的一个定量测度,若(J)=0时,表示各次实验之间
39、相互独立;若(J) 0 时,表示实验数据间存在的线性相关关系的强弱。就是说相关系数(J)给出了由Xi线性预报Xi+j的可能性大小。R(J)给出了(J)的渐近无偏估计值 其中j=1,2,3,k kN jNijiisxxsxxjNjR11)(异常数据的剔除 在一批实验数据中,如果混杂有异常数据,则必然会歪曲实验结果。因此,必须正确地剔除异常数据(或称作坏值)。另一方面,由于在特定条件下进行实验量测的随机波动,致使测量数据有一定的分散性。如果人为的丢掉一些误差较大的,但不属于异常的数据,这样会造成虚假的高精度 异常数据的判别与剔除方法 人们对异常数据的判别与剔除,往往采用两种方法: 物理判别法:在实
40、验过程中,人们根据常识或经验,判别由于震动、误读、等原因造成的坏值,随时发现,随时剔除 统计判别法:给定一置信概率,并确定一个置信限,凡超过此限制的误差,就认为它不属于随机误差范围,系属异常数据,应予剔除 如何利用计算机对实验数据进行检查、判别、统计推断,指出实验数据中的可疑点,剔除异常数据,这是实验数据中的一项重要任务,至今仍然未得到很好解决 拉依达(Pauta)准则 如果实验数据的总体x是正态分布的,则有 其中,和分别表示正态总体的数学期望和标准差。因此,在实验数据中出现大于+3或小于-3数据点的概率是很小的。根据上式,对于大于+3或小于-3的实验数据,作为异常数据予以剔除 003. 03
41、xP拉依达(Pauta)准则 对于实验数据 x1, x2, xn ,算出均值、残差Vi和标准差 (i=1,2,n) 若某个测量值xd的残差vd(1dn)满足下式 3 作为极限误差,则认为xd是异常数据应予以剔除 iixNx1xxvii nxxnvniiii22211)(113dv肖维勒(Chauvenl)准则 若某个测量值xd的残差vd(1dn)满足下式 xd被判定为异常数据,应予以剔除。其中n由下表查出 另外还有格拉布斯(Grubbs)准则、狄克逊(Dixon)准则、t检验准则(罗马诺夫斯基准则)等经验准则 ndv漏失数据的弥补 经过试验设计,进行方差分析的数据都是通过精心安排获得的,有时不
42、幸因试验做坏了或丢失了某些数据,而又无法重做时,弥补数据的方法通常有两种: 当试验有重复并且每一处理至少有一个数据没有丢失时,丢失的数据可以用未丢失的数据的平均值代替 如果试验无法重复,则可用计算离差平方和的方法来弥补 举 例 题 解 对应于处理A2B1和A4B2丢失的数据,分别记作a与b,令 总离差平方和 组间离差平方和 剩余离差平方和Le为 Le=LT-LA-LB 21 .18431baccbaLT2222222222223 . 04 . 12 . 15 . 10 . 29 . 10 . 20 . 23 . 25 . 3cbaLA22227.17.49.38.731cbaLB2224.58
43、.59.641题 解 对a和b进行估计,应使得Le最小,故此需要Le对a和b的偏导为0,即 化简得到:6a+b=18.2 a+6b=6.1 解方程得到: a=2.95, b=0.53 用a,b弥补 A2B1处理和A4B2处理的漏失数据。值得注意的是,这种情形中误差的自由度减少,会降低各种检验的灵敏度 0aLe0bLe0)1 .18(61)9 .6(21)9 .3(322baaaaaLe0)1.18(61)8.5(21)7.1(322babbbbLe实验数据的误差分析 实验数据中的误差 在整理试验数据时,首先应该对原始数据的可靠性进行客观的评定。任何实验中都或多或少地存在一定的误差。误差是随机变
44、量,服从正态分布,不管采用多么精确的仪器都无法避免误差。评定实验数据的误差,分析实验数据中误差的来源,找出造成误差的主要因素,可以针对性地准备实验方案,减少实验误差,提高实验精度。 绝对误差 数量的测定值(近似值)与真(实)值(准确值)之差,称为此测定值的误差。测定值用x 表示,真值用X表示,其绝对误差为x: x-x X x+x 通常以最大绝对误差来表示绝对误差: x- x-x X x+x x+ 任何量的绝对误差和最大绝对误差都是名数,其单位与实验数据的单位相同。 相对误差 绝对误差与所测量的值相比较,得到相对误差x,通常也是用最大相对误差来表示相对误差Ex: x = (x/ X) 100%
45、Ex = ( / x) 100% 相对误差是不名数,与所测量的量的因次无关。 系统误差 系统误差亦称常差,它在反复测定的情况下保持同一数值与同一符号,单纯增加测定的次数是无法减少这种误差的影响的,这种误差也不可能用实验误差的一般数学理论加以计算,如果事先不知道修正值,可能在一系列测量中形成这种误差。系统误差决定实验的准确度。偶然误差 偶然误差是任何实验中都有的,它不能从实验中消除,但是服从统计规律(概率理论)。偶然误差在反复测定时,表现为大小、符号上各不相同,可以说是无意引入的随机误差。偶然误差可以通过数学处理被发现并且予以定量,实验数据的精确度主要取决于偶然误差。 偶然误差的特征 正误差与负
46、误差绝对值相等时,出现的概率也相等 在一定的测定条件中,偶然误差的绝对值不超过某一限度 绝对值小的误差比绝对值大的误差在测定中出现的概率大 随着同一个量的等精度测定次数的增加,偶然误差的算术平均值将越来越趋近于零 实验误差产生的原因 实验误差的大小首先取决于选择的研究方案,不同的方案有不同的误差 实验设备和仪器的精密程度 实验过程与所拟订的理想制度的偏差 过失误差误差的表示方法 常见的误差表示法除绝对误差和相对误差外,还有范围误差、算术平均误差、均方误差和或然误差等四种表示方法 范围误差:一组测定值中最高值与最低值之差,以此说明误差变化的范围。范围误差的最大缺点是显示不出与测量次数的关系,而测
47、量次数却与真值的近似程度密切相关 算术平均误差 n 为测定次数,di为测定值与平均值之偏差。算术平均误差的缺点是,无法表达出各次测量实验数据之间彼此符合的程度 ndnxxiin均方误差 称标准误差,当测定次数n 为无穷大时 在有限次测定中 均方误差是最常用的一种表示精确度的方法,它不但与一组测定值中每一个数据有关,而且对其中较大误差或较小误差敏感性很强,能较明显地反映出较大的个别误差。实验越精确,其标准误差越小 ndi212ndi或然误差 也称概差,常用表示,它所代表的意义是在一组测定值中若不计正负号,误差大于的测定值与误差小于的测定值将各占测定次数的50%,也就是说,在一组测定值中误差落在+
48、和-之间的测定次数占总测定次数的一半。它与均方误差的关系是 =0.6745 真值与平均值 实验误差是难于避免的,因此真值是无法测量得到的。在控制系统误差的条件下,只有通过增加实验次数,可以减少偶然误差,获得真值的近似值。换言之,真值是指测定次数无限多时求得的平均值,当测定次数有限时,其平均值近似于真值,成为最佳近似值。通常使用的平均值有算术平均值、加权平均值、对数平均值、均方根平均值、几何平均值和调和平均值等。平均值类型的选择主要决定于实验数据的分布类型 算术平均值 如果测定值的分布服从正态分布,算术平均值即为一组等精度测量中的最佳值或最可信赖值 nxnxxxxin 21加权平均值 对同一物理
49、量用不同的方法测定,或由熟练程度不同的研究人员测定,计算平均值时常希望对比较可靠的数据予以突出,即将其权适当加大,这种平均值则称为加权平均值 iiinnnxxxxx2112211数学期望 将权理解为测定值xi在很大的测量总数n中出现的频率,如果代之以概率Pi,则有 或者 此时的加权平均值等于它的数学期望x0 iinnxPxPxPxPx22110 xxMx均方根平均值 n个正的或负的变量x1, x2, ,xn,其均方根均值定义为 nxnxxxxin 222221均几何平均值 几何平均值是将n个正的量x1, x2, ,xn连乘再开n次所求得的值,定义如下 或用对数表示为 当对一组测定值xi取对数后
50、所得的图形的分布曲线更加对称时,常用几何平均值 nnxxxx21几nxxilglg几对数平均值 在实验数据分布曲线具有对数特征的情况下,表征平均值的量需要采用对数平均值。两个量x1、x2 的对数平均值为 变量的对数平均值总小于算术平均值,如果变量相差甚微时,可以用算术平均值代替对数平均值,而引起的误差不大 2121211lnlnln2xxxxxxxxx对调和平均值 如果量H的倒数等于量x1, x2, ,xn的倒数的算术平均值,即 则H称为n个正量的调和平均值。调和平均值常用在需要牵涉到与一些量的倒数有关的场合。其值常小于几何平均值和算术平均值 nxxxHn111121 nxxxnH11121
51、近似值及其在简单运算中的误差 在整理数据的任何运算中,由于原始数据只是真值的近似值,显然,计算结果亦将是具有一定误差的近似值。而且原始数据中的误差越大,则计算结果越不精确。如果原始数据中的误差为已知时,则计算结果的误差亦可定量求出。但是,计算结果不能提高数据的准确度。 估计计算结果的知识是重要的,因为有了这种知识,不仅使我们能估计出计算结果的准确度,而且常可以简化计算,以及确定从手册中所查出数据应取的位数,从而使计算结果的误差不超过规定的限度。 和的误差 对于一系列实验数据 其和为 则有 相对误差为 或者写为 由此可见,+必介于各项相对误差中最大值与最小值之间 111xxX222xxXnnnx
52、xXxxXnXXXX 21nxxxx 21nxxxx 21nnxxxxxx 2121nxnxxxxxxxx 2121差的误差 差的误差几乎与和式相同,设 x=x1-x2 此时相对误差为 需要注意避免x1、x2相差较小时的相对误差 xxX21XXX21xxx2121xxxx乘积的误差 设 则 对照 有 相对误差为 11111xxxX22221xxxX2211212122112122112121111xxxxxxxxxxxxxxxxxxxxXXxxX221121xxxxxxx21221121xxxxxxxx商的误差 设 取商后得到 所以 相对误差 凡是连乘连除所得结果的相对误差,近似地等于各个数的
53、相对差之和。因此,乘法与除法的运算进行得越多,则计算结果的相对误差越大。几十次乘除后,其结果的有效数字位数比原始数据中位数最少的还要少一位到两位 11111xxxX22221xxxX2211212122112122211121111xxxxxxxxxxxxxxxxxxxxXX222112221121xxxxxxxxxxxx212211xxxx幂的误差 设 则其乘幂应为 依二次项定理展开,即 如果取其前两项,则有 相对误差为 绝对误差为 或者 xxxxxX11nnnnxX1 32! 321! 211xxxnnnnnnnnxXxnnnxX1xpnnxpxnxxnxxnp1根的误差 设决定 的误差,
54、由二项式展开,取一次近似,得到: 相对误差为 绝对误差为 或者 因为幂升高急剧降低结果的准确度,因此,对在进一步计算中幂次升高的量,在测定中就应该特别注意。相反,要开方的量,在测定时可取较小的准确度 nnnxxxX1111xnnnxX1111xn1xxnxn 111xnxnx11误差理论的基本问题 误差理论中除了直接测定量的误差问题,常常需要解决的是间接测定值,即函数的误差理论,设有函数 以dx1表示x1的绝对误差,dx2 表示 x2的绝对误差, ,则可以得到函数误差的一般式 或者 函数误差理论有三个基本课题:正问题(直接问题)、反问题和决定最有利的测定条件 nxxxfy,.,21nndxxd
55、xxdxxfdyy,.,2211nnnxxxfdxxdxxdxxfdy,.,.,212211误差理论的正问题 正问题就是函数关系以及自变量误差均为已知,求函数误差的问题,分述如下: 对于一元函数,设 y=f(x) , 则 或 亦即 将函数展成泰勒级数: 若取前两项,则得: 即 故相对误差为 绝对误差为xxfyydxxfdyy xfxxfy ! 3!2! 13 2 xxfxxfxxfxfxxf xxfxfxxf dxxfdydxxfy或 xfddxxfdxxfxfyyylnlndxxfy二元函数的正问题设 y=f(x1,x2) 则 展成泰勒级数 取前两项得到: 最大绝对误差 最大相对误差 221
56、1,dxxdxxfdyy2221112121,dxxxxfdxxxxfxxfdyy 222221221212122121212,2,! 21dxxxxfdxdxxxxxfdxxxxf2221112121,dxxxxfdxxxxfxxfdyy2221121max,dxxxxfxxxfdy21max,lnxxfdy常见函数的正问题 设x、u、w为测定值,a、b、c为常数,则在下列函数中可用上式求相对误差,并估计配合得最不利的情况 (1) 两边取对数,得到 lny=lna+lnx+lnw-lnu 微分得到 相对误差为 uaxwy uduwdwxdxydyydlnuuwwxxyy常见函数的正问题 (2
57、) lny=alnx+blnw+clnu (3) y=xu lny=ulnx cbauwxy uducwdwbxdxaydyydlnuucwdwbxxayyuduxxdxuydyydlnlnuuxxxuyyln常见函数的正问题 (4) y=x+u lny=ln(x+u) (5) y=x-u lny=ln(x-u) (6) y=eax lny=ax (7) y=abx lny=bxlna uxdudxyyydlnuxuxyyuxdudxydyydlnuxuxyyadxydyydlnxayyadxbydyydlnlnxabyyln常见函数的正问题 (8) y=lgx y=0.43429lnx ln
58、y=ln(0.43429lnx)=ln0.43429+ln(lnx) 常用对数的绝对误差接近于该数相对误差的一半 (9) y=sinx lny=lnsinx 其它函数,依次类推 ydxxydyyd143429. 0lndxxxydln1lnxxy43429.0ctgxdxxxdxydyydsincoslnxctgxyy多元函数的正问题 对于多元函数,设 y=f(x1,x2,xn),用数学归纳法即可知,绝对误差为 相对误差 将以上两式中的微分符号 d换成差分符号,改写成差分式 nnnnndxxxxxfdxxxxxfdxxxxxfdy,2122211121 nnnydxxyydxxyydxxyyx
59、xxfdydy111,ln221121误差理论的反问题 反问题就是如何根据函数给定的误差,来确定自变量误差的问题。此时已知条件是函数关系和函数误差。实际上,此类问题计算的结果往往可以回答:按照一定的研究方案进行实验时,应该怎样选取测定仪器的精密度的问题。与正问题不同的是,此类问题并非什么函数都能顺利解决的。从基本关系式出发 现在dy是已知的,又由前述知其绝对误差为 相对误差为 由此可以看出,即使dy为已知,仍然无法得知dxi之值,因为它可以有无穷多个值与之项对应 nndxxdxxdxxfdyy,.,2211inndfdxxfdxxfdxxfdyy.2211niiinnyfdxxffdxxffd
60、xxffdxxf12211.误差等传播原则 一种实际可行的方案是假设各项对总误差dy的影响相同 ,根据这个假设,问题就变为确定的了,即认为下式成立 或者 由此得出 其次按等传播原则,其相对误差亦可同理得出 通常还需注意,在间接测定值(指一般函数)中并不全由直接测定值所组成,有时还包括若干常量,如 等,其绝对误差可以任意选定。待定出绝对误差以后,再决定应取数字的位数,从而保证函数误差在给定的范围以内 ndydydydyn.21ndydxxfdxxfdxxfnn.221111xfndydx22xfndydxnnxfndydxnyxxxxn.321例题 已知某气体的容积可按下式计算V=V0(1+aT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024正式的抵押借款合同书
- 买车挂别人名下协议书 合同范本3篇
- 二零二四年度文化艺术品交易平台合作合同3篇
- 汽车租赁合同完整版
- 全新商铺买卖合同电子版下载3篇
- 2024年度二手房屋贷款合同
- 医用耗材购销合同完整版
- 全新空气能安装安装合同下载
- 专升本合同模板
- 版权合同及购买协议
- 高中音乐人音版音乐《音乐鉴赏》新音乐初放单元教学设计
- 燃气公司技术档案管理制度
- 企业全域会员运营整合解决方案
- 生产车间员工绩效考核评分标准说明表
- 《现代汉语》(增订6版)笔记和课后习题(含考研真题)详解
- 初中生物北师大七年级上册生物体的结构细胞通过分裂而增殖
- 新药的非临床药效学研究和评价
- 解读进一步退两步ppt
- DB11T 2096-2023城市轨道交通工程盾构法施工技术规程
- 超星尔雅学习通《军事理论(上海财经大学版)》章节测试答案
- 医学心理学(广东药科大学)智慧树知到答案章节测试2023年
评论
0/150
提交评论