试验设计与数据分析-数理统计多媒体教学软件_第1页
试验设计与数据分析-数理统计多媒体教学软件_第2页
试验设计与数据分析-数理统计多媒体教学软件_第3页
试验设计与数据分析-数理统计多媒体教学软件_第4页
试验设计与数据分析-数理统计多媒体教学软件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验设计与数据分析shanxi university 2021年2月修订 版本4.0终了HOW WE TEACH IS ALSO WHAT WE TEACH, HOW WE LEARN IS ALSO WHAT WE LEARN.我们教育的方式本身也是我们教育的内容; 我们学习的方式本身也是我们学习的内容。课程引见学时40,学分2考核方式:课堂参与:15% 小组作业:35% 期末考试:50%学习情况考评表目 录第一章 绪论第二章 常用统计分布第三章 参数估计第四章 假设检验第五章 方差分析第六章 回归分析第七章 实验设计第八章 非参数统计分析第九章 主成分分析和因子分析

2、第十章 科技绘图第十一章 常用统计软件第一章 绪论1.0 引言 1.1 根本概念 1.2 真值、根本单位和规范参考物质 1.3 有效数字及其计算规那么1.4 异常数据的处置欢迎他步入数理统计的宽广天空1.0 引言科学实验的根本过程调研选题搜集文献提出假设实验设计进展实验数据分析得出结论科学研讨过程中,误差是客观存在的。任何一种研讨分析的结果,都必然带有不确定度,我们需求对本人实验研讨的数据进展处置,判别其最能够的值是多少,其可靠性或置信度又如何?数理统计方法就是处置数据的一种科学的方法。在实验任务中,很多要素都会影响实验的结果。如何安排这些多要素的实验,以求用较少的实验次数,获得比较多的信息和

3、正确的结论?实验设计方法可以协助我们合理地设计和安排实验。在仪器分析中,我们丈量的是仪器所显示的信号电讯号,光讯号,频率信号等,而我们欲求的那么是物质的含量或浓度,在这些讯号和含量之间,该当用怎样的数学关系或图形把它们的关系表达出来?回归分析和相关分析就是研讨随机景象中变量之间关系的数据分析方法。在实践任务中往往由于试样来源困难、太贵或量太大,以及破坏性实验等客观条件的限制,不能对全部试样进展测试,只好根据对试样有限次测定值来推断整体的真实性。而数理统计方法的引入,有效的提高了分析测试任务的质量与效率,因此日益遭到分析任务者的注重。应该强调的是:数理统计方法虽然是一种良好的数学工具,它可以指点

4、科学实验,但它不能替代严厉、严密的科学实验。只需在可靠的实验根底上,它才干发扬作用。因此,那种以为只需对数据进展统计处置,实验本身就可以马马虎虎的想法完全错误的。1.1 一些根本概念 准确度和精细度反复性和再现性误差和偏向系统误差、随机误差和不确定度平均值和中位数方差和规范偏向 检测限与定量限准确度和精细度准确度实验值和真值之间相符的程度。精细度或称精度各实验值彼此之间相符的程度。精细度是保证准确度的先决条件,没有好的精细度就不能够有好的准确度,但良好的精细度并不一定有好的准确度。 准确度和精细度反复性和再现性反复性由一个分析者,在一个给定的实验室中,用一套给定的仪器,在短时期内,对某物理量进

5、展反复定量丈量所得的结果。也称为室内精细度。再现性由不同实验室的不同分析者和仪器,共同对一个物理量进展定量丈量的结果。也称为室间精细度。误差和偏向误差丈量值和真值的差数 = x - 。偏向丈量值和平均值的差数。也叫离差。 d = x - 总体与样本我们所研讨对象的某特性值的全体,叫做总体,又叫母体;其中的每个单元叫做个体。对分析化学来讲,在指定条件下,作无限次丈量所得的无限多的数据的集合,就叫做总体;其中每个数据就是一个个体。自总体中随机抽出的一组丈量值,称为样本,又叫子样。样本中所含个体丈量值的数目,叫做样本容量,即样本的大小。 总体这个企业员工的月平均收入是多少?信息由样本信息作为总体信息

6、估计值从总体中抽取一小部分样本系统误差 系统误差总是存在于一系列同样的或类似的丈量中,因此它是不能用任何取平均值的方法消除的。 系统误差是由于某些比较确定的缘由所引起的,它对分析结果的影响比较固定,即系统误差的正或负,通常是固定的,其大小也有一定的规律性。反复丈量多次,不能消除系统误差。只需找出产生系统误差的缘由,测定它的大小,然后加以校正,才干消除系统误差对丈量准确度的影响。系统误差随机误差随机误差是由于无法控制的要素所呵斥的,随机误差是随机变量,它的值或大或小,它的符号有正有负,所以单个地看,随机误差是没有规律的。象随机误差这样一类随机变量是服从统计规律的,因此我们可以用数理统计的方法处置

7、它们。随机误差不确定度在实践分析测试中,随机误差和系统误差通常都有能够同时存在于测试数据中,在最终结果中应予以合并思索,这种合并估计称作为不确定度(uncertainty) 。过失误差过失误差是一种显然与现实不符的误差,没有一定的规律,它主要是由于实验人员大意大意呵斥的,如读数错误、记录错误或操作失误等。所以只需实验者加强任务责任心,过失误差是完全可以防止的。平均值算术平均值河程度均深度 1.6M, 士兵平均身高 1.7M数据分析中,平均值的分析比较非常重要,但假设不能正确的运用,仅仅运用平均值会让我们犯错.平均温度20度 普通以为,丈量次数n、样本平均值 和样本规范偏向s,是表达丈量结果的三

8、个要素。四分位差 这三个分割点的数值就称为四分位数。其中第二个四分位数就是中位数。 四分位差就是第三个四分位数与第一个四分位数之差。用公式表示,即:把一个变量数列分为四等分,构成三个分割点,四分位差的计算差方和Q丈量值对平均值的偏向的平方的加和,叫差方和。 自在度在统计推断中经常会碰到自在度这一 概念,不少人对这一概念不好了解。假设我们有10个数,而且他知道了均值和其中的9个数的值,那么他就可以推出第10个数。让10个人挑选10支不同颜色的铅笔,只需9人有自在挑选的能够,由于当这9人都挑好之后,他别无选择!因此这个问题的自在度为9。自在度(degree of freedom),是指可以自在取值

9、的数据的个数。 数据离散程度的测度 一批统计数据相对它的均值而言,这些数据的离散程度如何? 数据动摇的统计量通常有三种:样本方差与样本规范差数据动摇的统计量极差相对规范偏向极差R一组数据中最大值与最小值之差,叫极差。又叫全距、量距或范围。方差方差(variance)是丈量值在其总体均值周围分布情况的一种量度,方差表征随机变量分布的离散程度。 总体方差的定义是:丈量值对总体均值的误差的平方的统计平均,记作: 总体方差方差越大,丈量值在其总体均值左右分布得越宽,越不集中。样本方差只作过有限次丈量的样本方差,通常用s2表示。s2是丈量值对样本均值的偏向的平方的平均,而且在求平均时,运用自在度f=n-

10、1作为分母, 规范偏向 方差的平方根的正值,叫规范偏向,或规范差。总体规范差记作样本规范差记作s,均值与规范差概念的直观了解 设有两组样本数据分别为: 2、4、6、8、10 4、5、6、7、8 把这两组数据分别标在下面的直线轴上0024681045678第一组数据的第二组数据的 由这两组数据的均值和规范差,结合上面的图形,我们可以直观地看到这两组数据均以6为中心,但前面5个数的离散程度要大于后面5个数的离散程度。第一组数的规范差是3.16,第二组数的规范差1.58。这个例子让我们更直观地领会到规范差以及均值的意义。相对规范偏向相对规范偏向(relative standard deviation

11、, RSD)是规范偏向与平均值的比值,表示偏向值与平均值的相对大小。有时也用百分数表示。在某些场所也把相对偏向叫做变异系数(coefficient of variation)。 用CV或 表示。企业名称平均劳动生产率甲120008006.67乙60005008.33运用:某两企业工人的劳动消费率资料如下:作用:在不同总体对比分析中,不能直接比较不同总体之间的规范偏向,而只能采用相对规范偏向。计算公式:检测限一种分析物质的检测限或检出限(limit of detection, LOD)可表达为:可以给出与“空白或“背景信号有“显著差别的仪器呼应信号(y)的被测物的浓度。目前分析任务者较为认同的定

12、义为:产生一个等于空白均值信号(yb)加上空白规范偏向(sb)的3倍的呼应信号的被测物质的浓度,即:LOD= yb + 3sb通常把yb+6sb叫做保证检出限。定量限定量限(limit of quantification,LOQ)为:LOQ= yb + k sb 当最大允许规范偏向为5%,那么k=20;当最大允许规范偏向为10%,那么k=10 可以进展多次空白测定而获得yb和sb 在采用校正曲线法进展测定时,可以直接从回归直线来获得yb 和 sb 。回归直线的截距可作为yb的估计值,即空白信号。可采用sy/x取代sb。数据根本分析的软件实现StatBasic StatisticsDisplay

13、 Descriptive Statistics Store Descriptive Statistics 根本输出结果1Display Descriptive Statistics 在绘图窗口的输出分布图箱形图置信区间根本输出结果2Display Descriptive Statistics 程序输出窗口Store Descriptive Statistics 在任务表中的结果输出关于身高数据的统计量分析1.2 真值,根本单位和规范参考物质 任何丈量都带有误差,所以丈量不能获真值,只能逐渐逼近真值。 我们知道真值有三类: 实际真值; 商定真值; 相对真值;如三角形内角之和等于180,就是实际真

14、值;由国际计量大会定义的单位就是商定真值;规范参考物质的证书上所给出的数值那么是相对真值。国际单位制SI的根本单位 由国际计量大会决议商定的国际单位制SI的 根本单位有七个:1. 长度单位米m 米是光在真空中,在1/299792458秒的时间间隔内运转间隔的长度1983年。2. 质量单位千克kg 千克等于国际千克原器的质量1989年。3. 时间单位秒s 秒等于铯133Cs133原子基态的两个超精细能级之间跃迁的辐射周期的9192631770倍的继续时间1967年。电流强度单位安培A 安培是一恒定电流强度,假设坚持在真空内相距1米的、两无限长的、圆截面极小的、平行直导线内,此电流在这两导线之间每

15、米长度上产生的力等到于210-7牛顿N1948年。 热力学温度单位开尔文K 热力学温度单位开尔文是水三相点的热力学温度的1/273.161967年。 物质的量的单位摩尔mol 摩尔是一物系的物质的量,该物系中所包含的构造粒子数与0.012千克kg碳12(C12)的原子数相等。在运用摩尔时应指明构造粒子,它可以是原子、分子、离子、电子以及其它粒子,或是这些粒子的特定组合体1971年。 光强度单位坎德拉(cd) 坎德拉为一光源在给定方向的发光强度,该光源发出频率为5401012赫(Hz)的单色辐射,其辐射强度沿此方向为1/683瓦W每球面度1979年。规范参考物质 规范参考物质通常指的是由公认的权

16、威机构出卖的,带有证书的物质,它的一种或多种特性已被确定,可以用来校准丈量安装或验证丈量方法。在我国,通常把规范物质叫作规范试样或标样。 规范参考物质应具备以下条件:1 经公以为权威的机构鉴定,并给予证书;2 具有良好特性,如具有很好的均匀性和稳定性等;3 具有充任丈量规范的准确度程度,它的准确度至少要高于实践丈量的3倍;4 能制备出一定的数量,在全国范围内满足方法验证、仪器校准、质量控制等方面的需求。规范参考物质是由很多分析任务者,用不同方法仔细分析过的。用原理上根本不同的方法,得到根本上一样的值,而各种不同的方法几乎不会有一样的系统误差,因此证书上给出的这些数值通常在一定范围内是准确的,可

17、以当作相对真值对待。 除了规范物质以外,人们也常运用任务规范或“管理样。任务规范或“管理样都是二等规范物质,通常由指定的研讨机构,或消费厂,或本单位本人制备的,它所给出的参考值,在准确度上能够稍逊于规范物质,且未经权威机构认可。但因管理样比较廉价、容易获得,在组成上它能够更接近于被测试样,所以在日常的分析任务中,常用管理样。1.3 有效数字及其计算规那么有效数字就是在丈量中所能得到的有实践意义的数字(只作定位用的0除外)。1 在记录一个丈量所得的数量时,数据中只应保管一位不确定数字。有效数字是包括全部可靠数字以及一位不确定数字在内的有意义的数字的位数。2 在运算中弃去多余数字时,一概以“四舍六

18、入五留双为原那么,而不要“四舍五入。3 几个数相加减时,保管有效数字的位数,决议于绝对误差最大的一个数据。4 几个数相乘除时,以有效数字位数最少的为规范,即以相对误差最大的数据为规范,弃去过多的位数。在作乘、除、开方、乘方运算时,假设第一位有效数字等于或大于8,那么有效数字可多计一位例如:8.03毫升的有效数字可视作四位。5 在一切计算式中,常数,e的数值,以及,1/2等系数的有效数字位数,可以以为无限制,需求几位就可以取几位。6 在对数计算中,所取对数位数,应与真数的有效数字位数相等。例如,pH12.25和H+=5.610-13M; Ka=5.810-10, logKa=-9.24等,都是两

19、位有效数字。换言之,对数的有效数字位数,只计小数点以后的数字的位数,不计对数的整数部分。7 假设要舍去的不止一位数,而是几位数字,那么应该一次完成,而不应该延续修约。8 在修约规范偏向的值或其它表示不确定度的值时,修约的结果通常是使准确度的估计值变得更差一些。例如,规范偏向s=0.213单位,取两位有效数字时,要入为0.22单位,而取一位有效数字时,就要入为0.3单位。9 平均值的有效数字位数,通常和丈量值一样。当样本容量较大,在运算过程中,为减少舍入误差,平均值可比单次丈量值多保管一位数。1.4 异常数据的处置在整理实验数据时,往往会遇到这种情况,即在一组实验数据里,发现少数几个偏向特别大的

20、可疑数据,这类数据又称为异常值(exceptional data)或离群值(outlier),它们往往是由于过失误差引起的对于异常数据的取舍一定要慎重,普通处置原那么如下:在实验过程中,假设发现异常数据,应停顿实验,分析缘由,及时纠正错误;实验终了后,在分析实验结果时,如发现异常数据,那么应先找出产生差别的缘由,再对其进展取舍;在分析实验结果时,如不清楚产生异常值确实切缘由,那么应对数据进展统计处置再做取舍;对于舍去的数据,在实验报告中应注明舍去的缘由或所选用的统计方法。总之,对于可疑数据要慎重,不能恣意丢弃和修正。往往经过对可疑数据的调查,可以发现引起系统误差的缘由,进而改良实验方法,有时甚

21、至得到新实验方法的线索。检验可疑数据,常用的统计方法有拉依达(Pauta)准那么、格拉布斯(Grubbs)准那么、狄克逊(Dixon)准那么、肖维勒(Chauvenet)准那么、t检验法、F检验法等;假设数据较少,那么可重做一组数据。下面引见几种检验可疑数据的统计方法拉依达(Pauta)准那么 假设可疑数据xp与实验数据的算术平均值 的偏向的绝对值dp大于3倍或2倍的规范偏向,即: dp=xp - 3s 或2s 那么应将xp从该组实验值中剔除,至于选择3s还是2s与显著性程度有关。显著性程度表示的是检验出错的几率为,或者是检验的可信度为1。3s相当于显著程度=0.01 ,2s相当于显著程度 =0.05。拉依达准那么方法简单,无须查表,用起来方便。该检验法适用于实验次数较多或要求不高时,这是由于,当n10时,用s作界限,即使有异常数据也无法剔除;假设用s作界限,那么次以内的实验次数无法舍去异常数据。格拉布斯(Grubbs)准那么 用格拉布斯准那么检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论