版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章数据处理和检验第一页,共八十五页,编辑于2023年,星期四导入新课
科研的前期准备工作结束后,收集了一些有用的实验或调查数据,这些数据哪些是可靠的?哪些是可疑的?数据怎样进行分析处理?怎样进行统计检验?这些是制作图表的依据,是写论文之前必须完成的。那么,有哪些方面的内容呢?第二页,共八十五页,编辑于2023年,星期四
第五章数据处理和检验一、有效数字二、平均数和标准偏差三、可疑值的舍去四、常用检验方法1.t检验2.方差检验第三页,共八十五页,编辑于2023年,星期四一、有效数字在科学实验中,为了得到准确的测量结果,不仅要准确地测定各种数据,而是还要正确地记录和计算。所以,记录实验数据和计算结果应保留几位数字是一件很重要的事,不能随便增加或减少位数。例如用重量法测定硅酸盐中的SiO2时,若称取试样重为0.4538克,经过一系列处理后,灼烧得到SiO2沉淀重0.1374克,则其百分含量为:SiO2%=(0.1374/0.4538)×100%=30.277655354%第四页,共八十五页,编辑于2023年,星期四上述分析结果共有11位数字,从运算来讲,并无错误,但实际上用这样多位数的数字来表示上述分析结果是错误的,它没有反映客观事实,因为所用的分析方法和测量仪器不可能准确到这种程度。那么在分析实验中记录和计算时,究竟要准确到什么程度,才符合客观事实呢?这就必须了解“有效数字”的意义。第五页,共八十五页,编辑于2023年,星期四有效数字的意义及位数有效数字是指在分析工作中实际上能测量到的数字。记录数据和计算结果时究竟应该保留几位数字,须根据测定方法和使用仪器的准确程度来决定。在记录数据和计算结果时,所保留的有效数字中,只有最后一位是可疑的数字或者不定数字。第六页,共八十五页,编辑于2023年,星期四例如:坩埚重18.5734克六位有效数字标准溶液体积24.41毫升四位有效数字由于万分之一的分析天平能称准至±0.0001克,滴定管的读数能读准至±0.01毫升,故上述坩埚重应是18.5734±0.0001克,标准溶液的体积应是24.41±0.01毫升,因此这些数值的最后一位都是可疑的,这一位数字称为“不定数字”。在分析工作中应当使测定的数值,只有最后一位是可疑的。
第七页,共八十五页,编辑于2023年,星期四例如:1.0005五位有效数字0.5000;31.05%;6.023×102
四位有效数字0.0540;1.86×10-5三位有效数字0.0054;0.40%两位有效数字0.5;0.002%一位有效数字在1.0005克中的三个“0”,0.5000克中的后三个“0”,都是有效数字;在0.0054克中的“0”只起定位作用,不是有效数;在0.0540克中,前面的“0”起定位作用,最后一位“0”是有效数字。同样,这些数值的最后一位数字,都是不定数字。第八页,共八十五页,编辑于2023年,星期四数字修约规则
“四舍六入五留双”具体的做法是,当尾数≤4时将其舍去;尾数≥6时就进一位;如果尾数为5而后面的数为0时则看前方:前方为奇数就进位,前方为偶数则舍去;当“5”后面还有不是0的任何数时,都须向前进一位,无论前方是奇还是偶数。“0”则以偶数论。第九页,共八十五页,编辑于2023年,星期四有效数字修约举例0.53664→0.53660.58346→0.583518.06501→18.0710.2750→10.2816.4050→16.40
第十页,共八十五页,编辑于2023年,星期四有效数字的运算规则(一)加减法
当几个数据相加或相减时、它们的和或差的有效数字的保留,应以小数点后位效最少,即绝对误差最大的的数据为依据。例如0.0121、25.64及1.05782三数相加,若各数最后一位为可疑数字,则25.64中的4已是可疑数字。因此,三数相加后,第二位小数已属可疑,其余两个数据可按规则进行修约、整理到只保留到小数后2位。第十一页,共八十五页,编辑于2023年,星期四因此,0.0121应写成0.01;
1.05782应写成1.06;三者之和为:0.01+25.64+1.06=26.71在大量数据的运算中。为使误差不迅速积累,对参加运算的所有数据,可以多保留一位可疑数字(多保留的这一位数字叫“安全数字”)。如计算5.2727、0.075、3.7及2.12的总和时,根据上述规则,只应保留一位小数。但在运算中可以多保留一位,故5.2727应写成5.27;0.075应写成0.08;2.12应写成2.12。因此其和为:5.27+0.08+3.7+2.12=11.17然后、再根据修约规则把11.17整化成11.2。第十二页,共八十五页,编辑于2023年,星期四
(二)乘除法
几个数据相乘除时,积或商的有效数字的保留,应以其中相对误差最大的那个数,即有效数字位数最少的那个数为依据。
例如求0.0121、25.64和1.05782三数相乘之积。第一个数是三位有效数字,其相对误差最大,以此数据为依据,确定其他数据的位数,即按规则将各数都保留三位有效数字然后相乘:0.0121×25.6×1.06=0.328若是多保留一位可疑数字时,则0.0121×25.64×1.058=0.3282然后再按“四舍六入五留双”规则,将0.3282,改写成0.328。第十三页,共八十五页,编辑于2023年,星期四
有效数字的运算规则小结
1.根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位可疑数字。2.在计算结果之前,先根据运算方法确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。
第十四页,共八十五页,编辑于2023年,星期四二、平均数和标准偏差1.平均数2.标准偏差第十五页,共八十五页,编辑于2023年,星期四基本术语1.总体
研究对象的全体,总体数目N。2.样本
自总体中随机抽出一部分样品,通过样品推断总体的性质。3.样本容量
样本中所含个体的数目,n
第十六页,共八十五页,编辑于2023年,星期四平均值样本容量为n,其平均值为:第十七页,共八十五页,编辑于2023年,星期四偏差偏差d=测定值xi-平均值x平均偏差=∑(xi-x)n第十八页,共八十五页,编辑于2023年,星期四样本标准偏差
f=n-1,自由度:n个测定数据能相互独立比较的是n-1个。引入n-1是为了校正以样本平均值代替总体平均值引起的误差。第十九页,共八十五页,编辑于2023年,星期四相对标准偏差(relativestandarddeviation-RSD)
又称变异系数(coefficientofvariation-CV)
第二十页,共八十五页,编辑于2023年,星期四例1:重铬酸钾法测得中铁的百分含量为:20.03%,20.04%,20.02%,20.05%和20.06%。计算分析结果的平均值,标准偏差和相对标准偏差。第二十一页,共八十五页,编辑于2023年,星期四第二十二页,共八十五页,编辑于2023年,星期四举例1.Excel(打开excel表第五章)2.SPSS软件第二十三页,共八十五页,编辑于2023年,星期四第二十四页,共八十五页,编辑于2023年,星期四第二十五页,共八十五页,编辑于2023年,星期四第二十六页,共八十五页,编辑于2023年,星期四第二十七页,共八十五页,编辑于2023年,星期四第二十八页,共八十五页,编辑于2023年,星期四第二十九页,共八十五页,编辑于2023年,星期四第三十页,共八十五页,编辑于2023年,星期四第三十一页,共八十五页,编辑于2023年,星期四第三十二页,共八十五页,编辑于2023年,星期四第三十三页,共八十五页,编辑于2023年,星期四SPSS结果与excel计算的一样。第三十四页,共八十五页,编辑于2023年,星期四三、可疑值的取舍
在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。第三十五页,共八十五页,编辑于2023年,星期四
1.4d法根据正态分布规律,可疑数值的偏差(即|x可疑-x|)超过4d时,这一测定值出现在测定总体内的概率小于0.3%,故这一测量值通常可以舍去。第三十六页,共八十五页,编辑于2023年,星期四第三十七页,共八十五页,编辑于2023年,星期四检验步骤用4d法判断异常值的取舍的步骤:1.去掉异常值,计算其余数据的平均值x。2.计算各数据偏差d=xi-x2.计算数据的平均偏差d。d=∑di/n3.异常值与平均值进行比较:|x可疑-x|大于4d,则将可疑值舍去,否则保留。4d中的d是d。当4d法与其他检验法矛盾时,以其他法则为准。第三十八页,共八十五页,编辑于2023年,星期四例测定某药物中钴的含量如(μg/g),得结果如下:1.25,1.27,1.31,1.40。试问1.40这个数据是否应保留?解首先不计异常值1.40,求得其余数据的平均值x和平均偏差d为异常值与平均值的差的绝对值为|1.40一1.28|=0.12>4d(0.092)故1.40这一数据应舍去。第三十九页,共八十五页,编辑于2023年,星期四
2.格鲁布斯(Grubbs)法
有一组数据,从小到大排列为:
x1,x2,……,xn-1,xn
其中x1或xn可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量T进行判断。若T>Ta,n,则异常值应舍去,否则应保留。第四十页,共八十五页,编辑于2023年,星期四第四十一页,共八十五页,编辑于2023年,星期四例前一例中的实验数据,用格鲁布斯法判断时,1.40这个数据应保留否(置信度95%)?解平均值x=1.31,s=0.066
查表T0·05,4=1.46,T<T0·05,4,故1.40这个数据应该保留。
格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数x及s,故方法的准确性较好。缺点是需要计算x和s,手续稍麻烦。第四十二页,共八十五页,编辑于2023年,星期四3.
Q检验法设一组数据,从小到大排列为:x1,x2,……,xn-1,xn设x1、xn为异常值,则统计量Q为:
式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。Q值越大,说明xn离群越远。Q称为“舍弃商”。当Q计算>Q表时,异常值应舍去,否则应予保留。第四十三页,共八十五页,编辑于2023年,星期四1.25,1.27,1.31,1.40第四十四页,共八十五页,编辑于2023年,星期四三种方法比较4d法在数理统计上是不够严格的,这种方法把可疑值首先排除在外,然后进行检验,容易把原来属于有效的数据也舍弃掉,所以此法有一定局限性。Q检验法符合数理统计原理,但只适合用于一组数据中有一个可疑值的判断。Grubbs法将正态分布中两个重要参数x及S引进,方法准确度较好。三种方法以Grubbs法最合理而普遍适用。第四十五页,共八十五页,编辑于2023年,星期四四、常用的检验方法1.t-检验(T-tests):与均值相联系,比较两个样本的均值差异性,要求服从正态分布或者t分布。2.单因素方差分析:(One-wayanalysisofvariance)单因素方差检验,用于多个样本均数的显著性检验。第四十六页,共八十五页,编辑于2023年,星期四1.t检验由于研究中不可能把总体中所有的样本都进行测定,比如总体有1000个个体,我们可以选择50个组成样本,测定样本的均值来反映总体的均值。但是由于取样的问题,可能抽到一些数值较大或者较小的个体,从而使得样本的均值和总体参数的均值之间有所不同,那么有一个问题:这个样本参数均值是否能代表总体均值?均值不等的样本个体是否能代表总体呢?另外,两组样本参数的均值是来自相同的总体还是不同的总体?它们之间是否有不同?这就需要进行t检验。第四十七页,共八十五页,编辑于2023年,星期四
t检验的类型1.单一样本t检验(One-SampleTTest):检验单个变量的均值是否与给定的标准或者常数之间是否存在差异。2.独立样本t检验(IndependentSampleTTest):用于检验两组来自独立总体的样本,其独立总体的均值是否有差异。3.配对样本t检验(Paired-SampleTTest):用于检验两个相关或配对的样本是否来自具有相同均值的总体。
第四十八页,共八十五页,编辑于2023年,星期四配对样本t检验比如考查同一组人在参加一年的长跑锻炼前后的心率是否有显著差异。这里,每个人一年前的心率和一年后的心率是相关的,心率较快的人锻炼后仍相对其他人较快。所以,检验这样的成对总体的均值不能使用独立样本t检验的办法,因为独立条件不再满足。要用配对样本t检验。第四十九页,共八十五页,编辑于2023年,星期四配对样本t检验又如想知道饲料中缺乏维生素E对大鼠肝中维生素A含量有无影响,实验选择8对16只大鼠,每对大鼠一只喂给正常饲料,另一只喂给维生素E缺乏饲料。考查正常饲料组和维生素E缺乏饲料组的结果有无差异时,也需要用配对样本t检验。第五十页,共八十五页,编辑于2023年,星期四t检验中的P值
t检验中的P值就是用于判断均数差异存在大小的可能性或者概率。概率P值在0与1之间,P越接近于1,表明某事件发生的可能性越大,P越接近于0,表明某事件发生的可能性越小。习惯上将P≤0.05,或P≤0.01,成为小概率事件,表示某事件发生的可能性很小。第五十一页,共八十五页,编辑于2023年,星期四t
检验法公式平均值与标准值的比较进行t检验时,首先按下式计算出t值
若t计算>tα,f,,即P值<0.05或0.01时,说明存在显著性差异;P值>0.05时则没有显著性差异。通常以95%的置信度为检验标准,即显著性水准为5%。第五十二页,共八十五页,编辑于2023年,星期四
t检验的2种方法1.双侧检验2.单侧检验第五十三页,共八十五页,编辑于2023年,星期四双侧检验和单侧检验双侧检验:一般不知道数据的变化趋势时,默认为双侧检验。单侧检验:主要关心带方向性或趋势性的检验问题。分两种情况:一种是我们所考察的数值越大越好。例如某机构购买灯泡的使用寿命,轮胎的行驶里程数,等等。另一种是数值越小越好,例如废品率、生产成本等等。第五十四页,共八十五页,编辑于2023年,星期四双侧检验和单侧检验若对同一资料进行双侧检验也进行单侧检验时,同一资料双侧检验与单侧检验所得的结论可能相同也可能不相同。一般,双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。第五十五页,共八十五页,编辑于2023年,星期四t检验常用软件1.Excel(打开excel表第5章)2.SPSS软件各举例分析第五十六页,共八十五页,编辑于2023年,星期四第五十七页,共八十五页,编辑于2023年,星期四第五十八页,共八十五页,编辑于2023年,星期四第五十九页,共八十五页,编辑于2023年,星期四第六十页,共八十五页,编辑于2023年,星期四第六十一页,共八十五页,编辑于2023年,星期四第六十二页,共八十五页,编辑于2023年,星期四第六十三页,共八十五页,编辑于2023年,星期四第六十四页,共八十五页,编辑于2023年,星期四第六十五页,共八十五页,编辑于2023年,星期四第六十六页,共八十五页,编辑于2023年,星期四第六十七页,共八十五页,编辑于2023年,星期四2.方差分析在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响不同饲料对牲畜体重增长的效果等都可以使用方差分析方法去解决
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工产品检测代理合同模板
- 企业专用劳动合同聘用合同书
- 科技园区企业租赁合同模板
- 养老院建设项目招投标文件
- 林业开发铣刨机租赁合同
- 国有企业知识管理策略
- 环保项目内部招投标管理规定
- 木结构工程混凝土施工承包合同
- 水果公司宿舍电费管理准则
- 商业大厦铁艺施工合同
- 附录-瓦斯抽采指标计算方法
- 廉洁提醒谈话记录表 (空表)
- 一年10亿销售,细数故宫背后的营销手段
- 《急性胰腺炎诊治指南》解读急性胰腺炎外科诊治现状与进展
- 二年级上册语文全册教材分析
- 游戏综合YY频道设计模板
- 部编版《古诗三首》饮湖上初晴后雨(完美版)课件
- 《中国居民膳食指南》2023收藏版
- 【深信服】大云云计算PT2认证考试(重点)复习题库(含答案)
- 管壳式热交换器的热力计算课件
- 蛇咬伤的护理查房-课件
评论
0/150
提交评论