平均数变异数检验_第1页
平均数变异数检验_第2页
平均数变异数检验_第3页
平均数变异数检验_第4页
平均数变异数检验_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

平均数变异数检验第1页,共85页,2023年,2月20日,星期一第一节总体与样本总体—具有共同性质的个体所组成的集团无限总体–总体有无穷多个个体构成有限总体--总体由有限个个体构成参数--由总体的全部观察值而算得的总体特征数第二章第2页,共85页,2023年,2月20日,星期一第一节总体与样本样本--从总体中抽取若干个个体的集合统计数--测定样本中的各个体而得的样本特征数,如平均数等。统计数是总体相应参数的估计值。第3页,共85页,2023年,2月20日,星期一第二节

平均数算术平均数中位数

几何平均数第二章第4页,共85页,2023年,2月20日,星期一一、算术平均数Mean

1定义

各单项测定值的总和除以测定值的个数,所得的商。2计算方法(1)如样本较小,即资料包含的观察值个数不多,可直接计算平均数。第二节

平均数第5页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其平均数。第6页,共85页,2023年,2月20日,星期一一、算术平均数

2计算方法(2)若样本较大,且已进行了分组,可采用加权法计算算术平均数,即用组中点值代表该组出现的观测值以计算平均数,其公式为第二节

平均数第7页,共85页,2023年,2月20日,星期一二、中位数(Median)

1定义

将资料内所有观察值从大到小排序,居中间位置的观察值称为中数,计作Md。

2计算方法将观察值排序,如观察值个数为奇数,则以中间的观察值为中位数;如观察值个数为偶数,则以中间二个观察值的算术平均数为中位数。

第二节

平均数第8页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其中位数。第9页,共85页,2023年,2月20日,星期一第二节

平均数三几何平均数(Geometricmean

Geomean)

1定义

如有n个观察值,其相乘积开n次方,即为几何平均数,用G代表。

2计算方法

第10页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其几何平均数。第11页,共85页,2023年,2月20日,星期一比较甲、乙两个小组(各5人)某门课成绩的优劣。甲班:50、50、50、80、20乙班:100、0、50、80、20第二章第12页,共85页,2023年,2月20日,星期一比较甲、乙两个小组(各5人)某门课成绩的优劣。甲班:100、0、50、80、20乙班:100、0、50、70、30第二章第13页,共85页,2023年,2月20日,星期一比较甲、乙两个小组(分别为5、7人)某门课成绩的优劣。甲班:100、0、50、80、20乙班:100、0、50、80、20、70、30第二章第14页,共85页,2023年,2月20日,星期一第三节

变异数

变异程度指标偏差极差方差标准差标准误变异系数第二章第15页,共85页,2023年,2月20日,星期一第三节

变异数一、偏差(Deviation)

定义:测定值与平均值之差。

特点:有单位,有正负,个数与样本个数相等

第16页,共85页,2023年,2月20日,星期一第三节

变异数二、极差(Range)

极差,又称全距,记作R,是资料中最大观察值与最小观察值的差数。R=ymax-ymin

特点:有单位,一个值(表述较偏差简单)第17页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其极差。第18页,共85页,2023年,2月20日,星期一第三节

变异数三、方差

离差平方和每一个观察值均有一个偏离平均数的度量指标—离均差,但各个离均差的总和为0,不能用来度量变异,那么可将各个离均差平方后加起来,求得离均差平方和(简称平方和)SS(sumofsquaresofdeviationsfrommean),定义如下:

样本

总体第19页,共85页,2023年,2月20日,星期一第三节

变异数由于各个样本所包含的观察值数目不同,为便于比较起见,用观察值数目来除平方和,得到平均平方和,简称均方或方差(variance)。样本均方(meansquare)用s2表示,定义为:第20页,共85页,2023年,2月20日,星期一第三节

变异数它是总体方差()的无偏估计值;此处除数为自由度(n-1)而不用n,

其中,N为有限总体所含个体数。均方和方差这两个名称常常通用,但习惯上称样本的s2为均方,总体的为方差.第21页,共85页,2023年,2月20日,星期一第三节

变异数自由度Degreeoffreedom自由度记作df,它的统计意义是指样本内独立而能自由变动的离均差个数。例如一样本为(3,4,5,6,7),平均数为5,前4个离差为-2,-1,0和1,则第5个离均差为前4个离均差之和的变号数,即-(-2)=2。一般地,样本自由度等于观察值的个数(n)减去约束条件的个数(k),即df=n-k。第22页,共85页,2023年,2月20日,星期一第三节

变异数同样,样本标准差是总体标准差的估计值。总体标准差用表示:第23页,共85页,2023年,2月20日,星期一第三节

变异数

自由度Degreeoffreedom

样本标准差不以样本容量n,而以自由度n-1作为除数,这是因为通常所掌握的是样本资料,不知μ的数值,不得不用样本平均数代替μ。与μ有差异,由算术平均数的性质可知,比小。因此,由算出的标准差将偏小。如分母用n-1代替,则可免除偏小的弊病。

第24页,共85页,2023年,2月20日,星期一第三节

变异数四、标准差Standarddeviation(SD)标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。样本资料计算标准差的公式为:

第25页,共85页,2023年,2月20日,星期一第三节

变异数在应用上,小样本一定要用自由度来估计标准差;如为大样本,因n和n-1相差微小,也可不用自由度,而直接用n作除数。但样本大小的界限没有统一规定,所以一般样本资料在估计标准差时,皆用自由度。第26页,共85页,2023年,2月20日,星期一第三节

变异数标准差的计算方法分四个步骤:先求出,再求出各个和各个,求和得,即可代入下式算得标准差。第27页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其标准差。第28页,共85页,2023年,2月20日,星期一表达方法表格中:Means±SDMeans(SD)图中:误差线:正、负、正负第29页,共85页,2023年,2月20日,星期一第三节

变异数五、标准误Standarderror(SE)

第30页,共85页,2023年,2月20日,星期一第三节

变异数Adaptedfrom:Jacobsetal.2005.Relativecontributionofinitialrootandshootmorphologyinpredictingfieldperformanceofhardwoodseedlings.NewForests,30:235-251.第31页,共85页,2023年,2月20日,星期一第三节

变异数Adaptedfrom:Boivinetal.2004.Late-seasonfertilizationofPiceamarianaseedlings:intensiveloadingandoutplantingresponseongreenhousebioassays.Ann.For.Sci.61:737-745.第32页,共85页,2023年,2月20日,星期一第三节

变异数Adaptedfrom:Rixetal.2012.PaternalandmaternaleffectsontheresponseofseedgerminationtohightemperaturesinEucalyptusglobulus.Ann.For.Sci.69:673-679.第33页,共85页,2023年,2月20日,星期一第三节

变异数Adaptedfrom:Campoetal.2007.RelationshipbetweenrootgrowthpotentialandfieldperformanceinAleppopine.Ann.For.Sci.64:541-548.第34页,共85页,2023年,2月20日,星期一第三节

变异数六、变异系数标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数。

第35页,共85页,2023年,2月20日,星期一例在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、96、127、86(单位:个)。试计算其变异系数。第36页,共85页,2023年,2月20日,星期一第三节

变异数两个小麦品种主茎高度的平均数、标准差和变异系数。第37页,共85页,2023年,2月20日,星期一第三节

变异数如只从标准差看,品种甲比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果算出变异系数,就可以相互比较,这里乙品种的变异系数为11.3%,甲品种为9.5%,可见乙品种的相对变异程度较大。第38页,共85页,2023年,2月20日,星期一第三节

变异数

但是在使用变异系数时,应该认识到它同时受标准差和平均数的影响。因此,在使用变异系数表示样本变异程度时,宜同时列举平均数和标准差,否则可能会引起误解。

第39页,共85页,2023年,2月20日,星期一第40页,共85页,2023年,2月20日,星期一第41页,共85页,2023年,2月20日,星期一将变量送入右侧文本框第42页,共85页,2023年,2月20日,星期一选择点击Continue第43页,共85页,2023年,2月20日,星期一点击OkDescriptiveStatisticsNRangeMinimumMaximumMeanStd.DeviationStatisticStatisticStatisticStatisticStatisticStd.ErrorStatistic微生物数量107486160115.308.16625.824ValidN(listwise)10第44页,共85页,2023年,2月20日,星期一练习题1:在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、96、127、86(单位:个)。利用Excel和SPSS分别计算其变异系数。第45页,共85页,2023年,2月20日,星期一练习题2:见附注课题数表“多组变量与SPSS统计值实现”(1)利用SPSS分别计算其平均值、标准差、标准误(2)利用Sigmaplot作柱形图(含标准误),要求苗高为一张图,地径为另一张图。第46页,共85页,2023年,2月20日,星期一第四节可疑数值的取舍1.可疑数据的概念

在测量中有时会出现过高或过低的测量值,这种数据称为可疑数据或逸出值(outlier)。

2.可以数值的取舍(拉依达法、肖维纳特法、格拉布斯法)拉伊达法:当试验次数较多时,可简单地用3倍标准偏差(3s)作为确定可疑数据取舍的标准。当某一测量数据()与其测量结果的算术平均值()之差大于3倍标准偏差时,用公式表示为:

则该测量数据应舍弃。先对数据排序,然后对极值按公式取舍

第二章第47页,共85页,2023年,2月20日,星期一例对一批苗木随机抽取10株测定其苗高,测定值分别为24.8、27.0、25.5、25.2、58.0、25.8、25.0、26.0、24.5、10.3cm,试用拉伊达法排除可疑值。第48页,共85页,2023年,2月20日,星期一取3σ的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-3σ与x+3σ之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可能的,应将其舍弃。第49页,共85页,2023年,2月20日,星期一第四节可疑数值剔除及正态与方差齐次性判断第二章SPSS实现1建立数表2Analyze-DescriptiveStatistics-Explore3选择分析变量Dependent、分组变量Factor及标示变量Labelcasesby4选择描述统计量Statistics5剔除可疑值、判断正态性与方差齐次性,选择Plots菜单6读取结果第50页,共85页,2023年,2月20日,星期一第五节数据标准化一、数据标准化的意义不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对统计结果产生影响。因此,在聚类分析、主成分分析之前,首先要对要素进行数据处理。第二章第51页,共85页,2023年,2月20日,星期一第五节数据标准化二、数据标准化的方法第二章标准差标准化:标准化后各要素平均值为0,标准差为1第52页,共85页,2023年,2月20日,星期一SPSS实现第53页,共85页,2023年,2月20日,星期一第54页,共85页,2023年,2月20日,星期一第55页,共85页,2023年,2月20日,星期一第56页,共85页,2023年,2月20日,星期一第五节数据标准化二、数据标准化的方法极差标准化:标准化后各要素的极大值为1,极小值为0,其余的数值均在0与1之间。第57页,共85页,2023年,2月20日,星期一第五节数据标准化二、数据标准化的方法极大值标准化第58页,共85页,2023年,2月20日,星期一例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。分别试用标准差法、极差法和最大值法对上述数据进行标准化处理。第59页,共85页,2023年,2月20日,星期一第六节

数据转化

第二章为什么进行数据转化参数统计分析方法对资料有一定的要求,如t检验和方差分析要求样本来自正态分布总体,并且方差齐同;直线相关(回归)分析要求两变量间呈直线关系。但实际工作中并非所有的统计资料都能满足参数统计分析方法的条件;对于不能满足条件的资料,则不能直接应用参数统计分析方法,否则有可能导致错误的结论。第60页,共85页,2023年,2月20日,星期一数据转换的常用方法对数变换(transformationoflogarithm)将原始数据X取对数,以其对数值作为分析变量对数变换的用途①使服从对数正态分布的资料正态化;②使方差不齐且各组的接近的资料达到方差齐的要求;③使曲线直线化,常用于曲线拟合。第61页,共85页,2023年,2月20日,星期一数据转换的常用方法平方根变换(squareroottransformation)将原始数据X的平方根作为分析变量平方根变换的用途:①使服从Poisson分布的计数资料,或轻度偏态资料正态化;②使方差不齐且各样本的方差与均数间呈正相关的资料达到方差齐的要求。第62页,共85页,2023年,2月20日,星期一数据转换的常用方法平方根反正弦变换(arcsinetrasformationofsquareroot)将原始数据X的平方根反正弦作为分析变量平方根反正弦变换的用途:使总体率较小(<30%)或总体率较大(>70%)的二项分布资料达到正态或方差齐的要求。三角函数转换有范围限制,在-1到+1范围之内的数值才能进行转换。如成活率、浓度(小数)、相对生长率(小数)第63页,共85页,2023年,2月20日,星期一SPSS如何实现数据转化

第二章对数Transform——Compute过程目标变量框(Traget)取要转换后生成的新变量名字表达式框(NumericExpress)中如下设置:对数:LN(原始变量名)点击OK完成平方根Transform——Compute过程目标变量框(Traget)取要转换后生成的新变量名字表达式框(NumericExpress)中如下设置:对数:SQRT(原始变量名)点击OK完成平方根反正弦Transform——Compute过程目标变量框(Traget)取要转换后生成的新变量名字表达式框(NumericExpress)中如下设置:反正弦:ARSIN(SQRT(原始变量名))点击OK完成第64页,共85页,2023年,2月20日,星期一举例第65页,共85页,2023年,2月20日,星期一应用Therelativegrowthrate(RGR)foreachmethodwascalculatedfromthefollowingexpression.RGR=[ln(M2)-ln(M1)]/(t2-t1)whereln(M2)andln(M1)denotethemeanln-transformedplantdrymassattimet1andt2,respectively.González-RodríguezV,Navarro-CerrilloRM,andVillarR.2011.ArtificialregenerationwithQuercusilexL.andQuercussuberL.bydirectseedingandplantinginsouthernSpain.AnnalsofForestScience,68:637-646.第66页,共85页,2023年,2月20日,星期一描述DatawereanalyzedstatisticallyusingSPSSv.18(SPSSInc.,Chicago,IL,USA).TheexplorefunctionofSPSSwasusedtoexaminedatafornormality,andpercentrootbiomassandpercentEMFcolonizationwerearcsinetransformedpriortoanalyses(Kleczewskietal.2012).KleczewskiNM,HermsDA,BonelloP.2012.Nutrientandwateravailabilityalterbelowgroundpattersofbiomassallocation,carbonpartitioning,andectomycorrhizalabundanceinBetulanigra.Tree,26:525-533.第67页,共85页,2023年,2月20日,星期一第七节

t检验第二章T检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于ClaudeGuinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。第68页,共85页,2023年,2月20日,星期一第七节

t检验第二章t检验前,首先利用explore进行判断数据是否满足正态、方差齐次性条件,满足即可进行t检验;若不满足,则需将数据进行转换,然后再次利用explore进行判断是否满足,满足后才能进行t检验;如果数据转换后实在无法条件,则进行非参数检验。非参数检验单样本检验:Wilcoxon符号秩检验两配对样本检验:Wilcoxon符号秩检验两独立样本检验:Mann-WhitneyU检验第69页,共85页,2023年,2月20日,星期一第七节

t检验第二章单总体t检验:检验一个样本平均数与一个已知的总体平均数的差异是否显著。:样本平均数:整体平均数:样本标准差:样本数量查t表判断显著性如:全国大学生英语四级平均成绩为66分,北林2010级林学1班参加英语四级考试的人数为25人,平均成绩为75分,标准差为4.82,该班级学生英语成绩是否与全国成绩存在显著差异?第70页,共85页,2023年,2月20日,星期一第七节

t检验第二章双总体t检验:相关样本(配对)、独立样本。相关样本平均数差异的显著性检验:用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。独立样本平均数的显著性检验:各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。第71页,共85页,2023年,2月20日,星期一第七节

t检验

(双总体检验---配对样本)第二章为检验人对某品牌酒饮用清晰度的影响,随机选取8个人,分别测定饮用该酒前后的清晰度,数据如下。样本12345678饮用前清晰度2325262821282725饮用后清晰度1215161113171417第72页,共85页,2023年,2月20日,星期一第七节

t检验

(双总体检验---配对样本)

配对样本t检验实际上是先求出每对观测值之差值,对差值变量求均值。检验配对变量均值之间差异是否显著。其实质检验的假设,是差值变量的均值与零均值之间差异的显著性。如果差值变量为x,差值变量的均值为,样本观测数为n,差值变量的标准差为S,差值变量的均值标准误为,配对样本t检验的t值计算公式为

第二章第73页,共85页,2023年,2月20日,星期一第七节

t检验

(双总体检验---配对样本)

SPSS实现建立数据结构:两个变量分别在不同列选择菜单[Analyze]-[Comp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论