excel中的概率统计(非常好的资料)及高考语文试卷_第1页
excel中的概率统计(非常好的资料)及高考语文试卷_第2页
excel中的概率统计(非常好的资料)及高考语文试卷_第3页
excel中的概率统计(非常好的资料)及高考语文试卷_第4页
excel中的概率统计(非常好的资料)及高考语文试卷_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计实验Excel基本操作单元格操作单元格的选取Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示.选取单元格范围(矩形区域)可以按如下两种方式选取单元格范围.(1)先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可.(2)先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键.选取特殊单元格在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况.第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可.第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可.公式中的数值计算要输入计算公式,可先单击待输入公式的单元格,而后 键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号.提示:(1)通过先选定一个区域,再键入公式,然后按CTRL+ENTER组合键,可以在区域内的所有单元格中输入同一公式.(2)可以通过另一单元格复制公式,然后在目标区域内输入同一公式.公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的例如中将单元格B4中的数值加上25,再除以单元格D5、E5和F5中数值的和.=(B4+25)/SUM(D5:F5)公式中的语法公式语法也就是公式中元素的结构或顺序.Excel中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel从等号(=)开始,从左到右计算公式.可以通过修改公式语法来控制计算的顺序.例如,公式=5+2*3的结果为11,将2乘以3(结果是6),然后再加上5.因为Excel先计算乘法再计算加法;可以使用圆括号来改变语法,圆括号内的内容将首先被计算.公式=(5+2)*3的结果为21,即先用5加上2,再用其结果乘以3.单元格引用一个单元格中的数值或公式可以被另一个单元格引用.含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值.只要被引用单元格做了修改,包含引用公式的单元格也就随之修改.例如,公式“=B15*5”公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志.在默认状态下,Excel使用A1引用类型.这种类型用字母标志列(从A到IV,共256列),用数字标志行(从1到65536).如果要引用单元格,请顺序输入列字母和行数字.例如,D50引用了列D和行50交叉处的单元格.如果要引用单元格区域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用.下面是引用的例如.单元格引用范围引用符号在列A和行10中的单元格A10属于列A和行10到行20中的单元格区域A10:A20属于行15和列B到列E中的单元格区域B15:E15从列A行10到列E行20的矩形区域中的单元格A10:E20行5中的所有单元格5:5从行5到行10中的所有单元格5:10列H中的所有单元格H:H从列H到列J中的所有单元格H:J工作表函数Excel包含许多预定义的,或称内置的公式,它们被叫做函数.函数可以进行简单的或复杂的计算.工作表中常用的函数是“SUM”函数,它被用来对单元格区域进行加法运算.虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM”工作表函数还可以方便地计算多个单元格区域.函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=).当生成包含函数的公式时,公式选项板将会提供相关的帮助.使用公式的步骤:A.单击需要输入公式的单元格.B.如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮.C.单击“函数”下拉列表框右端的下拉箭头.D.单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.E.输入参数.F.完成输入公式后,请按ENTER键.几种常见的统计函数均值Excel计算平均数使用AVERAGE函数,其格式如下:AVERAGE(参数1,参数2,…,参数30)范例:如果要计算单元格中A1到B20元素的平均数,可用AVERAGE(A1:B20).标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差.(1)样本标准差Excel计算样本标准差采用无偏估计式,STDEV函数格式如下:STDEV(参数1,参数2,…,参数30)范例:如果要计算单元格中A1到B20元素的样本标准差,可用STDEV(A1:B20).(2)总体标准差Excel计算总体标准差采用有偏估计式STDEVP函数,其格式如下:STDEVP(参数1,参数2,…,参数30)范例:方差方差为标准差的平方,在统计上亦分样本方差与总体方差.(1)样本方差S2=Excel计算样本方差使用VAR函数,格式如下:VAR(参数1,参数2,…,参数30)如果要计算单元格中A1到B20元素的样本方差,可用VAR(A1:B20).范例:(2)总体方差S2=Excel计算总体方差使用VARP函数,格式如下:VARP(参数1,参数2,…,参数30)范例:正态分布函数Excel计算正态分布时,使用NORMDIST函数,其格式如下:NORMDIST(变量,均值,标准差,累积)其中:变量(x):为分布要计算的x值;均值(μ):分布的均值;标准差(σ):分布的标准差;累积:若为TRUE,则为分布函数;若为FALSE,则为概率密度函数.范例:已知X服从正态分布,μ=600,σ=100,求P{X≤500}.输入公式=NORMDIST(500,600,100,TRUE)得到的结果为0.158655,即P{X≤500}=0.158655.正态分布函数的反函数Excel计算正态分布函数的反函数使用NORMINV函数,格式如下:NORMINV(下侧概率,均值,标准差)范例:已知概率P=0.841345,均值μ=360,标准差σ=40,求NORMINV函数的值.输入公式=NORMINV(0.841345,360,40)得到结果为400,即P{X≤400}=0.841345.注意:(1)NORMDIST函数的反函数NORMINV用于分布函数,而非概率密度函数,请务必注意;(2)Excel提供了计算标准正态分布函数NORMSDIST(x),及标准正态分布的反函数NORMSINV(概率).范例:已知X~N(0,1),计算=P{X<2}.输入公式=NORMSDIST(2)得到0.97725,即=0.97725.范例:输入公式=NORMSINV(0.97725),得到数值2.若求临界值uα(n),则使用公式=NORMSINV(1-α).t分布Excel计算t分布的值(查表值)采用TDIST函数,格式如下:TDIST(变量,自由度,侧数)其中:变量(t):为判断分布的数值;自由度(v):以整数表明的自由度;侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.范例:设T服从t(n-1)分布,样本数为25,求P(T>1.711).已知t=1.711,n=25,采用单侧,则T分布的值:=TDIST(1.711,24,1)得到0.05,即P(T>1.711).若采用双侧,则T分布的值:=TDIST(1.711,24,2)得到0.1,即.t分布的反函数Excel使用TINV函数得到t分布的反函数,格式如下:TINV(双侧概率,自由度)范例:已知随机变量服从t(10)分布,置信度为0.05,求t(10).输入公式=TINV(,10)得到2.2281,即.若求临界值tα(n),则使用公式=TINV(2*α,n).范例:已知随机变量服从t(10)分布,置信度为0.05,求t(10).输入公式=TINV(0.1,10)得到,即t(10)=.F分布Excel采用FDIST函数计算F分布的上侧概率,格式如下:FDIST(变量,自由度1,自由度2)其中:变量(x):判断函数的变量值;自由度1():代表第1个样本的自由度;自由度2():代表第2个样本的自由度.范例:设X服从自由度=5,=15的F分布,求P(X>2.9)的值.输入公式=FDIST(2.9,5,15)得到值为0.05,相当于临界值α.F分布的反函数Excel使用FINV函数得到F分布的反函数,即临界值,格式为:FINV(上侧概率,自由度1,自由度2)范例:已知随机变量X服从F(9,9)分布,临界值αF(9,9).输入公式=FINV(0.05,9,9)得到值为,即F(9,9)=.若求单侧百分位点F(9,9),F(9,9).可使用公式=FINV(0.025,9,9)=FINV(0.975,9,9)得到两个临界值和.若求临界值Fα(n1,n2),则使用公式=FINV(α,n1,n2).卡方分布Excel使用CHIDIST函数得到卡方分布的上侧概率,其格式为:CHIDIST(数值,自由度)其中:数值(x):要判断分布的数值;自由度(v):指明自由度的数字.范例:若X服从自由度v=12的卡方分布,求P(X>5.226)的值.输入公式=CHIDIST(5.226,12)得到0.95,即=0.05.卡方分布的反函数Excel使用CHIINV函数得到卡方分布的反函数,即临界值.格式为:CHIINV(上侧概率值α,自由度n)范例:下面的公式计算卡方分布的反函数:=CHIINV(0.95,12)得到值为5.226,即=5.226.若求临界值(n),则使用公式=CHIINV(α,n).泊松分布计算泊松分布使用POISSON函数,格式如下:POISSON(变量,参数,累计)其中:变量:表示事件发生的次数;参数:泊松分布的参数值;累计:若TRUE,为泊松分布函数值;若FALSE,则为泊松分布概率分布值.范例:设X服从参数为4的泊松分布,计算P{X=6}及P{X≤6}.输入公式=POISSON(6,4,FALSE)=POISSON(6,4,TRUE)得到概率和.在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT,开平方函数SQRT,和函数SUM,等等.关于这些函数的具体用法,可以查看Excel的关于函数的说明,不再赘述.区间估计实验计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.单个正态总体均值与方差的区间估计:2已知时的置信区间置信区间为.例11.101.1379521.141.201.231.1141.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ=0.01(米).步骤:(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据.(2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:=average(b3:g5)-normsinv(1-0.5*)*/sqrt(count(b3:g5))=average(b3:g5)+normsinv(1-0.5*)*/sqrt(count(b3:g5))上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平和标准差是具体的数值而不是符号.本例中,=0.05,,上述两个公式应实际输入为=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5))=average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))计算结果为(1.148225,1.158025).2未知时的置信区间置信区间为.例2同例1,但未知.输入公式为:=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5))=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5))计算结果为(1.133695,1.172555).未知时2的置信区间:置信区间为.例3从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间(单位:s)如下:试求总体方差的0.9的置信区间(设总体为正态).操作步骤:(1)在单元格B3:C7分别输入样本数据;(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7);(3)在单元格C10中输入置信水平0.1.(4)计算样本方差:在单元格C11中输入公式=VAR(B3:C7)(5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12(7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2,count(b3:c7)-1)=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2,count(b3:c7)-1)两正态总体均值差与方差比的区间估计当12=22=2但未知时1-2的置信区间置信区间为.例4在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ-μ所在的范围.(取α=0.05)实验步骤:(1)在A2:A6输入甲组数据,在B2:B8输入乙组数据;(2)在单元格B11输入公式=AVERAGE(A2:A6),在单元格B12中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值.(3)分别在单元格C11和C12分别输入公式=VAR(A2:A6),=VAR(B2:B8),计算出两组样本的方差.(4)在单元格D11和D12分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小.(5)将显著性水平0.05输入到单元格E11中.(6)分别在单元格B13和B14输入=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/5+1/7)和=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/5+1/7)计算出置信区间的下限和上限.1和未知时方差比σ/σ的置信区间置信区间为.例5有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是S=0.5419,S=0.6065.设σ和σ分别是A、B所测量的数据总体(设为正态分布)的方差.求方差比σ/σ的置信区间.操作步骤:(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度.(2)在B4和B5利用公式输入=C2/(C3*FINV(1-D2/2,B2-1,B3-1))和=C2/(C3*FINV(D2/2,B2-1,B3-1))计算出A组和B组的方差比的置信区间上限和下限.练习题1.已知某树种的树高服从正态分布,随机抽取了该树种的60株林木组成样本.样本中各林木的树高资料如下(单位:m)22.3,21.2,19.2,16.6,23.1,23.9,24.8,26.4,26.6,24.8,23.9,23.2,23.3,21.4,19.8,18.3,20.0,21.5,18.7,22.4,26.6,试以0.95的可靠性,对于该林地上全部林木的平均高进行估计.2.从一批灯泡中随机抽取10个进行测试,测得它们的寿命(单位:100h)为:50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5.试求总体方差的0.9的置信区间(设总体为正态).3.已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量(kg)如下:第一实验区:62576560635857606058第二实验区:56595657605857555755试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产量均值之差的范围(α=0.05)假设检验实验实验内容:单个总体均值的假设检验;两个总体均值差的假设检验;两个正态总体方差齐性的假设检验;拟合优度检验.实验目的与要求:(1)理解假设检验的统计思想,掌握假设检验的计算步骤;(2)掌握运用Excel进行假设检验的方法和操作步骤;(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.单个正态总体均值μ的检验2已知时μ的U检验例1外地一良种作物,其1000m2产量(单位:kg)服从N(800,502),引入本地试种,收获时任取5块地,其1000m2产量分别是800,850,780,900,820(kg),假定引种后1000m2(1)若方差未变,本地平均产量μ与原产地的平均产量μ=800kg有无显著变化.(2)本地平均产量μ是否比原产地的平均产量μ=800kg高.(3)本地平均产量μ是否比原产地的平均产量μ=800kg低.操作步骤:(1)先建一个如下图所示的工作表:(2)计算样本均值(平均产量),在单元格D5输入公式=AVERAGE(A3:E3);(3)在单元格D6输入样本数5;(4)在单元格D8输入U检验值计算公式=(D5-800)/(50/SQRT(D6);(5)在单元格D9输入U检验的临界值=NORMSINV(0.975);(6)根据算出的数值作出推论.本例中,U的检验值小于临界值1.959961,故接受原假设,即平均产量与原产地无显著差异.(7)注:在例1中,问题(2)要计算U检验的右侧临界值:在单元格D10输入U检验的上侧临界值=NORMSINV().问题(3)要计算U检验的下侧临界值,在单元格D11输入U检验下侧的临界值=NORMSINV(0.05).2未知时的t检验例2某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:250 238265242248258255236245261254 256246242247256258259262263该引擎制造商宣称引擎的平均速度高于250km操作步骤:(1)先建如图所示的工作表:(2)计算样本均值:在单元格D8输入公式=AVERAGE(A3:E6);(3)计算标准差:在单元格D9输入公式=STDEV(A3:E6);(4)在单元格D10输入样本数20.(5)在单元格D11输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10)),得到结果;(6)在单元格D12输入t检验上侧临界值计算公式=TINV(0.05,D10-1).欲检验假设H0:μ=250;H:μ>250.已知t统计量的自由度为(n-1)=20-1=19,拒绝域为t>t.由上面计算得到t检验统计量的值落在接收域内,故接收原假设H0.两个正态总体参数的假设检验当12=22=2但未知时的检验在此情况下,采用t检验.例试验及观测数据同11.2中的练习题3,试判别磷肥对玉米产量有无显著影响?欲检验假设H:μ1=μ2;H:μ1>μ2.操作步骤:建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“t-检验:双样本等方差假设”.(4)选择“确定”.显示一个“t-检验:双样本等方差假设”对话框;(5)在“变量1的区域”输入A2:A11.(6)在“变量2的区域”输入B2:B11.(7)在“输出区域”输入D1,表示输出结果放置于D1向右方的单元格中.(8)在显著水平“α”框,输入.(9)在“假设平均差”窗口输入0.(10)选择“确定”,计算结果如D1:F14显示.得到t值为,“t单尾临界”值为1.734063.由于,所以拒绝原假设,接收备择假设,即认为使用磷肥对提高玉米产量有显著影响.σ与σ已知时的U检验例3某班20人进行了数学测验,第1组和第2组测验结果如下:第1组:918876989492908710069第2组:90918092929498788691已知两组的总体方差分别是57与53,取α,可否认为两组学生的成绩有差异?操作步骤:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“z-检验:双样本平均差检验”;(4)选择“确定”,显示一个“z-检验:双样本平均差检验”对话框;(5)在“变量1的区域”输入A2:A11;(6)在“变量2的区域”输入B2:B11;(7)在“输出区域”输入D1;(8)在显著水平“α”框,输入;(9)在“假设平均差”窗口输入0;(10)在“变量1的方差”窗口输入57;(11)在“变量2的方差”窗口输入53;(12)选择“确定”,得到结果如图所示.计算结果得到06(即u统计量的值),其绝对值小于“z双尾临界”值9961,故接收原假设,表示无充分证据表明两组学生数学测验成绩有差异.两个正态总体的方差齐性的F检验例5羊毛在处理前与后分别抽样分析其含脂率如下:处理前:0.190.180.210.300.410.120.27处理后:问处理前后含脂率的标准差是否有显著差异?欲检验假设H:σ=σ;H:σ≠σ.操作步骤如下:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“F-检验双样本方差”. (4)选择“确定”,显示一个“F-检验:双样本方差”对话框;(5)在“变量1的区域”输入A2:A8.(6)在“变量2的区域”输入B2:B9.(7)在显著水平“α”框,输入.(8)在“输出区域”框输入D1.(9)选择“确定”,得到结果如图所示.计算出F值5049小于“F单尾临界”值5.118579,且P(F<=f)=0.144119>0.025,故接收原假设,表示无理由疑心两总体方差相等.拟合优度检验拟合优度检验使用统计量,(11.1)Excel在计算拟合优度的卡方检验方面,提供了CHITEST函数,其格式如下:CHITEST(实测频数区域,理论频数区域)得到临界概率,其中为上述统计量(1.11)的值.在应用中,可根据临界概率,利用函数CHIINV确定统计量的值.即CHIINV例6设总体X中抽取120个样本观察值,经计算整理得样本均值209,样本方差s=及下表.试检验X是否服从正态分布(α=).组号小区间频数123456789(-∞,198](198,201](210,204](204,207]207,210](210,213](213,216](216,219](219,+∞)67142023221486∑120操作步骤:(1)输入基本数据建立如下图所示工作表,输入区间(A2:A10),端点值(B2:B10),实测频数的值(C2:C10).区间可以不输入,输入是为了更清晰;端点值为区间右端点的值,当右端点是+∞时,为了便于处理,可输入一个很大的数(本例取10000)代替+∞.(2)计算理论频数由极大似然估计得参数,假设X~N(),则P{a<X≤b}=F(b)-F(a),因此,事件{a<X≤b}发生的理论频数为n(F(b)-F(a)).将计算的理论频数值放入D列.在D2输入=120*(NORMDIST(198,209,6.539877675,TRUE))在D3输入=120*(NORMDIST(B3,209,6.539877675,TRUE)-NORMDIST(B2,209,6.539877675,TRUE))类似地,可算出D4至D10的值.应用小技巧:计算D4到D10值的简便方法:选定D3单元格,单击鼠标右键弹出快捷菜单从中选择“复制”,然后选定单元格D4到D10,单击鼠标右键弹出快捷菜单从中选择"粘贴",即可得到D4到D10的值.(3)计算卡方统计量的值本例中,估计参数2个,分组数k=9.①使用CHITEST函数计算临界概率.在单元格E12输入:=CHITEST(C2:C10,D2:D10),得到=0.997499.②根据临界概率,利用函数CHIINV确定统计量的值.在单元格E13输入=CHIINV(E12,8),得到统计量的值=1.104413.(4)结果分析先查出临界值:在单元格E14输入=CHIINV(0.05,6),得到.由于统计量的值小于临界值,故接受原假设,认为X服从正态分布.练习与习题1.某春小麦良种千粒重μ=34克,方差σ2=1.96,现自外地引入新品种,在8个小区上种植,得其千粒重为:,,,3,,,,,问新引入品种的千粒重与当地良种有无显著差异.2.为防止某种害虫而将一种农药施入土中,规定经三年后土壤中如有5ppm以上浓度时认为有残效,现在施药区分别抽取了10个土样(施药三年后)进行分析,它们浓度分别为:设测定值服从正态分布,问这种农药三年后是否有残效.3.设甲乙两种甜菜的含糖率分别服从N(μ1,7.5)和N(μ2,6),现从两种甜菜中分别抽取若干样品,测其含糖率分别为:甲种:24.3,17.4,23.7,20.8,21.3(%)乙种:20.2,16.9,16.7,18.2(%)问甲,乙两种甜菜含糖率的平均值有无显著变化.4.某化工原料在处理前后取样分析,测得其含脂率的数据如下:处理前:0.19,0.18,0.21,0.30,0.66,0.42,0.08,0.12,0.30,0.27.处理后:0.19,0.24,1.04,0.08,0.20,0.12,0.31,0.29,0.13,0.07.假定处理前后的含脂率都服从正态分布,且方差不变,给定显著水平α=0.05,问处理前后含脂率的均值有无显著变化.5.某农场为试验磷肥能否提高水稻收获量,在同类农场中选定面积为2的试验地若干块,试验结果,未施肥的九块地收获量为:另外八块地施了磷肥,其收获量为:试检验施肥后水稻的收获量有无显著提高.(假定水稻收获量服从正态分部).提示:先检验方差齐性.6.在一个小时内总机每分钟收到的呼唤次数统计如下:呼唤次数:0123456≥7频数:81617106210试用卡方分布检验每小时总机收到呼唤次数是否服从泊松分布.7.下面是某系高等数学的成绩:87,75,85,78,62,90,72,66,75,74,73,77,75,84,6478,90,65,90,78,57,71,48,74,72,53,69,68,74,6290,80,70,84,86,65,60,68,89,72,53,69,68,74,7365,71,68,70,85,79,43,79,80,77,88,93,68,74,51试在显著水平α=0.05小,检验这次成绩的分布是否服从正态分布.方差分析实验试验内容:单因素方差分析;双因素无重复试验的方差分析;双因素等重复试验的方差分析.试验目的与教学要求:充分理解方差分析的统计思想;充分理解平方和分解的统计思想;学会如何充分地利用试验结果的信息,对所关心的事物(因素的影响作出合理的推断.单因素方差分析例1检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.在试验单元间的试验条件一致的情况下,经过200天的饲养后,羊羔的增重(kg)数据如下表.处理重复1(对照)234123447526251505467575753695754657559试问各种处理之间有无显著差异?操作步骤:(1)输入数据,如下图所示:(2)选取“工具”—“数据分析”;(3)选定“单因素方差分析”;(4)选定“确定”,显示“单因子方差分析”对话框;(5)在“输入区域”框输入数据矩阵(首坐标):(尾坐标),如上例为“A2:D6”,其中第二行“第一组,…,第四组”(6)在“分组方式”框选定“列”;(7)打开“分类轴标记行在第一行上”复选框.若关闭,则数据输入域应为A3:D6.(8)指定显著水平α=0.05;(9)选择输出选项,本例选择“输出区域”紧接在数据区域下为:“A7”(10)选择“确定”,则得输出结果.结果分析:F03是α=的F统计量临界值,F=1.305047是F统计量的计算值,P-value=0.318=P{F>1.30505}.由于1,因此接受原假设,即无显著差异.双因素无重复试验的方差分析:例2将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个小区上,每小区的播种量相同,测得收获量如下表(单位:kg).试以显著性水平α1=0.05,α2=0.01,考察品种和地块对收获量的影响是否显著.地块品种B1B2B3B4B5A1A2A3A4操作步骤:(1)输入数据,如下图所示:(2)选取“工具”—“数据分析”,(3)选定“双因子方差分析:无重复试验”选项,(4)选定“确定”,显示“双因子方差分析:无重复试验”对话框,(5)在“输入区域”框输入A1:F5.(6)在“输出区域”输入A7(7)打开“标记”复选框.(8)指定显著水平“α”为“”或“”.(9)选择“确定”,则得输出结果从第7行起显示出来.双因素等重复试验方差分析:例3一火箭使用了四种燃料、三种推进器作射程试验,对于燃料与推进器的每一种搭配,各发射火箭两次,测得结果如下表:燃料推进器B1B2B3A16A2A3A4试检验燃料和推进器对火箭射程是否是显著影响,两因素的交互作用对火箭射程是否有显著影响.操作步骤:(1)输入数据,如下图所示:(2)选取“工具”、“数据分析……”,(3)选定“双因子方差分析:重复试验”选项,(4)选定“确定”,显示“双因子方差分析:重复试验”对话框,(5)在“输入区域”框输入A1:D9.(6)在“输出区域”输入A11.(7)在“每一样本行数”框输入“2”(8)指定显著水平“α”为“”.(9)选择“确定”,则得输出结果从第11行起显示出来.本例假设:HA:因素A对试验结果无显著影响.HB:因素B对试验结果无显著影响.HAB:交互因素AB对试验结果无显著影响.已算出:SA=261.675,MSA=87.225;SB=370.9808,MSB=185.4904;SAB=1768.693,MSAB=294.7821,误差=236.95,MSe=19.74583,总计StF值与F-crit比较可以看出,F>F-crit,对,各因素均显著,应拒绝原假设HA,HB,HAB.可以继续计算对显著水平α=的推断结果.练习与习题1.假设某医院应用克矽平治疗矽肺,治疗前、中、后期患者血液中粘蛋白含量(mg%)观察结果如下:患者编号治疗前治疗中治疗后123435675试问用克矽平治疗矽肺对降低血液中粘蛋白含量是否有作用(α=0.05)?2.下面给出了小白鼠接种不同菌型伤寒杆菌的存活日数,试问三种菌型的平均存活日数有否显著差异(α=)?菌型接种后存活日数A12,4,3,2,4,7,7,2,5,4A25,6,8,5,10,7,12,6,6A37,11,6,6,7,9,5,10,6,3,103.抽查某地区三所小学五年级男生的身高,得以下数据:小学身高(cm)第一小学128.1,134.1,133.1,,,第二小学150.3,147.9,136.8,,,第三小学140.6,143.1,144.5,,,试问该地区这三所小学五年级男生的平均身高有否显著差异(α=)?4.下面记录了某地区四个生产队在1956—1959年的667m2年份生产队产量12341956146200148151195725830328229019584154614314131959454452453415试检验:(1)各生产队间的差异是否显著?(2)逐年产量的增长是否显著(α=)?5.下面记录了三位操作工在四台不同机器上操作三天的日产量:机器操作工甲乙丙M115,15,1719,19,1616,18,21M217,17,1715,15,1519,22,22M315,17,1618,17,1618,18,18M418,20,2215,16,1717,17,17试检验:(1)操作工之间的差异是否显著?(2)机器之间的差别是否显著?(3)交互影响是否显著(α=)?回归分析实验实验内容:一元线性回归;多元线性回归;回归分析中其它函数的应用.实验目的与要求:掌握回归分析的基本原理、实验操作步骤,能够应用回归分析解决实际问题;根据实验数据,能够熟练地建立回归方程;熟练地掌握回归方程的显著性检验;熟练地掌握回归系数的显著性检验.利用Excel进行一元线性回归分析例1今收集到某地区1950~1975年的工农业总产值(X)与货运周转量(Y)的历史数据如下:X3.203.404.44.705.405.655.605.705.90Y:0.901.201.401.501.702.002.052.353.003.503.202.402.803.23.403.704.004.404.354.34试分析X与Y间的关系.操作步骤:(1)首先在Excel中建立工作表,样本X数据存放在A1:A27,其中A1存标记X;样本Y数据存放在B1:B27,其中B1存标记Y.(2)选取“工具”、“数据分析”….(3)选定“回归”.(4)选择“确定”.(5)在“输入Y区域”框输入B1:B27.(6)在“输入X区域”框输入A1:A27.(7)关闭“常数为零”复选框,表示保留截距项,使其不为0.(8)打开“标记”复选框,表示有标记行.(9)打开“置信水平”复选框,并使其值为95%.(10)在“输出区域”框,确定单元格E2.结果如图所示.其中SS为平方和、MS表示均方、df为自由度.由此我们可义看出:(1)回归方程:Y=0.6754+0.5951X;(2)F统计量的值:F=1107.942.由于P{F>1107.942}=1.34353E-21,故所建回归方程极显著.利用EXCEL进行多元线性回归分析例2今收集到历史数据如下:X1:71111171131221111101412X2:262956315255713154474066684358X3:6158869172218423981218X4:60522047332264422263412122837Y:7975103889610810075941168411511099107使试分析X1,X2,X3,X4与Y之间的关系.解首先在Excel中建立工作表,其中样本X数据输入在A2:D16;样本Y数据输入在E2:E16.(1)选取“工具”—“数据分析”;(2)选定“回归”;(3)选择“确定”;(4)在“输入Y区域”框输E2:E16;(5)在“输入X区域”框输入A2:D16;(6)关闭“常数为零”复选框,表示保留截距项,使其不为0;(7)关闭“标记”复选框;(8)打开“置信水平”复选框,并使其值为95%;(9)在“输出区域”框,确定单元格G1;结果如下表所示;由此我们可义看出:①—0.0817X4;②回归方程的显著性检验:由于F统计量值为:F=90.9964,而P{F>90.9964}=8.01843E-08,故所建回归方程是极显著的;=3\*GB3错误!未找到引用源。回归系数的显著性检验:关于X1,由于P,故X1是显著的;关于X2,由于P,故X2是显著的;关于X3,由于P,故X3是不显著的;关于X4,由于P,故X4是不显著的.练习与习题研究物体在横断面上渗透深度H(厘米)与局部能量E(每平方米厘米积上的能量)的关系,得到试验结果如下:能量E深度H能量E深度H能量E深度H414139202503150815419269368110180233013710414208261201624130试检验渗透深度H与局部能量E之间是否存在显著的线性相关关系.如果存在,求H关于E的线性回归方程.拖拉机拉杆的曳力F与拖拉机的速度V有关,测得数据如下:V(里/小时)F(斤)V(里/小时)F(斤)425540420590480610495690530680检验拖拉机顶曳力F与拖拉机速度V之间是否存在显著的线性相关关系.如果存在,求F关于V的线性回归方程.3.气体在容器中被吸引的比率Y与气体的温度X1和吸收液体的蒸汽压力X2有关,其数学模型为Y=A+B1X1+B2X2,测得试验数据为:X1X2YX1X2Y求Y关于X1、X2的二元线性回归方程.数据分析综合实验试验内容:研究B1,B2,B3三个厂家生产的果树专用复合肥的效果、土壤有机质含量对苹果产量的影响、平均产量及其波动大小等.选择密度和品种相同的12个苹果园A1,A2,…,A12进行施肥实验,施肥方式和单位面积上的施肥数量相同.观测数据(见下表)前三列为为单株产量(kg),最后一列为土壤有机质含量(%).B1(X1)B2(X2)B3(X3)因变量YA1A2A3A4A5A6A7A8A9A10A11A12实验目的与要求:通过本实验培养学生数据处理的综合能力和应用数学方法解决农业问题的初步能力.要求学生综合应用参数估计、假设检验、方差分析和回归分析等知识,进行数据处理,并根据自己掌握的农业知识进行结果分析,完成一个小论文.操作步骤:由于本实验为数据分析综合实验,故不给出具体操作步骤.请同学们充分发挥自己的科研潜力,充分利用自己的数学知识和农业科学知识,分析农业科研问题.仅给出如下提示:1.将产量数据输入到B2:D13,土壤有机质数据输入到E2:E13(这样输入数据是为了叙述方便,并非一定如此).2.给定显著性水平α(一般取α=0.05),对各施肥水平下的单株平均产量进行区间估计.3.设B1、B2和B3三个水平下的产量观测数据分别来自正态总体N(μ1,σ12)、N(μ2,σ22)和N(μ3,σ32),分别进行任意两个总体均值差的t检验和方差齐性的F检验,即检验假设H1:μ1-μ2=0;H2:μ1-μ3=0;H3:μ2-μ3=0;H4:σ1=σ2;H5:σ1=σ3;H6:σ2=σ3.4.以12个实验作为因素A的12个水平,以三种施肥方式作为因素B的3个水平,进行双因素方差分析,分析肥料和实验点对单株产量是否有显著影响.5.分别以三种施肥方式下的单株产量作为自变量X1,X2,X3,以土壤有机质含量作为因变量Y,即选择X值输入区域为C2:D13,Y值输入区域为E2:E13进行多元线性回归分析.结果表明,回归方程极显著(F=41.5806127,SignificanceF=3.16733E-05),但变量X1,X3并不显著,其中X1尤为不显著(tStat=0.079041407,P-value=0.938941048).6.剔除X1(当有多个变量不显著时,总是先剔除最不显著的变量,而且每次仅剔除一个自变量),选择X值输入区域为C2:D13(Y值输入区域仍为E2:E13),重新进行回归分析.结果表明,回归方程极显著(F=70.10901854,SignificanceF=3.25009E-06).但变量X3仍不显著(tStat=0.531040343,P-value=0.608244525).7.剔除X3,选择X值输入区域为C2:C13(Y值输入区域仍为E2:E13),再次进行回归分析,结果表明,回归方程和方程中包含的自变量(仅有X2)均极显著.

8.分析前述各项数据处理结果,以论文的格式写出完整的实验报告.在以下两题中任选一题,以论文的形式写出实验报告.1.某地区种子部门对玉米的4个新品种B1、B2、B3、B4进行产量和环境适应性实验,每个品种分别在该地区的沙壤土地(A1)、粘壤土地(A2)和中壤土地(A3)上进行3次重复实验,每200平方米上的产量(kg)数据见表11.1,试分析品种不同和土壤类型不同对产量的影响是否显著,并对如何推广这4个品种提出自己的建议.2.根据能定量描述和可搜集到实际数据的原则,经初步分析认为:某市消费人口X1(万人)、蔬菜年平均价格X2(分/kg)、瓜果年人均消费量X3(kg)、副食年人均消费量X4(kg)和粮食年人均消费量X5(kg)是影响蔬菜需求量Y(万吨)的主要因素.调查数据如.试对蔬菜需求量的影响因素进行分析.产量数据品种B1品种B2品种B3品种B4沙壤A1172177163208177183159212183183171232粘壤A2220157193163206161182172211159172167中壤A3172205188179188233195182176212184183调查数据表年份蔬菜总销量Y人口数量X1蔬菜价格X2瓜果人均销量X3副食人均销量X4粮食人均销量X51965196619674181968196919701971197219739197419751976447197719781979198050019815251982550451551983561MATLAB数理统计MATLAB基础MATLAB的意思是Matrixlaboratory,是进行科学计算的重要工具.启动MATLAB后,出现如下图所示的界面,在缺省状态,呈现3个窗口.右边的窗口(CommandWindow)为命令窗口;左边的两个窗口分别为启动平台(LaunchPad)和命令历史(Commandhistory)窗口,也可以切换到工作空间(Workspace)和当前目录浏览器窗口(CurrentDirectory).可以在命令窗口通过键盘输入要执行的命令并按回车键确认,也可以点击菜单“File”—“New”—“M-file”先建立.m文件(也称为m-文件或M-文件),在该文件中依次输入要执行命令,形成一个程序,然后执行这个程序.程序必须被储存前方可执行.可以点击菜单“Debug”—“Run”执行程序,也可以按F5键执行程序.M-文件的名字可以由英文字母a-z及A-Z,数字0-9和下划线组成,但必须以英文字母打头!否则将会产生重大错误.输入矩阵的最简单的方法是把矩阵的元素直接排列在方括号“[]”中,每行内的元素用空格或逗号分开,行与行之间用分号分开,多个空格被视为一个空格.例如输入a=[123;456;789]或a=[1,2,3;4,5,6;7,8,9]都得到输出结果a=123456789大矩阵可以分行输入,用回车键代替分号,这样的输入形式更接近我们平时使用的矩阵格式.例如a=[123456789]可以先将一个矩阵输入到Excel工作表,即先建立数据文件.然后打开“file”—“ImportData”菜单,即启动导入数据导航,按提示打开Excel工作表,将数据导入到MATLAB的工作空间中去.矩阵也称为数组.只有一行或一列的数组称为一维数组,有多个行和多个列的数组称为二维数组.一维数组x的第i个元素记为x(i),二维数组a的第i行第j列的元素记为a(i,j).MATLAB采用双精度储存变量和数值计算,但能以多种格式输出数据.例如x=[4/31.2345e–6]则在几种常见的的格式下,输出结果分别为formatshort1.33330.0000formatshorte1.3333e+0001.2345e–006formatshortg1.33331.2345e–006formatlong1.333333333333330.00000123450000formatlonge1.333333333333333e+0001.234500000000000e–006formatlongg1.333333333333331.2345e–006formatrat4/31/810045应领先执行格式命令,然后再输出数据.MATLAB的缺省格式为formatshort.要显示一个变量的内容,只需在命令窗口或程序中键入该变量的名字.例如在命令窗口依次执行a=1/3,formatlong,a这三个命令,结果如下:>>a=1/3a=>>formatlong>>aa=若最大的元素大于1000或小于,则显示short或long格式时会加上一个比例.在命令后加上分号“;”,则屏幕上不会立即显示出结果,这在运算大的数据量时十分有用,如下命令产生100*100的魔方矩阵,但并不在屏幕上显示.A=magic(100);如果一个命令很长,想另起一行接着输入命令,须要在末尾加上“...”,如:s=1–1/2+1/3–1/4+1/5–1/6+1/7...–1/8+1/9–1/10+1/11–1/12;可用who或whos来察看当前工作空间中有哪些变量.若要从工作空间中删除所有的变量,用clear也可以根据需要一次删除若干个变量,例如要从工作空间中删除x1,x2两个变量,用clearx1x2你可以将工作间保存为一个二进制的.mat文件,以备以后调用.命令savejune10将工作空间保存到文件june10.mat.也可只保存工作间中的部分变量值,例如要保存变量x,y,z到文件june10.mat,使用命令savejune10xyz重载时只需输入loadjune10要想将变量a更名为b,可使用命令b=a;clearaMATLAB支持矩阵的加法、减法、乘法、转置、求逆等各种运算.命令a'和inv(a)分别计算矩阵a的转置矩阵和逆矩阵.MATLAB的算数运算符为:+加-减*乘^幂/左除\右除对于两个标量a,b来说,a/b=b\a=a÷b,而对于两个矩阵a,b来说,a/b=a*inv(b)b\a=inv(b)*a两个同维数组相加减,等于其对应元素相加减.一个数组与一个标量相加减,则等于数组的各元素分别与这个常数相加减.用符号“./”表示两个数组的除法.若x,y是同维数组,则x./y表示x的元素分别除以y的对应元素得到的数组.z=x./y即z(i,j)=x(i,j)/y(i,j).x./y与y.\x相等,都表示x除以y,但运算是在对应元素间进行的,与矩阵的除法是不同的.矩阵的乘方用“^”符号表示,a^p的意思是a的p次方.数组的乘方用“.^”符号表示.若x=[x1,x2,…,xn],y=[y1,y2,…,yn]是同维数组,则z=x.^y=[x1^y1,x2^y2,…,xn^yn]若c是一个标量,则z=x.^c=[x1^c,x2^c,…,xn^c]可以使用help命令寻求帮助.例如,键入helpclear即可获得clear命令的帮助信息.类似地可以得到其他命令/函数的帮助信息.分布函数及数字特征的计算MATLAB提供了计算常见分布的分布函数和分位数的函数,见表11.4和表11.5.概率分布函数y=F(x)的计算函数名称函数说明调用格式binocdf二项分布B(n,p)的分布函数F(x)y=binocdf(x,n,p)poisscdf泊松分布P(λ)的分布函数F(x)y=poisscdf(x,λ)unifcdf均匀分布U[a,b]的分布函数F(x)y=unifcdf(x,a,b)expcdf指数分布E(λ)的分布函数F(x)y=expcdf(x,λ)normcdf正态分布N(μ,σ2)的分布函数F(x)y=normcdf(x,μ,σ)tcdft(n)分布的分布函数F(x)y=tcdf(x,n)fcdfF(n1,n2)分布的分布函数F(x)y=fcdf(x,n1,n2)Chi2cdfχ2(n)分布的分布函数F(x)y=chi2cdf(x,n)表11.5上侧α分位数x的计算函数名称函数说明调用格式binoinv二项分布B(n,p)的上侧α分位数x=binoinv(1-α,n,p)poissinv泊松分布P(λ)的上侧α分位数x=poissinv(1-α,λ)unifinv均匀分布U[a,b]的上侧α分位数x=unifinv(1-α,a,b)expinv指数分布E(λ)的上侧α分位数x=expinv(1-α,λ)norminv正态分布N(μ,σ2)的上侧α分位数x=norminv(1-α,μ,σ)tinvt(n)分布的上侧α分位数x=tinv(1-α,n)finvF(n1,n2)分布的上侧α分位数x=finv(1-α,n1,n2)Chi2invχ2(n)分布的上侧α分位数x=chi2inv(1-α,n)函数mean()语法:m=mean(x)若x是单个向量(可以是行向量,也可以是列向量),则返回结果m是x的均值,若x是矩阵,则返回结果m是行向量,它包含x的每列数据的均值.即若则,其中.函数var()语法:y=var(x)若x是单个向量(可以是行向量,也可以是列向量),则返回结果y是x的方差,若x是矩阵,则返回结果y是行向量,它包含x的每列数据的方差.Var(x)运用n-1进行标准化处理,其中n为数据的长度.若要运用n进行标准化,可使用var(x,1)格式.函数std()语法:y=std(x)std(x)=sqrt(var(x)),返回样本x的标准差.函数cov()语法:C=cov(x)计算协方差矩阵.若x是单个向量(可以是行向量,也可以是列向量),则返回结果C是x的方差,若x是矩阵,则返回各列数据的协方差构成的协方差矩阵.cov(x)运用n-1进行标准化处理.函数corrcoef()语法:R=corrcoef(x)返回一个相关系数矩阵R.矩阵R的元素R(i,j)与对应的协方差矩阵C=cov(x)的元素C(i,j)的关系为使用MATLAB进行参数估计,与使用Excel进行参数估计的方法相似.假设检验1.方差已知时单个正态总体均值的U检验函数:ztest()语法:h=ztest(x,m,sigma)h=ztest(x,m,sigma,alpha)[h,sig,ci,zval]=ztest(x,m,sigma,alpha,tail)U检验,以检验标准差为sigma的正态总体的均值是否等于m.即总体,样本来自总体,欲检验假设..h=ztest(x,m,sigma,alpha)给出了显著性水平控制参数alpha.[h,sig,ci,zval]=ztest(x,m,sigma,alpha,tail)可以通过制定tail的值来控制备择假设.tail的取值及意义为:tail=0表示备择假设为,即进行双侧检验;tail=表示备择假设为,即进行左边单侧检验;tail=1表示备择假设为,即进行右边单侧检验.返回值sig是标准正态分布以统计量的观测值为分位数的尾部概率,称为临界概率或显著性概率.即tail=0时;tail=时;tail=1时.其中.当sig<alpha(等价于h=1)时拒绝,否则接受.2.方差未知时单个正态总体均值的t检验函数:ttest()语法:h=ttest(x,m)h=ttest(x,m,alpha)[h,sig,ci]=ttest(x,m,alpha,tail)t.h=ztest(x,m,alpha)给出了显著性水平控制参数alpha.[h,sig,ci]=ttest(x,m,alpha,tail)可以通过制定tail的值来控制备择假设.tail的取值及意义与ztest函数一致.返回值sig是分布以统计量的观测值为分位数的临界概率,即tail=0时;tail=时;tail=1时.其中.当sig<alpha(等价于h=1)时拒绝,否则接受.3.两个正态总体均值差的t检验函数:ttest2()语法:[h,sig,ci]=ttest2(x,y)[h,sig,ci]=ttest2(x,y,alpha)[h,sig,ci]=ttest2(x,y,alpha,tail)进行两正态总体均值是否相等的t检验,使用的统计量为,各参数的含义与函数ttest一致.方差分析1.单因素方差分析函数anova1()语法:P=anova1(x)[P,table]=anova1(x)[P,table,stats]=anova1(x)P=anova1(x)比较数据x(k)中各列观测数据相应的总体均值是否相等.x中的每一列表示一个水平的n次独立的观测值.函数返回零假设成立的(临界)概率值.如果P<0.05,则拒绝,认为k个均值之间的差异显著;如果P<0.01,则认为k个均值之间的差异极显著.Anova1函数显示两幅图表,第一幅为方差分析表,其前五列与表9.4一致,第六列显示临界概率P.第二幅图表为x各列数据的盒形(box)图.如果盒形图的中心线差别很大,则对应的F值很大,相应的概率值P就小.[P,table]=anova1(x)以单元数组的形式返回方差分析表.[P,table,stats]=anova1(x)返回stats结构,利用stats结构可以接下来进行多重比较.2.双因素方差分析函数anova2()语法:P=anova2(x,reps)[P,table]=anova2(x,reps)[P,table,stats]=anova1(x,reps)P=anova2(x,reps)进行双因素方差分析.其中,数据矩阵x的结构如表9.10所示;参数reps表示重复实验的次数,缺省值为1(无重复).返回参数P是一个3维向量,包含如下3个概率值:(1)零假设HB:因素B对试验结果无显著影响成立的概率;(2)零假设HA:因素A对试验结果无显著影响成立的概率;(3)零假设HAB:因素AB对试验结果无显著影响成立的概率;参数table和stats的含义与函数anova1一致.3.多重比较函数multcompare()语法:c=multcompare(stats)c=multcompare(stats,alpha)c=multcompare(stats)利用stats结构中的信息进行多重比较,返回成对比较的结果矩阵c,也显示一个表示检验的交互式图表.c是一个5列的矩阵.例如,假设c中某一行的内容为2.00005.00001.94428.220614.4971时,表示组2的均值和组5的均值比较,均值差的估计值为8.2206,其95%的置信区间为(1.9442,14.4971).这里,置信区间中不包含0,说明在0.05的显著水平上,两个均值的差异是显著的.如果置信区间包含0,则说明在0.05的显著水平上,两个均值的差异不显著.回归分析对于多元线性回归模型:设变量的n组观测值为.记,,则的估计值为(11.2)在Matlab中,用regress函数进行多元线性回归分析,应用方法如下:语法:b=regress(y,x)[b,bint,r,rint,stats]=regress(y,x)[b,bint,r,rint,stats]=regress(y,x,alpha)b=regress(y,x),得到的维列向量b即为(11.2)式给出的回归系数的估计值.[b,bint,r,rint,stats]=regress(y,x)给出回归系数的估计值b,的95%置信区间(向量)bint,残差r以及每个残差的95%置信区间(向量)rint;向量stats给出回归的R2统计量和F以及临界概率p的值.如果的置信区间(bint的第行)不包含0,则在显著水平为时拒绝的假设,认为变量是显著的.[b,bint,r,rint,stats]=regress(y,x,alpha)给出了bint和rint的100(1-alpha)%的置信区间.附表Excel数据分析工具一览表“F-检验:双样本方差分析”此分析工具可以进行双样本F-检验,用来比较两个样本总体的方差。例如,可以对参加游泳比赛的两个队的时间记分进行F-检验,查看二者的样本方差是否不同。“t-检验:成对双样本均值分析”此分析工具及其公式可以进行成对双样本学生氏t-检验,用来确定样本均值是否不等。此t-检验并不假设两个总体的方差是相等的。当样本中出现自然配对的观察值时,可以使用此成对检验,例如对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。“t-检验:双样本等方差假设”此分析工具可以进行双样本学生氏t-检验。此t-检验先假设两个数据集的平均值相等,故也称作齐次方差t-检验。可以使用t-检验来确定两个样本均值实际上是否相等。“t-检验:双样本异方差假设”此分析工具及其公式可以进行双样本学生氏t–检验。此t-检验先假设两个数据集的方差不等,故也称作异方差t-检验。可以使用t-检验来确定两个样本均值实际上是否相等。当进行分析的样本组不同时,可使用此检验。如果某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。“z-检验:双样本均值分析”此分析工具可以进行方差已知的双样本均值z-检验。此工具用于检验两个总体均值之间存在差异的假设。例如,可以使用此检验来确定两种汽车模型性能之间的差异情况。“抽样分析”此分析工具以输入区域为总体构造总体的一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。如果确认输入区域中的数据是周期性的,还可以对一个周期中特定时间段中的数值进行采样。例如,如果输入区域包含季度销售量数据,以四为周期进行取样,将在输出区域中生成某个季度的样本。“傅立叶分析”此分析工具可以解决线性系统问题,并能通过快速傅立叶变换(FFT)分析周期性的数据。此工具也支持逆变换,即通过对变换后的数据的逆变换返回初始数据。“回归分析”此工具通过对一组观察值使用“最小二乘法”直线拟合,进行线形回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量影响的。例如,观察某个运动员的运动成绩与一系列统计因素的关系,如年龄、身高和体重等。在操作时,可以基于一组已知的体能统计数据,并辅以适当加权,对尚未进行过测试的运动员的表现作出预测。“描述统计”此分析工具用于生成对输入区域中数据的单变值分析,提供有关数据趋中性和易变性的信息。“排位和百分比排位”此分析工具可以产生一个数据列表,在其中罗列给定数据集中各个数值的大小次序排位和相应的百分比排位。用来分析数据集中各数值间的相互位置关系。“随机数发生器”此分析工具可以按照用户选定的分布类型,在工作表的特定区域中生成一系列独立随机数字。可以通过概率分布来表示主体的总体特征。例如,可以使用正态分布来表示人体身高的总体特征,或者使用双值输出的伯努利分布来表示掷币实验结果的总体特征。“相关系数”此分析工具及其公式可用于判断两组数据集(可以使用不同的度量单位)之间的关系。可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论