




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数理统计实验1 Excel 基本操作1.1单元格操作1.1.1单元格的选取Excel 启动后首先将自动选取第 A 列第 1 行的单元格即 A1( 或 a1) 作为活动格,我们 可以用键盘或鼠标来选取其它单元格用鼠标选取时,只需将鼠标移至希望选取的单元 格上并单击即可被选取的单元格将以反色显示1.1.2选取单元格范围 ( 矩形区域 )可以按如下两种方式选取单元格范围(1) 先选取范围的起始点(左上角) ,即用鼠标单击所需位置使其反色显示然后按 住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可(2) 先选取范围的起始点(左上角) ,即用鼠标单击所需位置使其反色显示然后将 鼠标指针
2、移到终点(右下角)位置,先按下 Shift 键不放,而后点击鼠标左键1.1.3选取特殊单元格在实际中, 有时要选取的单元格由若干不相连的单元格范围组成的 此类有两种情 况第一种情况是间断的单元格选取 选取方法是先选取第一个单元格, 然后按住 Ctrl 键,再依次选取其它单元格即可第二种情况是间断的单元格范围选取 选取方法是先选取第一个单元格范围, 然后按住 Ctrl 键,用鼠标拖拉的方式选取第二个单元格范围即可1.1.4公式中的数值计算要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按 Enter 键即可确认 .如果单击了“编辑公式”按钮或“粘贴函
3、数”按钮, Excel 将自动插入一个等号提示: (1) 通过先选定一个区域,再键入公式,然后按 CTRL+ENTER 组合键,可 以在区域内的所有单元格中输入同一公式(2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式公式是在工作表中对数据进行分析的等式它可以对工作表数值进行加法、减法和 乘法等运算公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单 元格,或者其它工作簿的工作表中的单元格下面的示例中将单元格B4 中的数值加上25,再除以单元格 D5、E5 和 F5 中数值的和=(B4+25)/SUM(D5:F5)1.1.5公式中的语法公式语法也就是公式中元素的结构或
4、顺序 Excel 中的公式遵守一个特定的语法: 最前面是等号(=),后面是参与计算的元素(运算数)和运算符每个运算数可以是不 改变的数值(常量数值) 、单元格或区域引用、标志、名称,或工作表函数在默认状态下,Excel 从等号(=)开始,从左到右计算公式可以通过修改公式语法来控制计算的顺序例如,公式=5+2*3 的结果为 11,将 2 乘以 3 (结果是 6),然后再加上 5 因为 Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括 号内的内容将首先被计算公式=(5+2)*3 的结果为 21,即先用 5 加上 2,再用其结果乘以 3 1.1.6单元格引用一个单元格中的数值或公式可
5、以被另一个单元格引用.含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值只要被引用单元格做了修改,包含 引用公式的单元格也就随之修改.例如,公式“=B15*5 ”将单元格 B15 中的数值乘以5 每当单元格 B15 中的值修改时,公式都将重新计算.公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志.在默认状态下,Excel 使用 A1 引用类型这种类型用字母标志列(从 A 到 IV , 共 256 列),用数字标志行(从 1 至 U 65536 ) 如果要引用单元格,请顺序输入列字 母和行数字例如,D50引用了列 D 和行 50 交叉处的单元格如
6、果要引用单元格区 域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用下面是引用的示例.单兀格引用范围引用符号在列 A 和行 10 中的单兀格A10属于列 A 和行 10 到行 20 中的单元格区域A10:A20属于行 15 和列 B 到列 E 中的单元格区域B15:E15从列 A 行 10 到列 E 行 20 的矩形区域中的单元格A10:E20行 5 中的所有单元格5:5从行 5 到行 10 中的所有单元格5:10列 H 中的所有单元格H:H从列 H 到列 J 中的所有单元格H:J1.1.7工作表函数Excel 包含许多预定义的,或称内置的公式,它们被叫做函数函数可以进行简单
7、的或复杂的计算工作表中常用的函数是“SUM ”函数,它被用来对单元格区域进行加法运算虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM ”工作表函数还可以方便地计算多个单元格区域.函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=)当生成包含函数的公式时,公式选项板将会提供相关的帮助.使用公式的步骤:A. 单击需要输入公式的单元格.B. 如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮C. 单击“函数”下拉列表框右端的下拉箭头.D.单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它
8、 函数”查看其它函数列表E. 输入参数F. 完成输入公式后,请按 ENTER 键1.2几种常见的统计函数1.2.1均值Excel 计算平均数使用 AVERAGE 函数,其格式如下:AVERAGE (参数 1,参数 2,参数 30 )范例: AVERAGE(12.6,13.4,11.9,12.8,13.0)=12.74如果要计算单元格中 A 1 到 B20 元素的平均数,可用 AVERAGE(A1:B20)1.2.2标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果 称作样本标准差,而依据总体计算的结果称作总体标准差(1) 样本标准差Excel 计算样本标准差采用 无
9、偏估计式 , STDEV 函数格式如下:STDEV (参数 1,参数 2,参数 30)范例:STDEV (3 , 5 , 6 , 4 , 6, 7, 5)= 1.35如果要计算单元格中 A 1 到 B20 元素的样本标准差,可用STDEV(A1:B20)(2) 总体标准差Excel 计算总体标准差采用 有偏估计式 STDEVP 函数,其格式如下:STDEVP (参数 1,参数 2,,参数 30)范例:STDEVP ( 3 , 5 , 6 , 4 , 6 , 7 , 5 )= 1.251.2.3方差方差为标准差的平方,在统计上亦分样本方差与总体方差.(1)样本方差Excel 计算总体方差使用 V
10、ARP 函数,格式如下:VARP (参数 1,参数 2,参数 30 )范例:VAR (3 , 5 , 6 , 4 , 6 , 7 , 5 )= 1.551.2.4正态分布函数Excel 计算正态分布时,使用 NORMDIST 函数,其格式如下:S2=(Xix)2n 1Excel 计算样本方差使用VAR 函数,格式如下:VAR (参数 1,参数 2,参数 30)如果要计算单元格中 A 1 到 B20 元素的样本方差,可用VAR(A1:B20)范例:VAR (3 , 5 , 6 , 4 , 6 , 7 , 5 )= 1.81总体方差S2=(Xix)2nNORMDIST (变量,均值,标准差,累积)
11、其中:变量(x):为分布要计算的x值;均值(0:分布的均值;标准差(T):分布的标准差;累积:若为 TRUE,则为分布函数;若为 FALSE,则为概率密度函数.范例:已知X服从正态分布,尸 600 , e 100,求PXW500.输入公式=NORMDIST (500 , 600 , 100 , TRUE)得到的结果为 0.158655,即PX W500=0.158655.1.2.5正态分布函数的反函数Excel 计算正态分布函数的反函数使用 NORMINV 函数,格式如下:NORMINV (下侧概率,均值,标准差)范例:已知概率P= 0.841345,均值 尸 360,标准差(r= 40 ,求
12、 NORMINV 函 数的值输入公式=NORMINV (0.841345 , 360 , 40 )得到结果为 400 ,即卩PX400=0.841345.注意: (1) NORMDIST 函数的反函数 NORMINV 用于分布函数,而非概率密度函 数,请务必注意;(2) Excel 提供了计算标准正态分布函数 NORMSDIST(x) ,及标准正态分布的反函 数NORMSINV( 概率 ) 范例:已知XN(0,1),计算(2)=PX1.711 ).已知 t = 1.711 ,n=25,采用单侧,贝UT分布的值:=TDIST(1.711,24,1)得到 0.05 ,即P(T1.711 ) =0.
13、05 若采用双侧,则T分布的值:=TDIST(1.711,24,2)得到 0.1,即P |T1.7110.1.1.2.7t 分布的反函数Excel 使用 TINV 函数得到t分布的反函数,格式如下:TINV (双侧概率,自由度)范例:已知随机变量服从t(10)分布,置信度为 0.05,求t0.05(10).输入公式=TINV(0.05,10)得到 2.2281 ,即P T 2.22810.05.若求临界值t a(n),则使用公式=TINV(2*a,n).范例:已知随机变量服从t(10)分布,置信度为 0.05,求t0.05(10).输入公式=TINV(0.1,10)得到 1.812462,即t
14、0.05(10)= 1.812462.1.2.8F 分布Excel 采用 FDIST 函数计算F分布的上侧概率1 F (x),格式如下:FDIST(变量,自由度 1,自由度 2)其中:变量(x):判断函数的变量值;自由度 1(nj:代表第 1 个样本的自由度;自由度 2(n2):代表第 2 个样本的自由度范例:设X服从自由度n1=5 ,n2=15 的F分布,求P(X2.9) 的值输入公式=FDIST(2.9,5,15)得到值为 0.05,相当于临界值a.1.2.9F 分布的反函数Excel 使用 FINV 函数得到F分布的反函数,即临界值F(山,n?),格式为:FINV( 上侧概率,自由度 1
15、,自由度 2)范例: 已知随机变量X服从F(9,9) 分布, 临界值a=0.05 , 求其上侧 0.05 分位点F0.05(9,9) 输入公式=FINV(0.05,9,9)得到值为 3.178897 ,即F0.05(9,9)= 3.178897 若求 单侧百分位点F0.025(9,9 ),F0.975(9,9 )可使用公式=FINV(0.025,9,9)=FINV(0.975,9,9)得到两个临界值 4.025992 和 0.248386 若求临界值 Fa(n1,n2),则使用公式=FINV( a, ni,n2).1.2.10卡方分布Excel 使用 CHIDIST 函数得到卡方分布的上侧概率
16、1 F(x),其格式为:CHIDIST( 数值,自由度 )其中:数值(X):要判断分布的数值;自由度(V):指明自由度的数字.范例:若X服从自由度v=12 的卡方分布,求P(X5.226) 的值输入公式=CHIDIST(5.226,12)得到 0.95,即1 F (5.226)=0.95 或F(5.226)=0.05 .1.2.11卡方分布的反函数2EXcel 使用 CHIINV 函数得到卡方分布的反函数,即临界值2(n)格式为:CHIINV (上侧概率值a,自由度n)范例:下面的公式计算卡方分布的反函数:=CHIINV(0.95,12)2得到值为 5.226 ,即02.95(12)=5.22
17、6 2若求临界值Xa(n),则使用公式=CHIINV( a, n).1.2.12泊松分布计算泊松分布使用 POISSON 函数,格式如下:POISSON( 变量,参数,累计 )其中:变量:表示事件发生的次数;参数:泊松分布的参数值;累计:若 TRUE,为泊松分布函数值;若 FALSE,则为泊松分布概率分布值.范例:设X服从参数为 4的泊松分布,计算PX=6及PXW6.输入公式=POISSON(6,4,FALSE)=POISSON(6,4,TRUE)得到概率 0.104196 和 0.889326.在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数 COUNT ,开平方函数 SQRT
18、,和函数 SUM,等等关于这些函数的具体用法,可以查看Excel的关于函数的说明,不再赘述.2 区间估计实验计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.2.1单个正态总体均值与方差的区间估计:2.1.12已知时的置信区间置信区间为X U r, X U r3 7n ? 7n例 1 随机从一批苗木中抽取16 株,测得其高度(单位:m )为:1.141.101.131.151.201.121.171.191.151.121.141.201.231.111.141.16 .设苗高服从正态分布,求总体均值口的 0.95 的置信区间.已
19、知(r=0.01(米).步骤:(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5 内输入样本数据.计算结果为(1.133695, 1.172555).(2)计算置信下限和置信上限. 可以在数据区域 B3:G5 以外的任意两个单元格内分别输入如下两个表达式:=average(b3:g5)-no rms in v(1-0.5*)*/sqrt(cou nt(b3:g5)=average(b3:g5)+normsi nv(1-0.5*)*/sqrt(cou nt(b3:g5)上述第一个表达式计算置信下限,第二个表达式计算置信上限其中,显著性水平和标准差是具体的数值而不是符号本例中,=0.05
20、,0.01,上述两个公式应实际输入为=average(b3:g5)-no rms in v(0.975)*0.01/sqrt(cou nt(b3:g5)=average(b3:g5)+normsi nv(0.975)*0.01/sqrt(cou nt(b3:g5)计算结果为(1.148225, 1.158025)2.1.22未知时的置信区间例 2 同例 1,但未知.输入公式为:=average(b3:g5)-ti nv(0.05,cou nt(b:3:g5)-1)*stdev(b3:g5)/sqrt(co un t(b3:g5)计算结果为(1.133695, 1.172555).=averag
21、e(b3:g5)-ti nv(0.05,cou nt(b:3:g5)-1)*stdev(b3:g5)/sqrt(co un t(b3:g5)计算置信区间上限:在单元格C15 中输入公式=(C9-1)*C11/C13例 3从一批火箭推力装置中随机抽取10 个进行试验,它们的燃烧时间(单位:s)如下:50.754.954.344.842.269.853.466.148.134.5试求总体方差2的 0.9 的置信区间(设总体为正态).操作步骤:(1) 在单元格 B3:C7 分别输入样本数据;(2) 在单元格 C9 中输入样本数或输入公式 =COUNT(B3:C7);(3) 在单元格 C10 中输入置
22、信水平 0.1 .(4) 计算样本方差:在单元格C11 中输入公式=VAR(B3:C7)(5) 计算两个查表值:在单元格C12 中输入公式=CHIINV(C10/2,C9-1),在单元格C13 中输入公式=CHIINV(1-C10/2,C9-1)(6) 计算置信区间下限:在单元格C14 中输入公式=(C9-1)*C11/C122.1.3未知时2的置信区间:置信区(n %(n %(n 1)2ABc HTD1 3巴体捲值太知一浪也体;5差的置怡区r350.-.8g54飞53.45&4.366. 1643.1742,234. SB9唇荒Win置営朮平0.111舞丰7T差111, 355112
23、章看值13査義值3. 52511514臂信区间下FF59.23508离信区间 限3:ldQl9当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(cou nt(b3:c7)-1)*var(b3:c7)/chii nv(0.1/2, cou nt(b3:c7)-1)=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)2.2两正态总体均值差与方差比的区间估计2.2.1当12=22=2但未知时1-2的置信区间、-n 置信区间为xyt g n22)S 一一IV r)1n2例 4在甲,乙两地随机抽取同一品种小麦籽粒的样
24、本,其容量分别为析其蛋白质含量为甲:12.613.411.912.813.0乙:13.113.412.813.513.312.712.4蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差 围.(取a=0.05 ) 实验步骤:5 和 7,分口2所在的范(1) 在 A2:A6 输入甲组数据,在 B2:B8 输入乙组数据;(2) 在单元格 B11 输入公式=AVERAGE(A2:A6),在单元格B12 中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值.(3) 分别在单元格 C11 和 C12 分别输入公式=VAR(A2:A6) , =VAR(B2:B8),计算出 两
25、组样本的方差.(4) 在单元格 D11 和 D12 分别输入公式=COUNT(A2:A6) , =COUNT(B2:B8),计 算各样本的容量大小.(5) 将显著性水平 0.05 输入到单元格 E11 中.(6) 分别在单元格 B13 和 B14 输入=B11-B12-TINV(0.025,10)*SQRT(4*C11+6*C12)/10)*SQRT(1/ 5+1/7)和=B11-B12+TINV(0.025,10)*SQRT(4*C11+6*C12)/10)*SQRT(1/ 5+1/7)1ABCD| E申乙212.13.113.413.弓11.312.3512.813.61313.3712.
26、7S12.4g10拝本方 徉本敝11甲-.2.740.300512诃13.02857T宣佶下1Q曽信上0.计算出置信区间的下限和上限.2221和未知时方差比cl肩的置信区间置信区间为2Si _s;F (ni22S2F(ni1m 1)1 2例 5 有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10 次测定.其测定值的方差分别是SA=0.5419 ,SB=0.6065 .设 c:和 皤分别是A、B所测量的数据总体(设为正态分布)的方差求方差比 cA/ cB的 0.95 置信区间.ACDE1样松押本方2A10C.54190.0531043.5S7169&養信下0. 22
27、193操作步骤:(1)在单元格 B2,B3 输入样本数,C2, C3 输入样本方差,D2 输入置信度.在 B4 和 B5 利用公式输入=C2/(C3*FINV(1-D2/2,B2-1,B3-1)=C2/(C3*FINV(D2/2,B2-1,B3-1)计算出 A 组和 B 组的方差比的置信区间上限和下限.2.3 练习题1.已知某树种的树高服从正态分布,随机抽取了该树种的本中各林木的树高资料如下(单位:m )60 株林木组成样本.样22.3, 21.2, 19.2, 16.6, 23.1, 23.9, 24.8, 26.4, 26.6, 24.8, 23.9, 23.2, 23.3, 21.4,1
28、9.8, 18.3, 20.0, 21.5, 18.7, 22.4, 26.6, 23.9, 24.8, 18.8, 27.1, 20.6, 25.0, 22.5,23.5, 23.9, 25.3, 23.5, 22.6, 21.5, 20.6, 25.8, 24.0, 23.5, 22.6, 21.8, 20.8, 19.5,20.9, 22.1, 22.7, 23.6, 24.5, 23.6, 21.0, 21.3, 22.4,18.7, 21.3, 15.4, 22.9, 17.8,21.7, 19.1, 20.3, 19.8试以 0.95 的可靠性,对于该林地上全部林木的平均高进行估计
29、2. 从一批灯泡中随机抽取 10个进行测试,测得它们的寿命(单位:1OOh )为:50.7, 54.9, 54.3, 44.8, 42.2 , 69.8, 53.4, 66.1 , 48.1 , 34.5试求总体方差的 0.9 的置信区间(设总体为正态) 3. 已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量 (kg)如下:第一实验区:62576560635857606058第二实验区:56595657605857555755试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产
30、量均值之差的范围(a=0.05 )3 假设检验实验实验内容:单个总体均值的假设检验;两个总体均值差的假设检验;两个正态总体 方差齐性的假设检验;拟合优度检验实验目的与要求:(1)理解假设检验的统计思想,掌握假设检验的计算步骤;(2)掌握运用 Excel 进行假设检验的方法和操作步骤;(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.3.1单个正态总体均值卩的检验3.1.12已知时卩的 U 检验例 1 外地一良种作物,其 1000m2产量(单位:kg)服从N(800, 502),引入本地试 种,收获时任取 5 块地,其 1000m2产量分别是 800 , 850 , 780 , 900
31、 , 820 ( kg ), 假定引种后 1000m2产量X也服从正态分布,试问:(1) 若方差未变,本地平均产量口与原产地的平均产量w =800kg 有无显著变化.(2) 本地平均产量口是否比原产地的平均产量口=800kg 高.(3) 本地平均产量口是否比原产地的平均产量M=800kg 低.操作步骤:(1)先建一个如下图所示的工作表:BCDEF1立量试吃藪疥7.3600850T8O90082045习均宙产虽630b样本數57吕1. 3164191. 5996110临界偵1.列485311临界徂(左侧)-1.64485计算样本均值(平均产量),在单元格 D5 输入公式=AVERAGE(A3:E
32、3);(3)在单元格 D6 输入样本数 5;在单元格 D8 输入U检验值计算公式=(D5-800)/(50/SQRT(D6);在单元格 D9 输入U检验的临界值=NORMSINV(0.975) ;根据算出的数值作出推论本例中,U的检验值1.341641 小于临界值 1.959961,故接受原假设,即平均产量与原产地无显著差异.(7)注:在例 1 中,问题要计算U检验的右侧临界值:在单元格 D10 输入U检验的上 侧临界值=NORMSINV(0.95) 问题要计算U检验的下侧临界值,在单元格 D11 输入U检验下侧的临界值 =NORMSINV(0.05) 3.1.22未知时的 t 检验例 2 某
33、一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试, 得到行驶速度如下:250238265242248258255236245261254256246242247256258259262263该引擎制造商宣称引擎的平均速度高于250 km/h ,请问样本数据在显著性水平为0.025时,是否和他的声明抵触?操作步骤:(1)先建如图所示的工作表:AB级CI)a1呂平均速2$2 Q590.&41SE102011LU60ST12临界值匕033计算样本均值:在单元格D8 输入公式=AVERAGE(A3:E6);(3)计算标准差:在单元格 D9 输入公式=STDEV(A3:E6);(
34、4) 在单元格 D10 输入样本数 20 .(5) 在单元格 D11 输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10) ,得到结果 1.06087 ;(6) 在单元格 D12 输入t检验上侧临界值计算公式=TINV(0.05, D10-1).欲检验假设H0: 尸 250 ; H1: 口250 .已知t统计量的自由度为(n-1)=20-1=19,拒绝域为tt0.025=2.093 .由上面计算得到t检验统计量的值 1.06087 落在接收域内,故接收原假设H0.3.2两个正态总体参数的假设检验3.2.1当12=22=2但未知时1-卩2的检验在此情况下,采用 t 检验.例 试验
35、及观测数据同 11.2 中的练习题 3,试判别磷肥对玉米产量有无显著影响?2 1+応站比25qi Hto(10)选择“确定”,计算结果如 D1:F14 显示.欲检验假设H0 :(11 =|J2 ;Hl:|J1 (J2 .操作步骤:(1)建立如图所示工作表:甲方乙方t-检验:双样本等方差假设62565759甲方乙方6556平均60576057方差7.111111112.666666676358观测值10105857合并方差4.888888895760假设平均差06055df186057t Stat3.033899385855P(T=t)单尾0.00356934t 单尾临界1.73406359P(
36、T1.73,所以拒绝原假 设,接收备择假设,即认为使用磷肥对提高玉米产量有显著影响.3.2.2聖与爲已知时11-的 U 检验例 3 某班 20 人进行了数学测验,第 1 组和第 2 组测验结果如下:第 1 组:918876989492908710069第 2组:90918092929498788691已知两组的总体方差分别是57 与 53,取a=0.05,可否认为两组学生的成绩有差异?操作步骤:(1)建立如图所示工作表:AcDEF1 第一组第二绘i:书建:双样本找值分析3903翱91变量1 .变量2 3 4宝76R0平均服5的.2&98925?5369492观测值10107裁940S加
37、asZ-0.2110Sg377SP(Z=z)单尾0. 416421ia100z里陽帛界1, B44S5359_P( (Z-7) )砂a12Z舉尾临鼎1.95S961132选取“工具”一“数据分析”;3选定“ z-检验:双样本平均差检验”;4选择“确定”,显示一个“ z-检验:双样本平均差检验”对话框;在“变量 1 的区域”输入 A2:A11 ;在“变量 2 的区域”输入 B2:B11 ;(7)在“输出区域”输入 D1 ;(8) 在显著水平“a”框,输入 0.05 ;(9) 在“假设平均差”窗口输入0;(10) 在“变量 1 的方差”窗口输入 57 ;(11) 在“变量 2 的方差”窗口输入 5
38、3 ;(12) 选择“确定” ,得到结果如图所示计算结果得到 z=-0.21106 (即u统计量的值),其绝对值小于“ z 双尾临界”值 1.959961 ,故接收原假设,表示无充分证据表明两组学生数学测验成绩有差异3.2.3两个正态总体的方差齐性的F检验例 5羊毛在处理前与后分别抽样分析其含脂率如下:处理前: 0.190.180.21 0.300.410.12 0.27处理后: 0.150.130.070.240.19问处理前后含脂率的标准差是否有显著差异?欲检验假设操作步骤如下:(1) 建立如图所示工作表:0.06 0.08 0.122 2H0:1= CT2 ;22H1:61工 02.(2
39、) 选取“工具”一“数据分析”;(3) 选定“ F-检验双样本方差”.(4) 选择“确定”,显示一个“ F-检验:双样本方差”对话框;在“变量 1 的区域”输入 A2:A8 .在“变量 2 的区域”输入 B2:B9 .在显著水平“a”框,输入 0.025 .(8)在“输出区域”框输入 D1 .(9)选择“确定”,得到结果如图所示.计算出 F 值 2.35049 小于“ F 单尾临界”值 5.118579,且 P(F0.025,故接收原假设,表示无理由怀疑两总体方差相等.4 拟合优度检验拟合优度检验使用统计量(n np)2np验方面,提供了 CHITEST 函数,其格式如下:(11.1)其中 n
40、 为实测频数,npi为理论频数,k 为分组数。Excel 在计算拟合优度的卡方检CHITEST(实测频数区域,理论频数区域)7Pop (k 1)2CHIINV(p0,k 1)确定 统计量的值.即差s=42.77 及下表.试检验X是否服从正态分布(a=0.05 ).组号小区间频数1(-卩19862(198,20173(210,204144(204,207205207,210236(210,213227(213,216148(216,21989(219,+呵6120得到临界概率其中为上述统计量(1.11)的值.在应用中,可根据临界概率Po,利用函数CHIINV(po,kk(nnpi)2nPi例 6
41、设总体X中抽取 120 个样本观察值,经计算整理得样本均值X209 ,样本方操作步骤:(1) 输入基本数据建立如下图所示工作表,输入区间(A2:A10),端点值(B2:B10 ),实测频数的值(C2:C10) 区间可以不输入,输入是为了更清晰;端点值为区间右端点的值,当右端点 是+ 8 时,为了便于处理,可输入一个很大的数(本例取10000 )代替+8.(2) 计算理论频数由极大似然估计得参数?X 209, ? s 6.539877675,假设XN(?, ?2),贝 UPaXwb=F(b)-F(a),因此,事件a7频数: 81617106210试用卡方分布检验每小时电话总机收到呼唤次数是否服从
42、泊松分布7. 下面是某系高等数学的成绩:87 , 75 ,85 ,78,62, 90 ,72,66,75 ,74, 73, 77, 75 ,84,6478 , 90 ,65 ,90 ,78 ,57 ,71 ,48, 74, 72, 53 , 69, 68 , 74,6290 , 80 , 70, 84, 86 ,65 ,60 ,68, 89 ,72, 53 , 69, 68 , 74,7365 , 71 ,68 ,70, 85 , 79, 43, 79, 80 ,77 ,88 , 93, 68 , 74, 51试在显著水平 a= 0.05 小,检验这次成绩的分布是否服从正态分布.5 方差分析实
43、验试验内容:单因素方差分析;双因素无重复试验的方差分析;双因素等重复试验的 方差分析试验目的与教学要求:充分理解方差分析的统计思想;充分理解平方和分解的统计 思想;学会如何充分地利用试验结果的信息,对所关心的事物(因素的影响作出合理的 推断5.1单因素方差分析例 1 检验某种激素对羊羔增重的效应选用 3 个剂量进行试验,加上对照(不用 激素)在内,每次试验要用 4只羊羔,若进行 4 次重复试验,则共需 16只羊羔一种 常用的试验方法,是将 16只羊羔随机分配到 16个试验单元在试验单元间的试验条 件一致的情况下,经过 20 0天的饲养后,羊羔的增重( kg )数据如下表.-处理 重复、一、1(
44、对照)234147505754252545365362676975451575759试问各种处理之间有无显著差异?操作步骤:(1) 输入数据,如下图所示:(2) 选取“工具”一“数据分析”;(3) 选定“单因素方差分析”;(4) 选定“确定”,显示“单因子方差分析”对话框;(5) 在“输入区域”框输入数据矩阵(首坐标):(尾坐标),如上例为“ A2:D6 ”,其中第二行“第一组,第四组”作为标记行;(6) 在“分组方式”框选定“列”;(7) 打开“分类轴标记行在第一行上”复选框.若关闭,则数据输入域应为A3:D6 .(8) 指定显著水平 a= 0.05 ;(9) 选择输出选项,本例选择“输出区
45、域”紧接在数据区域下为:“ A7 ” ;(10) 选择“确定”,则得输出结果.BCD af151617冇差分Fbt18差异滙SSdfMSFPalueF crit-=i21S.: 8753 72. 72917 1. 30504?0, 3179Sa 490320组内6&3, 7512皈729172122总计S3o. 93751523结果分析:F crit=3.4903 是 a=0.05 的 F 统计量临界值,F=1.305047 是 F 统计 量的计算值,P-value=0.318=PF1.305050 12一列列计数,齐口L平均.万差4石可殆40. fi66?422S57 52. &am
46、p;啊啊4S3rJ52 2594363.25 81.58333由于 1 .305053.4903,因此接受原假设,即无显著差异.5.2双因素无重复试验的方差分析:例 2 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区有四个品种的小麦,在每一地块内随机分种在四个小区上,每小区的播种量相同,测得收获量如下表(单位:kg ).试以显著性水平ai=0.05, a2=0.01,考察品种和地块对收获量的影响是否显著.地块品种B1B2B3B4B5A132.334.034.736.035.5A233.233.636.834.336.1A330.834.432.335.832.8A429.
47、526.228.128.529.4操作步骤:(1)输入数据,如下图所示:(2) 选取“工具”一“数据分析”由于 1 .30505F-crit,对 a =0.05 ,各因素均显著,应拒绝原假设HA,HB,HAB.可以继续计算对显著水平a= 0.01 的推断结果.5.3练习与习题1.假设某医院应用克矽平治疗矽肺,治疗前、中、后期患者血液中粘蛋白含量(mg% )观察结果如下:患者编号治疗前治疗中治疗后16.54.53.527.34.43.637.35.93.7433.62.657.35.54.365.64.53.777.35.25试问用克矽平治疗矽肺对降低血液中粘蛋白含量是否有作用(a = 0.05
48、 )?2.下面给出了小白鼠接种不同菌型伤寒杆菌的存活日数,试问三种菌型的平均存活日数有否显著差异(a=0.05 )?菌型接种后存活日数A12 , 4 , 3, 2, 4 , 7, 7 , 2, 5, 4A25 , 6 , 8, 5, 10, 7, 12, 6, 6A37, 11 , 6 , 6 , 7, 9, 5, 10 , 6 , 3, 103.抽查某地区三所小学五年级男生的身高,得以下数据:小学身高(cm )第一小学128.1,134.1,133.1, 138.9 , 140.8 , 127.4第二小学150.3,147.9 ,136.8, 126.0 , 150.7 , 155.8第三小
49、学140.6,143.1,144.5, 143.7 , 148.5 , 146.4试问该地区这三所小学五年级男生的平均身高有否显著差异(a=0.05 )?4.下面记录了某地区四个生产队在 1 9 5 6 1 9 5 9 年的667m2小麦平均产量:年份生产队产量12341956146200148151195725830328229019584154614314131959454452453415试检验:(1)各生产队间的差异是否显著?(2)逐年产量的增长是否显著(a=0.05 )?5.下面记录了三位操作工在四台不同机器上操作三天的日产量:机器操作工甲乙丙M115 , 15 , 1719 , 1
50、9 , 1616 , 18 , 21M217 , 17 , 1715 , 15 , 1519 , 22 , 22M315 , 17 , 1618 , 17 , 1618 , 18 , 18M418 , 20 , 2215 , 16 , 1717 , 17 , 17试检验:(1)操作工之间的差异是否显著?(2)机器之间的差别是否显著?(3)交互影响是否显著(a=0.05)?6 回归分析实验实验内容:一元线性回归;多元线性回归;回归分析中其它函数的应用.实验目的与要求:掌握回归分析的基本原理、实验操作步骤,能够应用回归分析解决实际问题;根据实验数据,能够熟练地建立回归方程;熟练地掌握回归方程的显著
51、性 检验;熟练地掌握回归系数的显著性检验.6.1利用 Excel 进行一元线性回归分析例 1 今收集到某地区 19501975 年的工农业总产值(X)与货运周转量(Y)的 历史数据如下:X: 0.50 0.87 1.20 1.60 1.90 2.20 2.50 2.80 3.60 4.004.103.203.404.44.705.405.655.605.705.906.306.656.707.057.067.30Y: 0.901.201.401.501.702.002.052.353.003.503.202.402.803.23.403.704.004.404.354.344.354.404.
52、554.704.605.20试分析X与 Y 间的关系操作步骤:(1) 首先在 Excel 中建立工作表,样本X数据存放在 A1:A27,其中 A1 存标记 X; 样本Y数据存放在 B1:B27,其中 B1 存标记 Y.(2) 选取“工具”、“数据分析”.(3) 选定“回归” .(4) 选择“确定” .(5) 在“输入 Y区域”框输入 B1 : B27 .(6) 在“输入 X区域”框输入 A 1 : A27 .(7)关闭“常数为零”复选框,表示保留截距项,使其不为 0.DEF_ GIT HIrJ1OJTFUT34lTul 1 .JMM3凳5 K Square0.978798blAd.UElO.S
53、7T914出wan2610h r-H11dfSSnsJTEniri卩121漁諛、QZ67Q311CL M23 1.3-21L3吃耳241別D. J35224514Hit25独3T20962花Cccffi:i期讎t Stat7 dueLocr 9科Upper 95%1.Tnter?eptD. 6753731 03429596B.O1L2T13,(1蚀邓:.50L39J8 0. 849351J18X Vai-icblD. 595124101T8792431 285 76&1.34业21O.KE2233.0- 632D25214屮 H ShFPtl /12/Sh-4/J111(8) 打开标记
54、”复选框,表示有标记行.(9) 打开“置信水平”复选框,并使其值为 9 5%.(10) 在“输出区域”框,确定单元格E2.结果如图所示.其中SS 为平方和、MS 表示均方、df 为自由度.由此我们可义看出:(1) 回归方程:丫=0.6754 + 0.5951X ;(2) F 统计量的值:F=1107.942.由于 PF1107.942=1.34353E-21,故所建回归方程极显著.6.2利用 EXCEL 进行多元线性回归分析例 2 今收集到历史数据如下:X1: 71111171131221111101412X2: 26 29 56 31 52 55 71 31 54 47 40 66 68 4
55、3 58X3:6158 869 1722184 239 812 18X4: 60522047332264422263412 12 28 37Y: 797510388 96108100759411684 115110 99 107使试分析Xi,X2,X3,X4与Y之间的关系.解 首先在 Excel 中建立工作表,其中样本X数据输入在 A2 : D16 ;样本Y数据 输入在 E2:E16(1) 选取“工具”“数据分析” ;(2) 选定“回归” ;(3) 选择“确定” ;(4) 在“输入 Y区域”框输 E2: E16 ;(5) 在“输入 X区域”框输入 A2:D16 ;(6) 关闭“常数为零”复选框
56、,表示保留截距项,使其不为0 ;(7) 关闭“标记”复选框;(8) 打开“置信水平”复选框,并使其值为 9 5%;(9) 在“输出区域”框,确定单元格 G1 ;结果如下表所示;由此我们可义看出:回归方程: Y=59.6881 1.45441X1 0.54959X2 0.06771 X3 0.08 1 7X4 ;回归方程的显著性检验:由于 F 统计量值为:F=90.9964,而 PF90.9964=8.01843E-08,故所建回归方程是极显著的;错误!未找到引用源。回归系数的显著性检验:GH:| JLn3叵归新计4JljltipLs0. 93654bR Sqiiarr0. 973G6&
57、 Adjusted0. 9G2T77融误莖2. 5737581510万差分祈11dfFflFL2回归分祈42602.1 IL650. 5277血的&48. 013E-08L3戟差107L.4393G7.14893614 an142673. GILL6Cceffi ?isn标准误差t Si atP-lvalueH辰95.(B上限55. W17 Interscpl59.J8S1L0.30GFG5.79127 0. D001S 3&. 723C1914觇G52F17丄百XI1.4b4410.17Y4498. latiy9. bEL-06J. J5903T2L6 1. 847913|1
58、90. 5坤坤0.1257754.69634A 0014 0. 259347502 0. 8293379Z0X30. 06771 |J. Le41Q6 0.41335 u. 6355 -Q. 2S793665 0. 433355521-0, DS17 0.113393-0.68633 0.50611-0. 346801430L18346626.3练习与习题1.研究物体在横断面上渗透深度H(厘米) 与局部能量 E(每平方米厘米积上的能量)的关系,得到试验结果如下:关于Xi,由于Pt8.196=9.5E-6,故Xi是显著的;关于X2,由于 Pt4.369=0.0014,故X2是显著的;关于X3,由
59、于 Pt0.413=0.68896,故X3是不显著的;关于X4,由于 Pt-0.6863=0.50811,故X4是不显著的.能量 E深度 H能量 E深度 H能量 E深度 H414139202503150815419269368110180233013710414208261201624130试检验渗透深度 H 与局部能量 E 之间是否存在显著的线性相关关系如果存在,求H关于 E 的线性回归方程.2.拖拉机拉杆的曳力 F 与拖拉机的速度 V 有关,测得数据如下:V (里/小时)F (斤)V (里/小时)F (斤)0.94253.65401.34204.15902.04805.26102.7495
60、5.56903.45306.0680检验拖拉机顶曳力 F 与拖拉机速度 V 之间是否存在显著的线性相关关系.如果存在,求 F 关于 V的线性回归方程.3.气体在容器中被吸引的比率Y 与气体的温度 X1 和吸收液体的蒸汽压力 X2 有关,其数学模型为 Y=A + B1X1 + B2X2,测得试验数据为:X1X2YX1X2Y78.01.01.5169.012.030.0113.53.26.0187.018.550.0130.04.810.0206.027.580.0154.08.420.0214.032.0100.0求 Y 关于 XI、X2 的二元线性回归方程.7 数据分析综合实验试验内容:研究 B1, B2, B3三个厂家生产的果树专用复合肥的效果、土壤有机质含量对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药物输注过程中的安全隐患防范
- 静脉穿刺操作的无菌安全护理
- 市场营销实务说课课件
- 工造朱俊文管理课件
- 工程问题课件复习
- 工程课程的课件制作
- 二零二五年度城乡一体化发展内部承包施工合同
- 疫情复课开学班会课件
- 社区物业服务委托协议
- 遥感技术农业信息管理系统合同
- 2023年大学英语四级考试高频词汇1500打印版
- ps6000自动化系统用户操作及问题处理培训
- 2023年韶关市法院书记员招聘笔试模拟试题及答案解析
- 革兰氏阴性菌课件
- 聘用证书合集通用PPT模板
- 建筑工程文件归档管理明细表
- 海姆立克手法理论知识、临床应用及注意事项考核试题与答案
- 碱性脱漆剂配方
- DB32∕T 186-2015 建筑消防设施检测技术规程
- XX公司“十四五”战略发展规划及年度评价报告(模板)
- Q∕GDW 12104-2021 电力物联网数据中台技术和功能规范
评论
0/150
提交评论