统计学1-6章答案_第1页
统计学1-6章答案_第2页
统计学1-6章答案_第3页
统计学1-6章答案_第4页
统计学1-6章答案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章、练习题及解答1.某商品专卖店2012年10月8日销售流水帐如下性销售单号销售员姓名别销售型号单价销售数量销售额071008001赵灵儿女C型120011200071008002赵灵儿女C型120011200071008003李逍遥男A型8001800071008004林月如女B型100011000071008005赵灵儿女A型8001800071008006赵灵儿女C型120011200071008007林月如男A型8001800071008008李逍遥女C型120011200071008009李逍遥女A型8001800071008010赵灵儿女B型100011000071008011林月如男C型120011200071008012林月如女C型120011200071008013赵灵儿女A型8001800071008014林月如女C型120011200071008015赵灵儿女C型120011200要求:(1)利用excel软件,分别按销售员和销售型号进行分类汇总。(2)利用excel软件,按销售员统计其不同销售型号的销售量与销售额 (数据透视表)。解:(1)按销售型号进行汇总销售单号销售员姓性别销售型号单价销售数量销售额名71008003李逍遥男A型800180071008005赵灵儿女A型800180071008007林月如男A型800180071008009李逍遥女A型800180071008013赵灵儿女A型8001800A型汇总5400071008004林月如女B型10001100071008010赵灵儿女B型100011000B型汇总2200071008001赵灵儿女C型12001120071008002赵灵儿女C型12001120071008006赵灵儿女C型12001120071008008李逍遥女C型12001120071008011林月如男C型12001120071008012林月如女C型12001120071008014林月如女C型12001120071008015赵灵儿女C型120011200C型汇总89600总计1515600按销售员统计其不同销售型号的销售量与销售额(数据透视表)销售员销售型号A型B型C型数据总计销售数量2013李逍遥1600012002800销售额销售数量1135林月如800100036005400销售额销售数量2147赵灵儿1600100048007400销售额销售数量合计52815销售额合计400020009600156002.为了确定灯泡的使用寿命(小时) ,在一批灯泡中随机抽取 100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688要求:(1)利用excel软件,对以上数据进行排序。以组距为10进行等距分组,生成频数分布表,并绘制直方图。解:(1)数据排序结果(升序)651658661664665666668671673674676677679681681682683683683684685685685688688689689690690691691691691692692692693693694694695695696696696697697698698698698699699700700701701702702703704705706706706707707708708708709710710712712713713715716717717718718719720721722722725726727728729729733735736741747749(2)灯泡的使用寿命频数分布表分组频数(只)频率(%)650-66022660-67055670-68066680-6901414690-7002626700-7101818710-7201313720-7301010730-74033740-75033合计100100302520151050 660 670 680 690 700 710 720 730 740 750直方图3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。(2)制作茎叶图,并与直方图进行比较。解:(1)频数分布表分组频数(个)频率(%)85-9537.595-105615.0105-115922.5115-1251127.5125-135410.0135-145512.5145-15525.0合计4010012108642095 105 115 125 135 145 155直方图或:(2)茎叶图树茎树叶数据个数8782925731003345578891102345567789912120345679713567841426215214.2006~2011年我国就业人口人员数(年底数)如下表所示:年份就业人员三次产业就业人数(万人)第一产业第二产业第三产业200674978319411889424143200775321307312018624404200875564299232055325087200975828288902108025857201076105279312184226332201176420265942254427282要求:(1)利用excel软件,绘制就业人数的条形图。(2)分别绘制一、二、三次产业就业人数的条形图并比较分析。(3)根据2006年和2011年这两年就业人数的三次产业构成数据, 分别绘制饼形图并比较分析。解:(1)77000就业人员 (万人)7650076000人万(75500数人7500074500740002006 2007 2008 2009 2010 2011 年份我国就业人数条形图2)201120102009份年2008200720060 5000 10000 15000 20000 25000 30000 35000第一产业就业人数条形图二、三产业就业人数条形图请自己绘制。

人数(万人)201120102009第三产业份第二产业年2008第一产业200720060 5000 10000 15000 20000 25000 30000 35000三次产业就业人数条形图就业人数(万人)(3)24143,32%31941,43%第一产业第二产业第三产业18894,25%2006年三次产业就业人数构成27282,35%26594,35%第一产业第二产业第三产业22544,30%2011年三次产业就业人数构成第一产业就业人数及其比重下降,第二、三产业人数比重上升。具体情况自己分析。第三章、练习题及解答1.已知下表资料:日产量(件)工人数(人)工人比重(%)25201030502535804040361845147合计200100试根据频数和频率资料,分别计算工人平均日产量。解:计算表日产量工人数工人比重xfxf/∑f(件)x(人)f(%)f/∑f2520105002.530502515007.535804028001440361814407.2451476303.15合计200100687034.35根据频数计算工人平均日产量:根据频率计算工人平均日产量:

xf6870x34.35(件)f200xxgf34.35(件)f结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2.某企业集团将其所属的生产同种产品的 9 个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件)单位数产量比重(%)10~1222012~1434214~18438合计9100试计算这9个企业的平均单位成本。解:单位产品成本单位数产量比重(%)组中值X·f/∑f(元/件)f/∑f(元)x10~12220112.212~14342135.4614~18438166.08合计9100-13.74这9个企业的平均单位成本=xxgf=13.74(元)f3.某专业统计学考试成绩资料如下:按成绩分组(分)学生数(人)60以下460~70870~801480~902090~1009100以上5合计60试计算众数、中位数。解:众数的计算:根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,MoLfmfm1dfm1fmfmf53(分)1420209中位数的计算:根据f6030和向上累积频数信息知,中位数在80~90这一组。22fSm123026MeLd8082(分)fme10204.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)解:计算表日产量工人数(xx)2f(件)x(人)f25201748.453050946.125358033.840361149.2145141587.915合计2005465.5xx22f5465.527.3275f200227.32755.23v100%5.2315.23%100%x34.355.一家公司在招收职员时,首先要通过两项能力测试。在 A项测试中,平均分数是 80分,标准差是15分;在B项测试中,平均分数是 200分,标准差是 50分。一位应试者在 A项测试中得了 95分,在 B项测试中得了 225分。与平均分数相比,该位应试者哪一项测试更为理想?解:计算各自的标准分数:zA95801,ZB2252000.51550因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想。第四章 练习题及解答1.解:由于Z服从标准正态分布,查表得NORMSDIST(0)0.5,NORMSDIST(1.2)0.8849,NORMSDIST(0.48)0.6844,NORMSDIST(1.2)0.8849,NORMSDIST(1.33)0.9082(1)NORMSDIST(1.2)NORMSDIST(0)0.8849-0.50.3849P(0Z1.2)(2)P(0.48Z0)NORMSDIST(0)NORMSDIST(-0.48)NORMSDIST(0)-1NORMSDIST(0.48)0.1844(3)P(Z1.33)1P(Z1.33)1NORMSDIST(1.33)0.09182.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示:分组频数8.51-8.8028.81-9.1039.11-9.4079.41-9.7099.71-10.00310.01-10.30510.31-10.601对应频数直方图为:109876543210观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。3.解:已知: 200,n 100, 2 502 2500,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.5可以得到:(1)E(x)x2002225002(225,x5)xn100x(3)根据中心极限定理,x近似服从均值为200,标准差为5的正态分布。4.解:已知:0.4,n500,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.7可以得到:(1)E(p) 0.42(2) p

(1)20.00048,ppn

0.0219;(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布。5.解:6xi545559636468(1)xi1N660.5,6x)22i1(xi224.9167;4.9917N(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有 62 36种可能样本。(3)如下表所示:样本序号样本单位样本均值x样本序号样本单位样本均值x154,54541963,5458.5254,5554.52063,5559354,5956.52163,5961454,6358.52263,6363554,64592363,6463.5654,68612463,6865.5755,5454.52564,5459855,55552664,5559.5955,59572764,5961.51055,63592864,6363.51155,6459.52964,64641255,6861.53064,68661359,5456.53168,54611459,55573268,5561.51559,59593368,5963.51659,63613468,6365.51759,6461.53568,64661859,6863.53668,6868(4)样本均值频数表:分组频数54-56456-58458-60 960-62 762-64 764-66 366-68 2样本均值频数直方图:10987654321054-56 56-58 58-60 60-62 62-64 64-66 66-68由上图可以发现,样本均值近似服从正态分布;(5)由样本方差均值公式可以得到:36xi2178xi160.5363636x)22(xi472.252i1x3612.45833;xx3.52963636n可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1.解:(1)已知 15,n 49,故: x

15n 7

2.1429;(2)由题目可知: 0.05,故查表可知: Z Z0.025 1.962估计误差Z x 1.96 2.1429 4.2;2(3)由题目可知: x 120,由置信区间公式可得:x Z x 120 4.2 (115.8,124.2)2即快餐店所有顾客午餐平均花费金额的 95%的置信区间为( 115.8,124.2)元。2.解:(1)总体服从正态分布,ZZ0.0251.96,则的95%置信区间为:2xZx89001.96129.0994(8646.9652,9153.0348)2(2)总体不服从正态分布,且样本属于大样本,ZZ0.0251.96,则的95%置信区2间为:xZx89001.9684.5154(8734.3498,9065.6502)2(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,ZZ0.051.645,2则的90%置信区间为:xZs1.64584.5154(8760.9722,9039.0278)89002n(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差,ZZ0.0251.96,2则 的95%置信区间为:xZs89001.9684.5154(8734.3498,9065.6502)n3.解:整理数据可以得到n36,xx(xx)23.3167,sn1.6093,由于n136属于大样本,所以使用正态分布来构建置信区间。当ZZ0.051.645,该校大学生平均上网时间的90%置信区间为:2xs3.31671.6450.2682(2.8755,3.7579)小时Zn当ZZ0.0251.96,该校大学生平均上网时间的95%置信区间为:2xZs1.960.2682(2.7910,3.8424)小时3.31672n当ZZ0.0252.58,该校大学生平均上网时间的95%置信区间为:2xZs2.580.2682(2.6244,4.0089)小时3.31672n4.解:(1)由题目可知:n50,p320.64,p50

p(1 p)0.0679,由于抽取的样n本属于大样本,所以ZZ0.0251.96,总体中赞成新措施的户数比例的95%置信区间为:2p(1p)(0.5069,0.7731)pZ0.641.960.06792n(2)由题目可知:估计误差dZp(1p)10%0.1,p0.8,ZZ0.0251.96,n22得到:p(1 p)Z 0.1n0.(81-0.8)1.96 0.1n61.5385 n即样本个数至少为 62户。或直接将d0.1带入n确定的公式,即,(z/2)2(1)1.9620.8(10.8)61.5462nd20.125.解:(1)整理数据可以得到:n10,x17.15,s120.2272,由于抽取的样本属于小样本,所以由CHIINV函数得:22(9)19.0228,22(9)2.7004,0.02510.97522由此可以得到第一种排队方式等待时间标准差的95%的置信区间为:(n1)s12(n1)s12222120.330.87(2)整理数据可以得到:n10,x27.15,s223.8183,第二种排队方式等待时间标准差的 95%的置信区间为:(n1)s22(n1)s22222121.253.33(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到:(n11)s12(n21)s22swn1n229.9218当t(n1n22)t0.975(19)2.093,(1-2)的95%置信区间为:12(x1x2)1111t0.975(19)swn29.82.0939.9218(0.1871,19.4129)n1147当t(n1n22)t0.995(19)2.8609,(1-2)的95%置信区间为:12(x1x2)t0.995(19)sw11(53.243.4)11n1n22.86099.9218714(3.3398,22.9398)7.解:由样本数据计算得到:nd)2110(di38411,sdi16.53,t(101)2.262dnd1101102则自信心得分之差d1-2的95%的置信区间为:dsd112.2626.534.67(6.33,15.67)t0.025(9)11n108.解:由题目可以得到:n1n2250,p10.4,p20.3,当ZZ0.951.645,(1-2)的90%置信区间为:2p1p2Z0.95p1(1p1)p2(1p2)(3.021%,16.98%)n1n2当ZZ0.9751.96,(1-2)的95%置信区间为:2p1p2Z0.975p1(1p1)p2(1p2)(1.684%,18.32%)n1n29.解:由题目可以得到:n1n221,s120.058375,s220.005265,F(n11,n21)F0.025(20,20)2.4645,F(n11,n21)F0.975(20,20)0.40582122/2两个总体方差比12的95%的置信区间为:21221s11s12F(n11,n21)221,n21)s22s2F(n1212217.4123127.32232210.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即 120,在95%置信度下ZZ0.0251.96,估计误差Z20,因此:22nZ0.975 20n1201.96 20138.2976n即样本个数至少为139个。11.解:由题目可以得到:总体已知,即112,215,n1n2n,在95%置信22度下ZZ0.0251.96,估计误差Z125,因此:2n1n2222Z1250.025n1n21.961221525n56.7020n即两个总体的样本各至少为57个。第六章、练习题及解答1.解:由题目可以得到: n 200, 2.5;提出原假设与备择假设: H0: 6.7,H1: 6.7;该检验属于右侧单边检验,因此得到拒绝域为:W{zz1z0.992.3263};x03.11132.32563,落入拒绝域中,因在大样本条件下检验统计量为:zn此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。(或利用 Excel的“1-NORMSDIST(3.1113) ”函数得到检验 P=0.0009<0.01 ,则拒绝原假设)2.解:由题目可以得到:n32,根据样本数据计算得到:s9.1979,x78.10625;提出原假设与备择假设:H0:82,H1:82;该检验属于左侧单边检验,因此得到拒绝域为:在大样本且总体方差未知条件下检验统计量为:

W{zzz0.012.3264};x02.39492.325,落入zsn拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。(或利用Excel的“NORMSDIST(-2.3949) ”函数得到检验 P=0.0083<0.01 ,则拒绝原假设)3.解:由题目可以得到:n20,计算样本数据得到s2.1933,x25.51;提出原假设与备择假设:H0:25,H1:25;该检验属于双边检验,因此得到拒绝域为:W{zzz0.0251.96};2在服从正态分布的小样本且总体方差未知条件下检验统计量为:zx,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产1.03991.96sn的金属板不符合要求。(或利用“TDIST(1.04,19,2) ”函数得到检验 P=0.3114>0.05 ,则不能拒绝原假设)4.解:由题目可以得到:n550,计算样本数据得到pn0115n20.91%;550提出原假设与备择假设:H0:17%,H1:17%;该检验属于右侧单边检验,因此得到拒绝域为:W{zzz0.0251.96};2在大样本条件下检验统计量为:zp02.44121.96,落入拒绝域中,0(10)n因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。(或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05,则拒绝原假设)5.解:提出原假设与备择假设:H0:125,H1:125;在大样本条件下检验统计量为:(x1x2)(12)5.1450zs12s22n1n2利用“2*(1-NORMSDIST(5.1450))”函数,得到双尾P值为2.6752107,由于P0.05,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。6.解:设:“看后”平均得分为 1 ,“看前”平均得分 2,“看后”平均得分与“看前”平均得分之差为d;提出原假设与备择假设:H0:120,H1:120;nnd)2di(di根据样本数据计算得到:di10.625,sdi11.3025;nn1在配对的小样本条件下检验统计量为:0.6251.3572t1.30258利用 Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率P值为0.10842 ,由于0.05,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。7.解:设:方法一培训测试平均得分为 1,方法二培训测试平均得分为 2;提出原假设与备择假设:H0:120,H1:120;根据样本数据计算得到:n115,n212,x147.7333,x256.5,s1219.4952,s2218.2727由于小样本情况下总体方差未知且不相等,t分布自由度为:(s12s22)2n1n224(s12)2(s22)2n1n2n1-1n2-1在小样本条件下检验统计量为:(x1-x2)-(1-2)ts12s225.2183n1n2利用Excel的“=TDIST(5.2183,24,2)”函数,得到的双尾概率P值为0.00002,由于P 0.05,拒绝原假设,认为两种培训方法的效果存在显著差异。8.解:设:男性经理认为自己成功的人数比例为1,女性经理认为自己成功的人数比例为2,两个样本合并后得到的合并比例为p;提出原假设与备择假设:H0:120,H1:120;根据样本数据计算得到:两个样本的比例分别为:p141%,p224%两个样本合并后得到的合并比例n1p1n2p232.31%;pn2n1p1-p22.5373检验统计量为:z11)p(1-p)(n1n2利用Excel的“=2*(1-NORMSDIST(2.5373))”函数,得到检验概率P值为0.0112,由于P0.05,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。9.解:设:新肥料获得的平均产量为1,旧肥料获得的平均产量为2;(1)两种肥料产量的方差未知但相等,即22时:12提出原假设和备择假设:H0:1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论