统计学1-6章答案讲解_第1页
统计学1-6章答案讲解_第2页
统计学1-6章答案讲解_第3页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章、练习题及解答1. 某商品专卖店 2012 年 10 月 8 日销售流水帐如下销售单号销售员姓名性别销售型号单价销售数量销售额071008001赵灵儿女C型120011200071008002赵灵儿女C型120011200071008003李逍遥男A型8001800071008004林月如女B型100011000071008005赵灵儿女A型8001800071008006赵灵儿女C型120011200071008007林月如男A型8001800071008008李逍遥女C型120011200071008009李逍遥女A型8001800071008010赵灵儿女B型10001100007

2、1008011林月如男C型120011200071008012林月如女C型120011200071008013赵灵儿女A型8001800071008014林月如女C型120011200071008015赵灵儿女C型120011200要求: (1) 利用 excel 软件,分别按销售员和销售型号进行分类汇总。(2)利用 excel 软件, 按销售员统计其不同销售型号的销售量与销售额(数据透视表)解: (1)按销售型号进行汇总销售单号销售员姓名性别销售型号单价销售数量销售额71008003李逍遥男A型800180071008005赵灵儿女A型800180071008007林月如男A型8001800

3、71008009李逍遥女A型800180071008013赵灵儿女A型8001800A 型 汇总5400071008004林月如女B型10001100071008010赵灵儿女B型100011000B 型 汇总2200071008001赵灵儿女C型12001120071008002赵灵儿女C型12001120071008006赵灵儿女C型12001120071008008李逍遥女C型12001120071008011林月如男C型12001120071008012林月如女C型12001120071008014林月如女C型12001120071008015赵灵儿女C型120011200C 型 汇总

4、89600总计1515600(2) 按销售员统计其不同销售型号的销售量与销售额(数据透视表)销售员销售型号数据A型B型C型总计李逍遥销售数量2013销售额1600012002800林月如销售数量1135销售额800100036005400赵灵儿销售数量2147销售额1600100048007400销售数量合计52815销售额合计400020009600156002. 为了确定灯泡的使用寿命(小时) ,在一批灯泡中随机抽取 100 只进行测试,所得结果如下:7007167287196857096916847057187067157127226917086906927077017087296946

5、81695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688要求: (1) 利用 excel 软件,对以上数据进行排序。(2) 以组距为 10 进行等距分组,生成频数分布表,并绘制直方图。解: (1)

6、 数据排序结果(升序)6516586616646656666686716736746766776796816816826836836836846856856856886886896896906906916916916916926926926936936946946956956966966966976976986986986986996997007007017017027027037047057067067067077077087087087097107107127127137137157167177177187187197207217227227257267277287297297337357

7、36741747749(2)灯泡的使用寿命频数分布表分组频数(只)频率( % )650-66022660-67055670-68066680-6901414690-7002626700-7101818710-7201313720-7301010730-74033740-75033合计100100直方图3. 某公司下属 40 个销售点 2012 年的商品销售收入数据如下: 单位:万元152124129116100103929512710410511911411587103118142135125117108105110107137120136117108978812311511913811214

8、6113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。(2)制作茎叶图,并与直方图进行比较。解:( 1)频数分布表分组频数(个)频率( % )85-9537.595-105615.0105-115922.5115-1251127.5125-135410.0135-145512.5145-15525.0合计4010095 105 115 125 135 145 155直方图或:2)茎叶图树茎树叶数据个数8782925731003345578891102345567789912120345679713567841426215214.2006 2011 年我国就业人口人员

9、数(年底数)如下表所示:年份就业人员三次产业就业人数(万人)第一产业第二产业第三产业200674978319411889424143200775321307312018624404200875564299232055325087200975828288902108025857201076105279312184226332201176420265942254427282要求 : (1)利用 excel 软件,绘制就业人数的条形图。(2)分别绘制一、二、三次产业就业人数的条形图并比较分析。(3) 根据 2006 年和 2011 年这两年就业人数的三次产业构成数据,分别绘制饼形图并 比较分析 。解

10、: (1)20062007 2008 2009 20102011就业人员 (万人)7700076500人万(数) 76000755007500074500年份74000我国就业人数条形图2)、三产业就业人数条形图请自己绘制。(3)201120102009200820072006就业人数三次产业就业人数条形图24143, 32%31941, 43%18894, 25%2006年三次产业就业人数构成第三产业 第二产业 第一产业万人)第一产业 第二产业 第三产业27282, 35%2011年三次产业就业人数构成第一产业就业人数及其比重下降,第二、三产业人数比重上升。具体情况自己分析。第三章、练习题及

11、解答1. 已知下表资料:日产量(件) 工人数(人)工人比重( % )25201030502535804040361845147合计200100试根据频数和频率资料,分别计算工人平均日产量。解: 计算表日产量(件) x工人数(人)f工人比重(%)f/fxfxf/ f2520105002.530502515007.535804028001440361814407.2451476303.15合计200100687034.35根据频数计算工人平均日产量: x xf 6870 34.35(件) f 200根据频率计算工人平均日产量: x xg f34.35 (件)结论:对同一资料,采用频数和频率资料计算

12、的变量值的平均数是一致的。2. 某企业集团将其所属的生产同种产品的9 个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元 / 件)单位数产量比重( % )10 1222012 1434214 18438合计9100试计算这 9 个企业的平均单位成本。解:单位产品成本(元 /件)单位数产量比重( % )f/f组中值(元) xX·f/f1012220112.21214342135.461418438166.08合计9100-13.74这 9 个企业的平均单位成本 = x xg f =13.74 (元)3. 某专业统计学考试成绩资料如下:按成绩分组(分)学生数(人)60

13、以下460708708014809020901009100以上560试计算众数、中位数。解:众数的计算:根据资料知众数在 80 90 这一组,故 L=80 , d=90-80=10,fm=20,fm-1=14,fm+1=9,M o L fmmm 1 fmm1dm120 1480 10 83.53 (分 )20 14 20 9中位数的计算:f 60根据 60 30 和向上累积频数信息知,中位数在 80 90 这一组。 22fSSm 130 26d 80 10 82 (分)me204. 利用练习题 1 题资料计算 200 名工人日产量的标准差,并计算离散系数。 (只按照频数计算即可)解: 计算表日

14、产量(件) x工人数(人) f(x x)2 f25201748.453050946.125358033.840361149.2145141587.915合计2005465.52x x f 5465.5 27.32752002 27.3275 5.235.23v 100% 100% 15.23%x 34.35A 项测试中,平均分数是 80 分,5. 一家公司在招收职员时,首先要通过两项能力测试。在标准差是 15 分;在 B 项测试中,平均分数是 200 分,标准差是 50 分。一位应试者在 A 项 测试中得了 95 分,在 B 项测试中得了 225 分。与平均分数相比, 该位应试者哪一项测试更

15、为理想?解:计算各自的标准分数: zA 95 80 1, ZB 225 200 0.515 50因为 A 测试的标准分数高于 B 测试的标准分,所以该测试者 A 想测试更理想。第四章 练习题及解答1. 解:由于 Z 服从标准正态分布,查表得NORMSDIST(0) 0.5, NORMSDIST(1.2) 0.8849, NORMSDIST(0.48) 0.6844, NORMSDIST(1.2) 0.8849,NORMSDIST(1.33) 0.9082(1)P(0 Z 1.2) NORMSDIST (1.2) NORMSDIST (0) 0.8849 - 0.5 0.3849 P( 0.48

16、 Z 0) NORMSDIST (0) NORMSDIST( - 0.48)(2)NORMSDIST (0)-1 NORMSDIST (0.48) 0.1844 (3) P(Z 1.33) 1 P(Z 1.33) 1 NORMSDIST (1.33) 0.0918 2.解:对数据进行整理, 30 个样本数据极差为 1.99 。将数据分为 7 组,组距为 0.3,如下 表所示:分组频数8.51-8.8028.81-9.1039.11-9.4079.41-9.7099.71-10.00310.01-10.30510.31-10.601对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为

17、汽车耗油量基本服从正态分布。3.解:已知:22200 ,n 100 , 2 502 2500 ,同时由于样本量很大,可以看作重置抽样来处理。根据公式 4.5 可以得到:1) E(x) x 200x250010025 ,x3)根据中心极限定理, x近似服从均值为 200 ,标准差为 5 的正态分布。4.解:已知:0.4,n 500 ,同时由于样本量很大,可以看作重置抽样来处理。根据公式 4.7 可以得到:(1)E(p)0.42 (1 ) 2(2 ) p0.00048, p p 0.0219 ;n(3)根据中心极限定理, p 近似服从均值为 0.4,标准差为 0.0219 的正态分布。5.解:6x

18、ii 1 i 54 55 59 63 64 68(1) x i 1 60.5 , N66(xi x)22 i 1 24.9167 ; 2 4.9917N(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有62 36 种可能样本。( 3 )如下表所示:样本序号样本单位样本均值 x样本序号样本单位样本均值 x154,54541963,5458.5254,5554.52063,5559354,5956.52163,5961454,6358.52263,6363554,64592363,6463.5654,68612463,6865.5755,5454.52564,5459855,55552664

19、,5559.5955,59572764,5961.51055,63592864,6363.51155,6459.52964,64641255,6861.53064,68661359,5456.53168,54611459,55573268,5561.51559,59593368,5963.51659,63613468,6365.51759,6461.53568,64661859,6863.53668,68684)样本均值频数表:分组频数54-56456-58458-60960-62762-64764-66366-682样本均值频数直方图:由上图可以发现,样本均值近似服从正态分布;5)由样本方差

20、均值公式可以得到:36xi536(xii1x)36472.253612.45833 ;3.529636n可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答151.解:( 1 )已知15,n 49 ,故: x 2.1429 ;n7(2)由题目可知:0.05 ,故查表可知: ZZ0.025 1.962估计误差 Z x 1.96 2.1429 4.2 ;x2(3)由题目可知: x 120 ,由置信区间公式可得:x Z x 120 4.2 (115.8,124.2)2即快餐店所有顾客午餐平均花费金额的 95%的置信区间为( 115.8 ,124

21、.2 )元。2.解:(1)总体服从正态分布, ZZ0.025 1.96,则 的 95%置信区间为:2x Z x 8900 1.96 129.0994 (8646.9652 ,9153.0348 )2(2)总体不服从正态分布,且样本属于大样本,ZZ0.025 1.96 ,则 的 95%置信区2间为:x Z x 8900 1.96 84.5154 (8734 .3498 ,9065 .6502 )2(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差, Z Z0.05 1.645 ,2则 的 90% 置信区间为:xZ2n8900 1.645 8 4.5154( 8760 .9722 ,90

22、39.0278 )ZZ0 .025 1.96 ,23.解:整理数据可以得到xn 36 , x 3.3167 ,n(x x)2 s n 11.6093 ,由于4 )总体不服从正态分布, 未知,因此使用样本方差代替总体方差, 则 的 95% 置信区间为:sx Z 8900 1.96 84.5154 (8734.3498,9065.6502 ) 2nn 36 属于大样本,所以使用正态分布来构建置信区间。当 ZZ0.05 1.645 ,该校大学生平均上网时间的 90% 置信区间为:2sx Z 3.3167 1.645 0 .2682 (2.8755,3.7579) 小时 2n当 ZZ0.025 1.9

23、6 ,该校大学生平均上网时间的 95% 置信区间为:2sx Z 3.3167 1.96 0.2682 ( 2.7910 ,3.8424 )小时 2n当 ZZ0.025 2.58,该校大学生平均上网时间的95% 置信区间为:2sx Z 3.3167 2.58 0.2682 (2.6244,4.0089) 小时 2n4.解:p(1 p) 0.0679 ,由于抽取的样 n321)由题目可知: n 50, p 3502 0.64, p本属于大样本, 所以 ZZ0.025 1.96 ,总体中赞成新措施的户数比例的 95%置信区间为:2p Z2p(1 p) 0.64 1.96 0.0679 (0.5069

24、,0.7731)2)由题目可知:估计误差 d Z p(1 p) 10% 0.1,p 0.8,ZZ0.025 1.96 ,2 n 2得到:Z2 p(1n p) 0.11.96 0.(81n-0.8) 0.161.5385 n即样本个数至少为 62 户。或直接将 d 0.1带入 n 确定的公式,即,22n (z /2)2 2(1 ) 1.962 0.8 2(1 0.8) 61.54 62 d 20.125.解:(1)整理数据可以得到: n 10, x1 7.15, s12 0.2272 ,由于抽取的样本属于小22 22样本,所以由 CHIINV 函数得: 202.025(9) 19.0228, 2

25、02.975 (9) 2.7004,由2 1 2此可以得到第一种排队方式等待时间标准差的 95% 的置信区间为:22(n 1)s12(n 1) s122221220.33 0.8722)整理数据可以得到:n 10, x2 7.15 , s22 3.8183 ,第二种排队方式等待时间标准差的 95% 的置信区间为:2( n 1)s222(n 1)s21.25 3.333)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到:22 ( n1 1) s1 (n2 1) s2 n1 n2 29.9218当t (n1 n2

26、2) t0.975(19) 2.093 ,( 1- 2)的 95%置信区间为:12(x1x2 ) t0.975(19)sw119.8 2.093 9.9218 11(0.1871,19.4129)n1n2 147当t (n1 n2 2) t 0.995 (19) 2.8609 , ( 1- 2)的 95%置信区间为:12( x1 x2 ) t0.995 (19)sw 1 1 (53.2 43.4) 2.8609 9.9218 n1 n2( 3.3398 ,22 .9398 )7.解:由样本数据计算得到:d 11011, sd10i 1(di d)2nd 13846.53 ,t (10 1) 2

27、.262210 1则自信心得分之差 d 1 - 2的 95% 的置信区间为:d t0.025 (9) sd 11 2.262 6.53 11 4.67 (6.33,15.67) 0.025 108.解:由题目可以得到: n1 n2 250 , p1 0.4 , p2 0.3 ,当ZZ0.95 1.645 , ( 1- 2)的 90%置信区间为:p1p2Z 0.95p1(1 p1) p2 (1 p2)n2(3.021%,16.98%)当 Z Z0.975 1.96 , ( 1 - 2) 的 95% 置信区间为:2p1p2Z0.975p1(1 p1) p2 (1 p2)n1n2(1.684%,18

28、.32%)2, s22 0.005265 ,2s12s2F (n1 1, n2 1)22122222s1222s2 F (n1 1, n2 1)1210.解:由题目可以得到:17.41231222227.3223使用过去经验数据,则可以认为已知,即 120 ,在 95%9. 解:由题目可以得到: n1 n2 21, s12 0.058375F (n1 1, n2 1) F0.025(20,20) 2.4645, F (n1 1,n2 1) F0.975 ( 20,20) 0.4058 2122两个总体方差比 12 / 22的 95% 的置信区间为:Z 0. 97520 n2n置信度下 Z Z0

29、.025 1.96 ,估计误差 Z 20 ,因此:1.96 120 20138.2976 n即样本个数至少为 139 个。11.解:由题目可以得到:总体已知,即 1 12, 2 15 , n1 n2 n,在 95%置信度下 ZZ0.025 1.96 ,估计误差2因此:0.025n1 n2221.96122 152n56.7020 n即两个总体的样本各至少为 57 个。第六章、练习题及解答1.解:由题目可以得到: n 200 ,2.5;提出原假设与备择假设: H0 :6.7,H1: 6.7;该检验属于右侧单边检验,因此得到拒绝域为: W z z1z0.99 2.3263 ;在大样本条件下检验统计

30、量为:xz 0 3.1113 2.32563 ,落入拒绝域中,因n此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。或利用 Excel 的“1-NORMSDIST(3.1113) ”函数得到检验 P=0.0009<0.01 ,则拒绝原 假设)2.解:由题目可以得到: n 32 ,根据样本数据计算得到: s 9.1979, x 78.10625;提出原假设与备择假设: H0 :82,H1:82;该检验属于左侧单边检验,因此得到拒绝域为:W z z z0.01 2.3264 ;x在大样本且总体方差未知条件下检验统计量为:z 0 2.3949 2.325 ,落入sn拒绝域

31、中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。(或利用 Excel 的“NORMSDIST(-2.3949) ”函数得到检验 P=0.0083<0.01 ,则拒绝原假 设)3.解:由题目可以得到: n 20,计算样本数据得到 s 2.1933, x 25.51;提出原假设与备择假设: H0 :25, H1:25;该检验属于双边检验,因此得到拒绝域为: W z z z0.025 1.96 ;2在服从正态分布的小样本且总体方差未知条件下检验统计量为:z x 1.0399 1.96 ,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产sn的金属板不符合要求。(

32、或利用“TDIST(1.04,19,2) ”函数得到检验 P=0.3114>0.05 ,则不能拒绝原假设)n 1154.解:由题目可以得到: n 550,计算样本数据得到 p 020.91% ;n 550提出原假设与备择假设: H0 :17%,H1 :17%;该检验属于右侧单边检验,因此得到拒绝域为: W z zz0.025 1.96 ;2p在大样本条件下检验统计量为: z 0 2.4412 1.96 ,落入拒绝域中,0(1 0 )因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17% 。或利用“1-NORMSDIST(2.4412) ”函数得到检验 P=0.007

33、3<0.05 ,则拒绝原假设)在大样本条件下检验统计量为:(x1 x2) ( 12)z 1 2 1 2 5.1450 22 s12 s22n1 n25.解:提出原假设与备择假设: H0 : 1 2 5,H1: 1 2 5;利用“2*(1-NORMSDIST(5.1450) ”函数,得到双尾 P 值为 2.6752 10 7 ,由 于P0.05,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5 分钟。6.解:设:“看后”平均得分为 1 ,“看前”平均得分 2 ,“看后”平均得分与“看前”平均得分之差为d;提出原假设与备择假设:nndi(di d)2d i 10.625, sdi11.

34、3025;n1根据样本数据计算得到:H0 : 1 2 0,H1: 1 2 0;t 10.3602255 1.3572在配对的小样本条件下检验统计量为:利 用 Excel “=TDIST(1.3572,7, 1) ”得 到 的 单 尾 概 率 P 值 为 0.10842 , 由 于P0.05 ,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。7.解:设:方法一培训测试平均得分为1,方法二培训测试平均得分为2 ;提出原假设与备择假设: H0 : 1 2 0,H1: 1 2 0;根据样本数据计算得到:22 n1 15,n2 12, x1 47.7333 , x2 56.5, s12 19.

35、4952 , s22 18.2727由于小样本情况下总体方差未知且不相等, t 分布自由度为:22(s1 s2 )2n1 n222(s1 )2(s2)224n1n2n1 -1 n2 -1在小样本条件下检验统计量为:t (x1-x2)-( 1- 2) 5.218322sn11 s2n2利用 Excel 的“=TDIST(5.2183,24, 2)”函数,得到的双尾概率 P值为 0.00002 ,由于P 0.05 ,拒绝原假设,认为两种培训方法的效果存在显著差异。8. 解: 设:男性经理认为自己成功的人数比例为1 , 女性经理认为自己成功的人数比例 为 2 ,两个样本合并后得到的合并比例为 p ;

36、提出原假设与备择假设:H0 : 1 2 0, H1: 1 2 0;根据样本数据计算得到:两个样本的比例分别为:p1 41, p2 24 两个样本合并后得到的合并比例 p n1p1 n2 p2 32.31% ;n1 n2检验统计量为:zp1-p22.5373p(1-p)( n11 n12 )利用 Excel 的“=2*(1-NORMSDIST(2.5373) ”函数,得到检验概率 P 值为 0.0112 ,由于 P 0.05 ,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。9. 解:设:新肥料获得的平均产量为1 ,旧肥料获得的平均产量为2;(1)两种肥料产量的方差未知但相等,即1222 时:提出原假设和备择假设: H0 : 1 2 0;H1: 1 2 0 ; 根据样本数据计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论