版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697
2、664681721720677679695691713699725726704729703696717688要求: (2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。灯泡的使用寿命频数分布表分组频数(只)频率(%)650-66022660-67055670-68066680-6901414690-7002626700-7101818710-7201313720-7301010730-74033740-75033合计1001003.某公司下属40个销售点2012年的商品销售收入数据如下: 单位:万元1521241291161001039295127104105119114115871
3、031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。解:(1) 频数分布表分组频数(个)频率(%)85-9537.595-105615.0105-115922.5115-1251127.5125-135410.0135-145512.5145-15525.0合计40100(2)茎叶图树茎树叶数据个数89101112131415782570334557880234556778990345679567
4、8262239127421第三章、练习题及解答1. 已知下表资料:日产量(件)工人数(人)工人比重(%)2530354045205080361410254018 7合 计200100试根据频数和频率资料,分别计算工人平均日产量。解: 计算表日产量(件)x工人数(人)f工人比重(%)f/fxfxf/f2520105002.530502515007.535804028001440361814407.2451476303.15合 计200100687034.35根据频数计算工人平均日产量:(件)根据频率计算工人平均日产量:(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2.某
5、企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件)单位数产量比重(%)101212141418234204238合计9100试计算这9个企业的平均单位成本。解:单位产品成本(元/件)单位数产量比重(%)f/f组中值(元)xxf/f1012220112.21214342135.461418438166.08合计9100-13.74这9个企业的平均单位成本=13.74(元)3.某专业统计学考试成绩资料如下:按成绩分组(分)学生数(人)60以下607070808090 90100 100以上 4 81420 9 5合 计60试计算众数、中位
6、数。解:众数的计算:根据资料知众数在8090这一组,故l=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, (分)中位数的计算:根据和向上累积频数信息知,中位数在8090这一组。(分)4.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)解: 计算表日产量(件)x工人数(人)f25201748.453050946.125358033.840361149.2145141587.915合 计2005465.55.一家公司在招收职员时,首先要通过两项能力测试。在a项测试中,平均分数是80分,标准差是15分;在b项测试中,平均分数是200分,
7、标准差是50分。一位应试者在a项测试中得了95分,在b项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?解:计算各自的标准分数:,因为a测试的标准分数高于b测试的标准分,所以该测试者a想测试更理想。第四章、练习题及解答1. 随机变量服从标准正态分布,求以下概率:(1);(2);(3)。2. 由30辆汽车构成的一个随机样本,测得每百公里的耗油量(单位:升)数据如下:9.1910.019.609.279.788.829.638.8210.508.839.358.6510.109.4310.129.399.548.519.710.039.499.489.369.1410.099.8
8、59.379.649.689.75绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。3. 从均值为200、标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?4. 从=0.4的总体中,抽取一个容量为500的简单随机样本,样本比例为。(1)的期望值是多少?(2)的标准差是多少?(3)的概率分布是什么?5. 假设一个总体共有6个数值:54,55,59,63,64,68。从该总体中按重置抽样方式抽取的简单随机样本。(1)计算总体的均值和方差。(2)一共有多少个可能的样本?(3)抽出所有可能的样本,并计算出每个样
9、本的均值。(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?第四章习题答案1.解:由于z服从标准正态分布,查表得,(1)(2)(3)2.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示:分组频数8.51-8.8028.81-9.1039.11-9.4079.41-9.7099.71-10.00310.01-10.30510.31-10.601对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。3.解:已知:,
10、同时由于样本量很大,可以看作重置抽样来处理。根据公式4.5可以得到:(1)(2),(3)根据中心极限定理,近似服从均值为200,标准差为5的正态分布。4.解:已知:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.7可以得到:(1)(2),;(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布。5.解:(1),;(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有种可能样本。(3)如下表所示:样本序号样本单位样本均值样本序号样本单位样本均值154,54541963,5458.5254,5554.52063,5559354,5956.52163,596145
11、4,6358.52263,6363554,64592363,6463.5654,68612463,6865.5755,5454.52564,5459855,55552664,5559.5955,59572764,5961.51055,63592864,6363.51155,6459.52964,64641255,6861.53064,68661359,5456.53168,54611459,55573268,5561.51559,59593368,5963.51659,63613468,6365.51759,6461.53568,64661859,6863.53668,6868(4)样本均值频
12、数表:分组频数54-56456-58458-60960-62762-64764-66366-682样本均值频数直方图:由上图可以发现,样本均值近似服从正态分布;(5)由样本方差均值公式可以得到:;可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周的时间里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求估计误差;(3)如果样本均值为120元,求快餐店所有顾客午餐平均花费金额的95%的置信区间。2. 利用下面的信息,构建总体均值的置
13、信区间。(1)总体服从正态分布,且已知,置信水平为95%。(2)总体不服从正态分布,且已知,置信水平为95%。(3)总体不服从正态分布,未知,置信水平为90%。(4)总体不服从正态分布,未知,置信水平为99%。3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时);3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90
14、%,95%和99%。4. 某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。应抽取多少户进行调查?5. 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待
15、。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66,76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310.0(1)构建第一种排队方式等待时间标准差的95%的置信区间。(2)构建第二种排队方式等待时间标准差的95%的置信区间。(3)根据(1)和(2)的结果,你认为哪种排队方式更好?6. 两个正态总体的方差和未知但相等。从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下:来自总体1的样本来自总体2的样本 求的置信区间,显著性水平分别为95%和99
16、%。7. 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:人员编号12345678910方法178637289914968768555方法271446184745155607739构建两种方法平均自信心得分之差的95%的置信区间。8. 从两个总体中各抽取一个的独立随机样本,来自总体1的样本比例为,来自总体2的样本比例为。 构造的置信区间,置信水平分别为90%和95%。9. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:机器1机器23.453.223.903.
17、223.283.353.202.983.703.283.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25 构造两个总体方差比的95%的置信区间。10. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?11. 假定两个总体的标准差分别为:,若要求估
18、计误差不超过5,相应的置信水平为95%,假定,估计两个总体均值之差时所需的样本量为多大?12. 假定,估计误差为0.05,相应的置信水平为95%,估计两个总体比例之差时所需的样本量为多大?第五章课后习题参考答案1.解:(1)已知,故:;(2)由题目可知:,故查表可知:估计误差;(3)由题目可知:,由置信区间公式可得: 即快餐店所有顾客午餐平均花费金额的95%的置信区间为(115.8,124.2)元。2.解:(1)总体服从正态分布,则的95%置信区间为:(2)总体不服从正态分布,且样本属于大样本,则的95%置信区间为:(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,则的90%置信区
19、间为:(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差, ,则的95%置信区间为:3.解:整理数据可以得到,由于属于大样本,所以使用正态分布来构建置信区间。当,该校大学生平均上网时间的90%置信区间为:小时当,该校大学生平均上网时间的95%置信区间为:小时当,该校大学生平均上网时间的95%置信区间为:小时4.解:(1)由题目可知:,由于抽取的样本属于大样本,所以,总体中赞成新措施的户数比例的95%置信区间为:(2)由题目可知:估计误差,得到:即样本个数至少为62户。或直接将带入n确定的公式,即,5.解:(1)整理数据可以得到:,由于抽取的样本属于小样本,所以由chiinv函数得:,
20、由此可以得到第一种排队方式等待时间标准差的95%的置信区间为:(2)整理数据可以得到:,第二种排队方式等待时间标准差的95%的置信区间为:(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到:当 ,的95%置信区间为:当,的95%置信区间为:7.解:由样本数据计算得到:,则自信心得分之差的95%的置信区间为:8.解:由题目可以得到:, 当,的90%置信区间为:当,的95%置信区间为:9.解:由题目可以得到:,两个总体方差比的95%的置信区间为: 10.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即
21、,在95%置信度下,估计误差,因此:即样本个数至少为139个。11.解:由题目可以得到:总体 已知,即,在95%置信度下,估计误差,因此: 即两个总体的样本各至少为57个。第六章、练习题及解答1. 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.70小时。取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?2. 为监测空气质量,某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空
22、气中悬浮颗粒的数值(单位:微克)如下:81.686.680.085.878.658.368.773.296.674.983.066.668.670.971.171.677.376.192.272.461.775.685.572.574.082.587.073.288.586.994.983.0 根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?3. 安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板进行测量,得到的重量(单位:公斤)数据如下:22.627.026.225.822.226.625.330.423.228.12
23、3.128.627.426.924.223.524.524.926.123.6 假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求。4. 对消费者的一项调查表明,17的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取550人,调查知其中115人早餐饮用牛奶。在显著性水平下,检验该生产商的说法是否属实。5. 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作a操作b分钟分钟分钟分钟 在的显著性水平下检验平均装配时间之差是否等于5分钟。6. 某市场研究机构用
24、一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为010分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对的显著性水平,用下列数据检验该假设,并对该广告给予评价。个体购买力得分个体购买力得分看后看前看后看前1655352646983777754438667. 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2对12名员工进行培训。培训后的测试分数如下:方法1方法256514559575347524352
25、5665425352535553504248546457474444 两种方法培训得分的总体方差未知且不相等。在的显著性水平下,检验两种方法的培训效果是否有显著差异。8. 为研究小企业经理是否认为他们获得了成功,在随机抽取的100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为39人。在的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异。9. 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:旧肥料新肥料10910197981001
26、051091101181099898949910411311111199112103881081021061061179910711997105102104101110111103110119取显著性水平,检验:(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:两种肥料产量的方差未知但相等,即。两种肥料产量的方差未知且不相等,即。 (2)两种肥料产量的方差是否有显著差异?10. 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存
27、在显著差异。()机器12.953.453.503.753.483.263.333.203.163.203.223.383.903.363.253.283.203.222.983.453.703.343.183.353.12机器23.223.303.343.283.293.253.303.273.383.343.353.193.353.053.363.283.303.283.303.203.163.33第六章课后习题参考答案1.解:由题目可以得到:,; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:; 在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为如今每
28、个家庭每天收看电视的平均时间较十年前显著增加了。 (或利用excel的“1-normsdist(3.1113)”函数得到检验p=0.00090.01,则拒绝原假设)2.解:由题目可以得到:,根据样本数据计算得到:,; 提出原假设与备择假设:,; 该检验属于左侧单边检验,因此得到拒绝域为:;在大样本且总体方差未知条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。 (或利用excel的“normsdist(-2.3949)”函数得到检验p=0.00830.05,则不能拒绝原假设)4.解:由题目可以得到:,计算样本数据得到; 提出原假设与备择假
29、设:,; 该检验属于右侧单边检验,因此得到拒绝域为:;在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1-normsdist(2.4412)”函数得到检验p=0.00730.05,则拒绝原假设)5.解:提出原假设与备择假设:,;在大样本条件下检验统计量为:利用“2*(1-normsdist(5.1450)”函数,得到双尾值为,由于,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。6.解:设:“看后”平均得分为 ,“看前”平均得分,“看后”平均得分与“看前”平均得分之差为; 提出原假设与备择假设:,
30、; 根据样本数据计算得到:,;在配对的小样本条件下检验统计量为:利用excel “=tdist(1.3572, 7, 1)”得到的单尾概率值为0.10842,由于,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。7.解:设:方法一培训测试平均得分为,方法二培训测试平均得分为; 提出原假设与备择假设:,;根据样本数据计算得到:,由于小样本情况下总体方差未知且不相等,t分布自由度为:在小样本条件下检验统计量为:利用excel的“=tdist(5.2183, 24, 2)”函数,得到的双尾概率值为0.00002,由于,拒绝原假设,认为两种培训方法的效果存在显著差异。8.解: 设:男性经理认
31、为自己成功的人数比例为 , 女性经理认为自己成功的人数比例为,两个样本合并后得到的合并比例为; 提出原假设与备择假设:,;根据样本数据计算得到:两个样本的比例分别为:41,24两个样本合并后得到的合并比例;检验统计量为:利用excel的“=2*(1-normsdist(2.5373)”函数,得到检验概率值为0.0112,由于,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。9.解:设:新肥料获得的平均产量为,旧肥料获得的平均产量为;(1)两种肥料产量的方差未知但相等,即时:提出原假设和备择假设: ; 根据样本数据计算得:, ,; 总体方差的合并估计量为: 检验统计量为: 利用e
32、xcel的“=tdist(5.4271, 38, 1)”函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由excel中的t-检验:双样本等方差假设给出)两种肥料产量的方差未知且不相等,即时: 提出原假设与备择假设:;根据样本数据计算得到:, ,由于小样本情况下总体方差未知且不相等,t分布自由度为:在小样本条件下检验统计量为:利用excel的“=tdist(5.4271, 37, 1)”函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由excel中的t-检验:双样本异方差假
33、设给出)(2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1 提出原假设与备择假设:;利用excel中的“-检验:双样本方差”()得到的检验结果如下表所示:f-检验 双样本方差分析变量 1变量 2平均109.9100.7方差33.3578924.11579观测值2020df1919f1.383239p(f=f) 单尾0.24311f 单尾临界2.526451由于,不能拒绝原假设,没有证据表明两种肥料产量的方差有显著差异。10.解:设:机器一为样本1,机器二为样本1 提出原假设与备择假设:; 利用excel的“-检验:双样本方差”()得到的检验结果如下表所示:f-检验 双样本方差分析变量
34、 1变量 2平均3.32843.278181818方差0.0488890.005901299观测值2522df2421f8.284447623p(f=f) 单尾3.61079e-06f 单尾临界2.367525575由于,拒绝原假设,认为两种肥料产量的方差有显著差异。第七章、练习题及解答1.从某市的三个小学中分别抽若干名5年级男生,测量其身高,数据如下,小学身高(cm)大成小学平明小学师范附小128 135 148 152 146 135 148145 156 162 157 136145 136 139 148 164 142试检验不同小学5年级男生身高有无显著差别(a =0.05)解:设三
35、个小学的5年级男生的平均身高分别为。提出假设: 不全相等 由excel输出的方差分析表如下:差异源ssdfmsfp-valuef crit组间262.43812131.2191.3885010.2797343.68232组内1417.5621594.50413总计168017p-value=0.279734a =0.05,(或者f=1.388501f crit=3.68232),不能拒绝原假设,没有证据表明该市3所小学5年级的男生身高有显著差异。2.某家电制造公司准备购进一批5#电池,现有a、b、c三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命
36、(小时)数据见下表:试验号电池生产企业abc15032452502842343303844034485392640试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用lsd方法检验哪些企业之间有差异? (a =0.05)解:a、b、c三个企业生产的电池的平均寿命分别为。提出假设: 不全相等由excel输出的方差分析表如下:方差分析差异源ssdfmsfp-valuef crit组间615.62307.817.068390.000313.885294组内216.41218.03333总计83214p-value=0.00031a =0.05(或f=17.06839f crit=3.8
37、85294),拒绝原假设。表明电池的平均寿命之间有显著差异。为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:检验1:检验2:检验3:然后计算检验统计量:计算lsd。根据方差分析表可知,mse=18.03333.根据自由度=n-k=15-3=12.查t分布表得计算的lsd如下:作出决策。lsd=5.85,拒绝原假设。企业a与企业b电池的平均使用寿命之间有显著差异。lsd=5.85,不拒绝原假设。没有证据表明企业a与企业c电池的平均使用寿命之间有显著差异。lsd=5.85,拒绝原假设。企业b与企业c电池的平均使用寿命之间有显著差异。3.某企业准备用三种方法组装一种新的产品,为
38、确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,平均分为三组,并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。差异源ssdfmsfp-valuef crit组间(420)(2)210(1.478)0.2459463.354131组内3836(27)(142.07)-合计(4256)29-要求:(1)完成上面的方差分析表。(2)检验三种方法组装的产品数量之间是否有显著差异? (a=0.05)解:(1)差异源ssdfmsfp-valuef crit组间(420)(2)210(1.478)0.2459463.354131组内3836(27)(142.0
39、7)-合计(4256)29-(2)由方差分析表可知:p-value=0.245946a=0.05,(或f=1.478f crit=3.354131,不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。4.某农场在不同的地块试种四个品种的谷子,试验数据如下(单位:千克/亩),试检验地块类型和谷子品种是否对平均亩产量有影响(0.05)。太行2号冀丰2号冀丰3号农科9号农科12号洼地坡地平地225156320210198351198265298152210302205236261解:设不同地块的平均亩产量分别为:提出假设: 不全相等设不同品种的平均亩产量分别为提出假设: 不全相等由e
40、xcel输出的方差分析表如下:方差分析差异源ssdfmsfp-valuef crit行34498.53217249.2711.744710.0041664.45897列2329.7334582.43330.3965680.8060543.837853误差11749.4781468.683总计48577.7314p-value=0.00140.05(或f=11.74471 f crit=4.45897),拒绝原假设。表明不同品种的种子对亩产量的影响显著。 p-value=0.8060540.05(或f=0.396568f crit=3.837853),不拒绝原假设。没有证据表明不同地块类型对亩产
41、量有显著差异。5.为研究食品的包装和销售地区对其销售量是否有影响,在某周的3个不同地区中用3种不同包装方法进行销售,获得的销售量数据见下表:销售地区(a )包装方法(b )b1b2b3a1457530a2505040a3356550检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响? (a =0.05)解:设不同地区的平均销售量分别为提出假设: 不全相等 设不同包装方式的平均销售量分别为提出假设: 不全相等由excel输出的方差分析表如下:方差分析差异源ssdfmsfp-valuef crit行22.22222211.111110.0727270.9310566.944272列955
42、.55562477.77783.1272730.1521556.944272误差611.11114152.7778总计1588.8898 p-value=0.931056a =0.05(或f=0.072727 f crit=6.944272),不拒绝原假设,没有证据表明不同地区对该食品的销售量有显著影响。 p-value=0.152155a =0.05(或f=3.127273 f crit=6.944272),不拒绝原假设,没有证据表明包装方式对该食品的销售量有显著影响。第八章、练习题及解答1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业
43、编号产量(台)生产费用(万元)12345640425055657813015015514015015478910111284100116125130140165170167180175185要求:(1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。(2) 计算产量与生产费用之间的相关系数。(3) 对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系强度。解:(1)产量与生产费用散点图100150200205080110140170产量生产费用散点图表明产量与生产费用两变量之间为正线性相关。(2)设产量为x,生产费用为y,产量与生产费用之间的相关系数: 两变量为高度正相关关系
44、。(3)相关系数的显著性检验如下:第1步,提出假设。原假设;备择假设第2步,计算检验统计量。第3步,给定显著性水平,查表确定临界值2.228。第4步,做出统计决策。由于,则拒绝原假设,说明产量与生产费用之间的线性关系显著。2.设。要求:(1)计算判定系数,并解释其意义。解:=其意义为: =90%表示,在因变量y取值的变差中,有90%可以由x和y之间的线性关系来解释。(2)计算估计标准误差,并解释其意义。 其意义:=0.5表示,当用x来预测y时,平均的预测误差为0.5.3.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,为此,抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(
45、单位:公里)和运送时间(单位:天)的数据如下:运送距离825 215 1070 550 480 920 1350 325 670 1215运送时间3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0(1) 绘制运送距离和运送时间的散点图,判断二者之间的关系形态。解答:距离和运送时间的散点图:货物运送距离与时间散点图0123456050010001500距离时间 运送距离与时间大致呈正的线性相关关系。(2) 计算相关系数,说明两个变量之间的关系强度。相关系数:表明运输距离与运送时间之间有较强的正的线性相关关系。(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。设两变量之间的线性回归方程为:得到的回归方程为:回归系数表示运送距离每增加1公里,运送时间平均增加0.003583天。(4) 计算判定系数,并解释其意义。=99.75-102.852 =18.525=0.1182328.5+0.00358326370-102.852=16.681=99.75-0.1182328.5-0.00358526370=1.843995判定系数判定系数等于90%表示,在因变量运送时间取值的变差中,有90%可以由运送距离和运输时间之间的线性关系来解释。(5) 检验回归方程的线性关系 (a=0.05)。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石河子大学《影像诊断学》2023-2024学年第一学期期末试卷
- 石河子大学《数据库管理》2021-2022学年期末试卷
- 石河子大学《景观生态学原理》2022-2023学年第一学期期末试卷
- 沈阳理工大学《数据库原理》2023-2024学年期末试卷
- 沈阳理工大学《化工原理A》2021-2022学年第一学期期末试卷
- 沈阳理工大学《电路实验》2021-2022学年期末试卷
- 沈阳理工大学《产品语义学应用设计》2021-2022学年第一学期期末试卷
- 沈阳理工大学《nux系统程序设计》2023-2024学年期末试卷
- 合伙承包高钙粉合同
- 同步新课堂高中历史专题二近代中国维护国家主权的斗争课时训练7伟大的抗日战争含解析人民版必修1
- 外科手术中肝脏切除技术讲解
- 驾校年度安全生产目标方案
- 2024年插花花艺师理论知识考试题库(含答案)
- 干部履历表(中共中央组织部2015年制)
- 自身免疫性脑炎护理
- 2024年基因编辑技术的伦理问题
- “订餐协议书:团体订餐服务合作协议”
- 材料力学课程导学与考研指导
- 小学各年级小学一年级提高思维能力的方法主题班会
- 宣传栏安装施工方案
- 张晓风散文自选集
评论
0/150
提交评论