统计学课后习题答案_第1页
统计学课后习题答案_第2页
统计学课后习题答案_第3页
统计学课后习题答案_第4页
统计学课后习题答案_第5页
已阅读5页,还剩161页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1BCBBCBEBBCEBCECECCECECBBEEEECCCBCECBECBEE(2)用Excel制作一张频数分布表。直方图频率40频率0接收频率 250频数累计频率(%)0022359264213977.596364频数频数频数86420频数<=2526-3031-3536-4041-4546+销售收入540data3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如单位:g5746495455584951495160525451556056474765351485350524045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:(1)构建这些数据的频数分布表。(2)绘制频数分布的直方图。(3)说明数据分布的特征。33977组距3,小于20FrequencyFrequencyMean=5.22Std.Dev.=1.508N=100组距3,小于117818Frequency4020Mean=4.06StdFrequency4020Mean=4.06Std.Dev.=1.221N=1000组距4,小于等于19组距5,小于等于40FrequencyFrequency20Mean=2.57Std.Dev.=0.935N=100组距5,小于等于3.8下面是北方某城市1——2月份各天气温的记录数据:278905605275要求:(1)指出上面的数据属于什么类型。数值型数据(2)对上面的数据进行适当的分组。89747817(3)绘制直方图,说明该城市气温分布的特点。频数886a频数4-25--21-20--16-15--11-10--6-5--10-45-910+864209x234187yyy50x3.12甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:优36良6中99842要求:(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。86420 8342.人数乙班2643486999优良。中。及格不及格(2)比较两个班考试成绩分布的特点。甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。(3)画出雷达图,比较两个班考试成绩的分布是否相似。不及格5o不及格5o优00及格良3.14已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):单位:亿元67884.674462.678345.282067.589468.197314.816928.120768.07(1)用Excel绘制国内生产总值的线图。国内生产总值160000140000120000100000800006000040000200000国内生产总值20002001200220032004(2)绘制第一、二、三产业国内生产总值的线图。800007000060000500004000030000200000第一产业 u第二产业第三产业2000200120022003200420002001200220032004(3)根据2004年的国内生产总值及其构成数据绘制饼图。国内生产总值20768.07,43721,32%第一产业第二产业第三产业72387,53%汽车销售数量NValidMissing0Mean9.60Median10.00ModeStd.Deviation4.169Percentiles2550756.2510.0012.50HistogramFrequencyFrequency2.557.510Mean=9.6Std.Dev.=4.169N=1011213143291232711111111Mean=24.00;Std.DeviatiCountCount网络用户的年龄CountCount网络用户的年龄2、确定组距:组距=(最大值-最小值)÷组数189932117FrequencyFrequency组中值第二种排队方式的等待时间(单位:分钟)Stem-and-LMean7百货公司每天的销售额(万元)NValidMissing300Mean274.1000Median272.5000Std.Deviation21.17472Percentiles255075260.2500272.5000291.2500单位成本总成本(元)A23B31C11ABC按利润额分组(万元)企业数(个)200~300300~400400~500500~600企业利润组中值Mi(万元)NValidMeanMissing426.6667Std.Deviation116.48445Skewness0.208Std.ErrorofSkewness0.221Kurtosis-0.625Std.ErrorofKurtosis0.438Histogram40FrequencyFrequency20Mean=426.67Std.Dev.=116.484N=120200.00300.00400.00500.00600.00700.00企业利润组中值Mi(万元)4.7为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~(2)两位调查人员所得到的样本的标准差是否相同?如果不同,(4)粗略地估计一下,女生中有百分之几的人体重302222222(1)如果比较成年组和幼儿组的身高差异,你会采用什4.12一种产品需要人工组装,现标准差2.131397932标准差1.751190072标准差2.7740292174.13在金融证券领域,一项投资期收益率的变化越小,投资风险越低;预期收益率的(2)如果选择风险小的股票进行投资,应该选择商业类(3)如果进行股票投资,你会选择商业类=P(-0.9≤z≤0.9)=2φ(0.9)-1,查标准正态分布表得φ(0.9)=0.8159因此,P(x-μ≤0.3)=0.6318设Z1,Z2,ⅆⅆ,Zn是来自总体N(0,1)的样本,则统计量x2=Z+Z+…+Z因此,令x2=,则x2=那么由概率=0.95,可知:b=x-0.95(6),查概率表得:b=12.5910个观测值我们可以求出样本方差确定一个合适的范围使得有p(b1≤S2≤b2)=0.90~x2(n-1)PP(x-α2(n-1)≤9S2≤x2(n-1))=1-α查概率表:x95(9)=3.325,x05(9)=19.919,则(2)在95%的置信水平下,求边际误差。.σx=zα2.σx=z0.025.σx=1.96×2.143=4.2(x-Δx,x+Δx)=(120-4.2,120+4.2)=(115.8,124.2)大样本,样本均值服从正态分布:x□N或x□置信区间为=1.2(1)构建μ的90%的置信区间。zα2=z0.05=1.645,置信区间为:(81-1.645×1.2,81+1.645×1.2)=(79.03,82.97)(2)构建μ的95%的置信区间。zα2=z0.025=1.96,置信区间为:(81-1.96×1.2,81+1.96×1.2)=(78.65,83.35)(3)构建μ的99%的置信区间。zα2=z0.005=2.576,置信区间为:(81-2.576×1.2,81+2.576×1.2)=(77.91,84.09)36人,调查他们每天上网的时间,得到下面的%,(1)样本均值x=3.32,样本标准差s=1.61;σ≈σ≈s=1.61/6=0.268σx=1α=0.9,t=zα2=z0.05=1.6451α=0.95,t=zα2=z0.025=1.961α=0.99,t=zα2=z0.005=2.576.σx=zα2.σx1α=0.9,Δx=t.σx=zα2.σx=z0.05.σx重复抽样:Δx=zα2.σx=z0.05.σx=1.645×0.268=0.441不重复抽样:Δx=zα2.σx=z0.05.σx=1.645×0.267=0.4391α=0.95,Δx=t.σx=zα2.σx=z0.025.σx重复抽样:Δx=zα2.σx=z0.025.σx=1.96×0.268=0.525不重复抽样:Δx=zα2.σx=z0.025.σx=1.96×0.267=0.5231α=0.99,Δx=t.σx=zα2.σx=z0.005.σx重复抽样:Δx=zα2.σx=z0.005.σx=2.576×0.268=0.69不重复抽样:Δx=zα2.σx=z0.005.σx=2.576×0.267=0.688(xΔx,x+Δx)1α=0.9,1α=0.95,1α=0.99,1α=0.95,n=16,tα2(n1)=t0.025(15)=22374(1)确定该种食品平均重量的95%的置信区间。1α=0.95,zα2=z0.025=1.96(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。1α=0.95,zα2=z0.025=1.966387908假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%1α=0.90,n=18,tα2(n1)=t0.05(17)=1.73691α=0.90,zα2=z0.025=1.6451α=0.95,zα2=z0.025=1.96(1)构建第一种排队方式等待时间标准差的95%的置信区间。经计算得样本标准差s=3.3181α=0.95,n=10,x2(n1)=x025(9)=19.02,xα2(n1)=x975(9)=2.7)S(2)构建第二种排队方式等待时间标准差的95%的置信区间。经计算得样本标准差s=0.22721α=0.95,n=10,x2(n1)=x025(9)=19.02,x12α2(n1)=x975(9)=2.712025736485(1)计算A与B各对观察值之差,再利用得出的差值计算d和sd。d=1.75,sd=2.629961α=0.95,n=4,tα2(n1)=t0.025(3)=3.182=40%,来自总体2的样本比例为p2=30%。要求:(()1p2(()1p2n2p11p11p2p11p1p2+p2+p2+zα2.,p1,n1n2n1|p1p2+zα2.,p1,n1n2n1zα2=(|p1p2z2.p11p1+p21p2,p1p2+z2.p11p1+p2=(0.410.4)(0.410.4)250 250|0.11.645×+,0.1+1.645×,zα2=z0.025=1.96zα2=z0.025=1.96)1)1p2n2p11p11p2p11p1p2+p2+p2+zα2.,p1,(n1n2n1|p1p2+zα2.,p1,(n1n2n1=() 250250|0.11.96() 250250|0.11.96×,(要求:构造两个总体方差比σ/σ的95%的置信区间。2s22s21α=0.95,Fα2(n11,n21)=F0.025(20,20)=2.4645,F%,Δ1α=0.95,zα2=z0.025=1.96解:,1α=0.95,zα2=z0.025=1.96,解:n1=n2=n=,1—α=0.95,zα2=z0.025=1.96,p1=p2=0.5,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著已知:x=680σ=60当α=0.05,查表得zα=1.645。因为z<-zα,故拒绝原假设,接受备择假设,说明这批产解:H0:μ=100;H1:μ≠100t<tα2,样本统计量落解:解:H0:π≤0.05;H1:π>0.05当α=0.05,查表得zα=1.645。因为z>zα,样本统计量落在拒绝区域,故拒绝原假设,解:H0:μ≤225;H1:μ>225当α=0.05,自由度n-1=15时,查表得tα(15)=1.753。因为t<tα,样本统计量落在接动效率可以用平均装配时间反映。现从不同的装配方法中各抽H0:μ1-μ2=0H1:μ1-μ2≠0s2=2.46183。α=0.05时,临界点为tα2(n1+n2-2)=t0.025(22)=2.074,此题中t>tα2,故拒绝名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”p1=43/205=0.2097n1=205p2=13/134=0.097n2=134=3当α=0.05,查表得zα=1.645。因为z>zα,拒绝原假设,说明吸烟者容易患慢性气管炎。解:H0:μ≤60;H1:μ>60由于x>μ,因此P值=P(z≥2.16)=1-φ(2.16),查表的φ(2.16)=0.9846,P值=0.0154由于P>α=0.01,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。p1=104/11000=0.00945n1=11000p2=1=11000 (0.00945-0.01718)-00.00945(1-0.00945=11000=-5当α=0.05,查表得zα=1.645。因为z<-zα,拒绝原假设,说明用阿司匹林可以降低心脏成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水H0:σ=σ;H1:σ≠σ2s2s12s22s2当α=0.02时,Fα2(24,15)=3.294,F1-α2(24,15)=0.346。由于F1-α2(24,15)<FH0:μ1-μ2≤0H1:μ1-μ2>02s2每桶容量(L)平方和df均方F显著性组间0.00730.0028.7210.001组内0.0040.000总数0.011dfF2———————(2)若显著性水平a=0.05,检验三种方解2)P=0.025>a=0.05,没有显著差异。123412345检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响均值收获量15.00均值收获量14.0013.0012.0011.0010.009.00品种2品种3品种4品种5品种1品种2品种3品种4品种5施肥方法 施肥方法1 施肥方法2 施肥方法3 施肥方法4似乎交互作用不明显:__因变量:收获量源III型平方和df均方FSig.校正模型37.249(a)75.3218.0820.001截距2,930.62112,930.6214,451.0120.000Fertilization_Methods18.18236.0619.2050.002Variety19.06744.7677.2400.003误差7.9010.658总计2,975.77020校正的总计45.150因变量:收获量源III型平方和df均方FSig.校正模型45.150(a)2.376.截距2,930.62112,930.621.Fertilization_Methods18.18236.061.Variety19.06744.767.Fertilization_Methods*Variety7.9010.658.误差0.0000.总计2,975.77020校正的总计45.15019量对销售额是否有显著影响。下面是获得的月销售额012楼45.0040.0025.001个竞争者2个竞争者0个竞争者3个以上竞争者1个竞争者2个竞争者0个竞争者竞争者数量超市位置位于市内居民小区位于写字楼位于郊区均值月销售额万元均值月销售额万元主体间效应的检验因变量:月销售额(万元)源III型平方和df均方FSig.校正模型2814.556(a)5562.91115.2050.000截距44,802.77844,802.7781,210.1590.000Location_SuperMaket1,736.222223.4480.000Amount_competitors1,078.3333359.4449.7090.000误差1,110.6673037.022总计48,728.00036校正的总计3,925.22235a.R方=.717(调整R方=.670)主体间效应的检验因变量:月销售额(万元)源III型平方和df均方FSig.校正模型3317.889(a)301.6260.000截距44,802.77844,802.7781,770.4720.000Location_SuperMaket1,736.222234.3050.000Amount_competitors1,078.3333359.44414.2040.000Location_SuperMaket*Amount_competitors503.333683.8893.3150.016误差607.3332425.306总计48,728.00036校正的总计3,925.22235a.R方=.845(调整R方=.774)运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0解1)yy运送时间天x运送距离(km)__x运送距离y运送时间(天)x运送距离(km)Pearson相关性1.949(**)显著性(双侧)0.000Ny运送时间(天)Pearson相关性.949(**)1显著性(双侧)0.000N模型非标准化系数标准化系数t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)0.0040.0000.9498.5090.000人均消费水平(元)(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解1)800040000200004000002000040000人均消费水平元人均GDP(元)人均消费水平元__人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998(**)人均消费水平(元)显著性NPearson显著性N7.998(**)0.00070.00017模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.0030.3090.0080.99836.4920.000模型RR方调整的R方估计的标准差1.998(a)0.9960.996247.303模型平方和df均方1回归残差合计81,444,968.680305,795.03481,750,763.71415681,444,968.68061,159.0071,331.692模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.0030.3090.0080.99836.4920.000某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。变差来源MSFSignificanceF140158.07—————Coefficients标准误差P—valueIntercept363.689162.455295.8231910.000168XVariable10.0710912.17E—09解2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。回归直线的检验:p=2.17E—09<α,回归直线显著。性关系是否显著,即检验假设:H0:β1=0。n-k-118广告费支出(万元)销售额(万元)AlB2C4D6EFG解1)非标准化系数标准化系数模型B标准误Betat显著性1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006非标准化系数标准化系数模型B标准误Betat显著性1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.02110.000005.000000.00000-5.00000-10.00000-15.000000505UnstandardizedResidual广告费支出(万元)UnstandardizedResidual__1.00000StandardStandardizedResidual0.00000-1.00000-2.000000505广告费支出(万元)2.000001.00000StudentStudentizedResidual0.00000-1.00000-2.000000505广告费支出(万元)y=b0+b1ln(x)=22.471+11.576ln(x)。12.2根据下面Excel输出的dfF3拟合优度:判定系数R2=0.70965,调整的R=0.630463,说明三个自变量对因变量的影响的估计的标准误差Syx=109.429596,说明随即变动程度为109.429596tα2(n-p-1)=2.36,tα2(n-p-1)=2.36,月销售收入y(万元)电视广告费用工:x1(万元)报纸广告费用x2(万元)2.5(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方(4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(4)判定系数R2=0.919,调整的R=0.8866,比例为88.66%。nts差79.1843387.27585(万元)0.4765992.125379收获量y(kg/hm2)温度x2(℃)6845(3)x1与x2的相关系数rx1x2=0.965,存在多重共线性。企业编号销售价格y购进价格x1销售费用x2101112131415l23826620028626324689444066479185280490577l50585l659490696223257283214235276(2)根据上述结果,你认为用购进价格和销售费用来(5)计算x1与x2之间的相关系数,所得结果意味着什么?销售价格购进价格销售费用销售价格Pearson相关性10.3090.001显著性0.2630.997N购进价格Pearson相关性0.3091-.853(**)显著性0.2630.000N销售费用Pearson相关性0.001-.853(**)1显著性0.9970.000NdfSSMS2sUpper2格4用912.11一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型每件产品的运输费用y(元)货物类型x1非易碎品非易碎品非易碎品非易碎品非易碎品非易碎品非易碎品0dfFF1Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限tP=0.000601<0.05,或者tα2(n-p-1)=t0.025(13)=2.16,t月薪y(元)工龄x1性别(1=男,0=女)x22l8l70406l1180403l205l9l30805lAdjustedRSquare0.87165221021912Upper235.5843.107420.0090672.08341.542930.14879性别(1=男,0=53.45858.580196下表是1981下表是1981年—1999年国家财政用于农业的支出额数据13.1(1)绘制时间序列图描述其形态。(2)计算年平均增长率。(3)根据年平均增长率预测2000年的支出额。详细答案:(1)时间序列图如下:从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。(2)年平均增长率为:。(3)13.2下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:13.2kg/hm2)(1)绘制时间序列图描述其形态。(2)用5期移动平均法预测2001年的单位面积产量。(3)采用指数平滑法,分别用平滑系数a=0.3和a=0.5预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适?详细答案:(1)时间序列图如下:(2)2001年的预测值为:|(3)由Excel输出的指数平滑预测值如下表:———2001年a=0.3时的预测值为:a=0.5时的预测值为:比较误差平方可知,a=0.5更合适。13.3下面是一家旅馆过去18个月的营业额数据13.3123456789(1)用3期移动平均法预测第19个月的营业额。(2)采用指数平滑法,分别用平滑系数a=0.3、a=0.4和a=0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适?(3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。详细答案:(1)第19个月的3期移动平均预测值为:(2)123456789————由Excel输出的指数平滑预测值如下表:a=0.3时的预测值:,误差均方=87514.7。a=0.4时的预测值:,误差均方=62992.5.。a=0.5时的预测值:,误差均方=50236。比较各误差平方可知,a=0.5更合适。(3)根据最小二乘法,利用Excel输出的回归结果如下:MultipleRdfF1Lower95%Upper95%。估计标准误差13.4下表是1981年—2000年我国财政用于文教、科技、卫生事业费指出13.4额数据(1)绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出详细答案:(2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。经线性变换后,利用Excel输出的回归结果如下:MultipleRdfF1Lower95%Upper95%,;,。所以,指数曲线方程为:R=14578XL16·。2001年的预测值为:。13.5我国1964年~1999年的纱产量数据如下(单位:万吨13.5(1)绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2000年的产量。详细答案:(2)从图中可以看出,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论