《统计学》(第四版)学习指导书以及课后习题答案_第1页
《统计学》(第四版)学习指导书以及课后习题答案_第2页
《统计学》(第四版)学习指导书以及课后习题答案_第3页
《统计学》(第四版)学习指导书以及课后习题答案_第4页
《统计学》(第四版)学习指导书以及课后习题答案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、附录:教材各章习题答案第1章 统计与统计数据1.1 (1)数值型数据;(2分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。1.2 ( 1)总体是 该城市所有的职工家庭”样本是 抽取的2000个职工家庭”(2)城市所有职工家庭的年人均收入,抽取的“200个家庭计算出的年人均收入。1.3 ( 1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4 ( 1)总体是 所有的网上购物者”(2)分类变量;(3)所有的网上购物者 的月平均花费;(4)统计量;(5)推断统计方法。1.5 (略)。1.6 (略)。第2章数据的图表展示2.1( 1)属于顺序数据。(2)频数分布表

2、如下服务质量等级评价的频数分布服务质量等级家庭数/频率频率/%A1414B2121C3232D1818E1515合计100100(3)条形图(略)(4)帕累托图(略)2.2( 1)频数分布表如下40个企业按产品销售收入分组表按销售收入分 组/万元企业 数/个频率/%向上累积向下累积企业数频率企业数频率100以下512.5512.540100.0100110922.51435.03587.5110 1201230.02665.02665.0120 130717.53382.51435.0130 140410.03792.5717.5140以上37.540100.037.5合计40100.0(2)

3、某管理局下属40个企分组表按销售收入分组/万元企业数/个频率/%先进企业1127.5良好企业1127.5一般企业922.5落后企业922.5合计40100.02.3频数分布表如下某百货公司日商品销售额分组表按销售额分组/万 元频数/天频率/%25 30410.030 35615.035 401537.540 45922.545 50615.0合计40100.0直方图(略)。2.4茎叶图如下茎叶数据个数18 8 9320 113368889991231 3 5 6 9541 2 3 6 6 7650 12 74箱线图(略)。2.5( 1)排序略。(2)频数分布表如下100只灯泡使用寿命非频数分布

4、按使用寿命分组/小 时灯泡个数/只频率/%650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100(3)直方图(略)(4)茎叶图如下46518661456867134679681123334555889969001111222334455666 7 7 8 8 8 8 9 9700011223456667788897100223356778897201225678997335674147茎叶(1)频数分布表如下2.62.840 42242 44344 46

5、746 481648 501752 521052 542054 56856 581058 60460 623合计100(2)直方图(略)。(3)食品重量旳分布基本上是对称旳。(1)频数分布表如下按重量误差分组频数/个10 20020 30530 40740 50850 601360 70970 80680 902合计50(2)直方图(略)。2.7按重量分组(1)属于数值型数据。频率/包(2)分组结果如下分组天数/天-25-206-20-1585-15-1010-10-513-50120545107合计6095857565554535THTZ1TKZH:.-* HZZH 爲" TnHi

6、I Min-MaxO'北京长春南京 郑州武汉广州 成都 昆明 兰州 西安25%-75%Median value(3)直方图(略)。2.9( 1)直方图(略)(2)自学考试人员年龄的分布为右偏。2.10( 1)茎叶图如下A班树茎B班数据个数树叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2) A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,

7、且平均成绩较A班低。2.11(略)。2.12(略)。2.13(略)。2.14(略)。2.15箱线图如下:(特征请读者自己分析)各城市相对湿度箱线图6#第3章数据的概括性度量3.1(1) M 0 =10 ; Me =10 ; x =9.63.23.33.43.53.63.73.83.93.10(2) Ql =5.5 ; Qu =12。(3) s =4.2。(4) 左偏分布。(i) M o =19 . Me =23。(2) Ql =5.5 ; Qu -12。(3) x 二 24 ; s 二 6.65。(4) SK =1.08 . K =0.77。(5) 略。(1) 略。(2) X =7 ; s =

8、0.71。(3) v1 =0.102 ; v2 二 0.274。(4) 选方法一,因为离散程度小。(1) X =274.1 (万元).Me=272.5。(2) Ql=260.25; Qu=291.25。(3) s =21.17 (万元)。甲企业平均成本=19.41 (元),乙企业平均成本=18.29 (元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产 量中所占比重较大,因此拉低了总平均成本。(1) x =426.67 (万元);s=116.48 (万元)。(2) SK =0.203 ; K - -0.688。(1) (2)两位调查人员所得到的平均身高和标准差应该差不多

9、相 同,因为均值和标准差的大小基本上不受样本大小的影响。(3) 具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本 越大,变化的范围就可能越大。(1) 女生的体重差异大,因为女生其中的离散系数为0.1大于男生 体重的离散系数0.08。(2) 男生:X =27.27 (磅),s=2.27 (磅);女生:X =22.73 (磅),s=2.27 (磅);(3) 68%;(4) 95%。通过计算标准化值来判断, = 1,% = 0.5,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项 测试的标准化值高于B项测试,所以A项测试比较理想。通过

10、标准化值来判断,各天的标准化值如下表日日期 周一周二周三周四周五周六周日标准化值 Z 3-0.6-0.20.4-1.8-2.20周一和周六两天失去了控制3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。4 2(2)成年组身高的离散系数:Vs 0.024 ;172.1幼儿组身高的离散系数:Vs 230.032 ;71.3由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高 的离散程度相对较大。3.12 下表给出了一些主要描述统计量,请读者自己分析。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数

11、126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值1283.13( 1)方差或标准差;(2)商业类股票;(3)(略)第4章抽样与参数估计4.1 ( 1) 200。(2) 5。(3)正态分布。(4)2(100-1)。4.2 ( 1) 32。(2) 0.91。4.3 0.79。4.4 ( 1) X25 N(17,22)。( 2) X100 N(17,1)。4.5 ( 1) 1.41。(2) 1.41,1.41,1.34。4.6 ( 1) 0.4。(2) 0.024 。( 3)正态分布。4.7 ( 1) 0.0

12、50, 0.035, 0.022, 016。(2)当样本量增大时,样本比例的标准 差越来越小。4.8 ( 1)二x -2.14 ;(2) E=4.2;(3)( 115.8, 124.2)。4.9 ( 87819, 121301)。4.10( 1) 81 ±1.97;(2) 81 ±2.35;( 3) 81 ±3.10。4.11( 1)(24.11, 25.89);(2)( 113.17, 126.03) ;(3)(3.136, 3.702)4.12( 1)( 8687, 9113);(2)( 8734, 9066) ;( 3)(8761, 9039);(4)(86

13、82, 9118)。4.13(2.88, 3.76); (2.80, 3.84); (2.63, 4.01)。4.14( 7.1, 12.9)。4.15(7.18, 11.57)。4.16( 1)( 148.9, 150.1); (2)中心极限定理。4.17( 1)( 100.9, 123.7);(2)( 0.017, 0.183)。4.18( 15.63, 16.55)。4.佃(10.36, 16.76)。4.20 (1) (0.316, 0.704); (2) (0.777, 0.863); (3) (0.456, 0.504)。4.21 (18.11%, 27.89%); (17.17%

14、, 22.835)。4.22167。4.23 (1) 2522; (2) 601; (3) 268。4.24 (1) (51.37%, 76.63%); (2) 36。4.25 (1) (2.13, 2.97); (2) (0.015, 0.029); (3) (25.3, 42.5)。4.26 (1) (0.33, 0.87); (2) (1.25, 3.33); (3)第一种排队方式更好。4.27 48。4.28 139。第5章假设检验5.1研究者想要寻找证据予以支持的假设是新型弦线的平均抗拉强度相对于以前提高了”所以原假设与备择假设应为:H。:卩兰1035, H1>1035。5.2

15、兀=某一品种的小鸡因为同类相残而导致的死亡率” H。:兀3 0.04 ,出:二:0.04。5.3 Ho :二-65, H1-65。5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于 60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2) 第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克, 但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3) 连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。5.5(1)检验统计量,在大样本情形下近似服从标准正态分布;(2)如果z - Z0.05,就拒绝Ho(3) 检验统计量z

16、 = 2.94>1.645,所以应该拒绝H05.6 z = 3.11,拒绝 H0。5.7 t =1.66,不拒绝 H。5.8 z 二-2.39,拒绝 H。5.9 t =1.04,不拒绝 H 0 5.10Z =2.44,拒绝 H。5.11z = 1.93,不拒绝 H。5.12z = 7.48,拒绝 Ho。5.13 2 = 206.22,拒绝 H。5.14F =2.42,拒绝 Ho。第6章方差分析6.1 F =4.6574 c F0.01 =8.0215(或 Pvalue = 0.0409 a a =0.01),不能拒绝原假设。6.2 F =15.8234F0.01 =4.579(或 Pva

17、lue = 0.00001 va =0.01),拒绝原假设。6.3 F =10.0984 F°.°1 =5.4170(或 P-value =0.000685 : = 0.01),拒绝原假设。6.4 F =11.7557 a F0.05 =3.6823(或 P-value = 0.000849 va = 0.05),拒绝原假设。6.5 F =17.0684F0.05 =3.8853(或 P-value = 0.0003 va =0.05),拒绝原假设。乂人2b | = 44.430 =14.4 > LSD =5.85,拒绝原假设;乂人Xc| = 44.4-42.6 =

18、1.8 c LSD = 5.85,不能拒绝原假设;XB Xc | = 3042.6 =12.6 a LSD =5.85,拒绝原假设。6.6方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueF crit组间42022101.4780.245946Q 3.354131组内383627142.07总计425629F =1.478 : F0.05 =3.554131(或 P - value =0.245946: =0.05),不能拒绝原假设。第7章相关与回归分析7.1 ( 1)散点图(略),产量与生产费用之间正的线性相关关系。(2)r =0.920232。(3)检验统计量t =14.42

19、22 t.2 =2.2281,拒绝原假设,相关系数显著7.2 ( 1)散点图(略)。(2) r =0.8621。7.3 (1)?o表示当x=0时y的期望值。(2) !?表示x每变动一个单位y平均下降0.5个单位。(3) E(y) =7 o7.4 (1) R2 =90% o(2) Se = 1 o7.5 (1)散点图(略)。(2) r =0.9489。(3) #=0.1181 +0.00358X。回归系数 弭=0.00358表示运送距离每增加1 公里,运送时间平均增加 0.00358天。7.6 (1)散点图(略)。二者之间为高度的正线性相关关系。(2) r = 0.998128,二者之间为高度的

20、正线性相关关系。(3) 估计的回归方程为:? = 734.6928 0.308683X。回归系数? = 0.308683表示人均GDP每增加1元,人均消费水平平均增加 0.308683元。(4) 判定系数R2 =0.996259。表明在人均消费水平的变差中, 有99.6259% 是由人均GDP决定的。(5) 检验统计量F =1331.692 R =6.61,拒绝原假设,线性关系显著。(6) y5000 = 734.6928 0.308683 5000 = 2278.1078 (元)。(7) 臵信区间:1990.749,2565.464;预测区间:1580.463, 2975.750。7.7 (

21、1)散点图(略),二者之间为负的线性相关关系。(2) 估计的回归方程为:0 = 430.1892-4.7x。回归系数国;=V.7表示航班 正点率每增加1%,顾客投诉次数平均下降4.7次。(3) 检验统计量 t = 4.959 t:. 2 = 2.3060 ( P-Value=0.001108< =0.05 ), 拒绝原假设,回归系数显著。(4) % =430.1892-4.7 80 =54.1892 (次)。(5) 臵信区间:(37.660,70.619);预测区间:(7.572,100.707) o7.8 Excel输出的结果如下(解释与分析请读者自己完成)Multiple R0.79

22、51R Square0.6322Adjusted R Square0.6117标准误差2.685820观测值方差分析dfSSMSFSignificance F回归分析1223.1403223.140330.93322.79889E-05残差18129.84527.2136总计19352.9855Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept49.31773.805012.96120.000041.323657.3117X Variable 10.24920.04485.56180.00000.15510.34347.9(1方差分

23、析表中所缺的数值如下方差分析表变差来源dfSSMSFSign ifica nee F回归11422708.61422708.6354.277 .2.17E-09残差1040158.074015.807总计111642866.67i i(2) r2 二 空二1422708.60 =0.8660 =86.60%。表明汽车销售量的变SST 1642866.67差中有86.60%是由于广告费用的变动引起的。(3) rR20.8660 =0.9306。(4) # = 363.6891 4420211X。回归系数 ? =1.420211表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(5

24、) Significanee F= 2.17E-09<0.05,线性关系显著。7.10 ? = 13.6254 2.3029X ; R2 =93.74% ; s 3.8092。7.11 (1) 27。(2) 4.41。(3) 拒绝H 0。(4) r - -0.7746。(5) 拒绝H 0。7.12 (1) 15.95 乞 E(y)乞 18.05。(2) 14.65 y0 <19.349。7.13 ?= -46.29 15.24x ; 441.555 空 E(y40)乞 685.045。7.14 ?=25.03 -0.0497X1 十1.928%?;预测 28.586。7.15 (略

25、)。7.16 (1)显著。(2) 显著。(3) 显著。7.17 (1) 0=88.6377 1.6039%。(2) 0=83.2301 2.2902X1 1.3010x2。(3) 不相同。方程(1)中的回归系数10 =1.6039表示电视广告费用每增力卩1万元,月销售额平均增加1.6039万元;方程(1)中的回归系数屛=2.2902表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。(4) R2 =91.91% ; R: =88.66%。(5) '-1 的 P-Value=0.0007,的 P-Value=0.0098,均小于:=0.05,两个

26、回归系数均显著。7.18 (1) 0-0.5910 22.3865X1 327.6717X2(2) 回归系数22.3865表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归系数02 =327.6717表示温度每增加10C,小麦收 获量平均增加327.6717kg/mh2。(3) 可能存在。7.19 (1) 0 =148.7005 0.8147x10.8210x20.1350x3。(2) R2 =89.75% ; R2 -87.83%。(3) Significanee F= 3.88E-08v: =0.05,线性关系显著。(4 ) S 的 P-Value=0.1311&

27、gt; : =0.05 ,不显著; ' 2 的P-Value=0.0013v =0.05,显著;七的 P-Value=0.0571> =0.05,不显著。第8章时间序列分析和预测61 (1)时间序列图(略)。(2) 13.55%。(3) 1232.90亿元)。62 (1)时间序列图(略)。(2) 1421.2(公 斤 / 公顷)。(3) : =0.3 时的预测值:F200! =1380.18,误差均方=291455; : = 0.5时的预测值:F2001 =1407.23,误差均方=239123。=0.5更合适。63 (1) 3期移动平均预测值二630.33 (万元)。(2) =

28、0.3时的预测值:斤9 =567.95,误差均方二87514.7;= 0.4时的 预测值: 耳=591.06,误差均方二62662.5; : =0.5时的预测值: F19 =606.54,误差均方=50236。: =0.5 更合适(3) 趋势方程 Y? =239.73 21.928&。估计标准误差 ® =31.6628。64 (1)趋势图(略)。(2)趋势方程 Y? =145.78 1.16077'。2001 年预测值=3336.89亿元)。65 (1)趋势图(略)。(2)线性趋势方程Y? = 69.5202 13.9495t,2000年预测值=585.65 (万吨)

29、。8.6 线 性趋势 : Y? = 374.1613-0.6137t; 二次 曲线:Y? =381.6442-1.8272t 0.0337t2; 三 次 曲 线:Y?二 372.5617 1.0030t - 0.1601t20.0036t3。67 (1)原煤产量趋势图(略)。(2)趋势方程 Y? =4.5824 0.96741 -0.0309t2,预测值 £01 =11.28 (亿吨)。68 (1)图形(略)。(2) 移动平均法或指数平滑法。(3) 移动平均预测=72.49(万元);指数平滑法预测二72.5(万元)(=0.4)。8.9 (1)略。(2)结果如下2001 年 /月时间编

30、号季节指 数回归预测 值最终预测 值1971.04393056.303190.482980.99393077.503058.873990.95933098.712972.4841000.93983119.922931.9951010.94393141.132964.8861020.95893162.333032.3071030.92873183.542956.4381040.92613204.752967.8691050.98143225.963166.05101061.00753247.163271.51111071.04723268.373422.77121081.26943289.584

31、175.95&10各季节指数如下1季度 2季度 3季度 4季度季节指数0.7517 0.8513 1.23431.1627季节变动图(略)计算趋势:分离季节因素后的趋势方程为:£ = 204392 163.7064t。图形(略) 周期波动图(略)。&11各月季节指数如下1月2月3月4月5月6月0.67440.66990.74320.79030.80610.85107月8月9月10月11月12月0.75520.34490.96191.19921.86622.3377季节变动图(略)计算趋势:分离季节因素后的趋势方程为:M =119.159 0.42449t。图形(略)。

32、周期波动图(略)。随机波动图(略)。第9章指数9.1 ( 1)VN10.80%。( 2) I p =122.46%。( 3)lq =90.48%。( 4)13920 元=26190元-12270 元。9.2 (1) 111.72%。(2) 111.60%。(3) 100.10%。(4) 15.3 万元=15.1532 万元+0.1468万元。9.3 (1) 2.62%; 8016 元。(2) 28.42%; 124864 元。(3) 143.37%; 132880 丿元。9.4 (1)单位成本增长 11.11%。(2) Ip =111.11% ; lq =90.91%。9.5结果如下表:年份缩

33、减后的人均GDP19901584.919911817.219922149.419932562.319943161.219954145.219965148.719975889.119986357.919996640.020007049.89.6 Ip =98.52%,下跌 1.48%。19第1章 统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。早节主要内容学习要点1.1统计及其 应用领域什么是统计学概念:统计

34、学,描述统计,推断统计。统计的应用领域统计在工商管理中的应用。 统计的其他应用领域。1.2数据的类 型分类数据、顺序数据、数值 型数据概念:分类数据,顺序数据,数值型数据。 不同数据的特点。观测数据和实验数据概念:观测数据,实验数据。截面数据和时间序列数据概念:截面数据,时间序列数据。1.3数据来源数据的间接来源统计数据的间接来源。 二手数据的特点。数据的直接来源概念:抽样调查,普查。 数据的间接来源。数据的收集方法。调查方案设计调查方案的内容。数据质量概念。抽样误差,非抽样误差。 统计数据的质量。1.4统计中的 几个基本概念总体和样本概念:总体,样本。参数和统计量概念:参数,统计量。变量概念

35、:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。2. 描述统计:研究数据收集、处理和描述的统计学分支。3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。4. 分类数据:只能归于某一类别的非数字型数据。5. 顺序数据:只能归于某一有序类别的非数字型数据。6. 数值型数据:按数字尺度测量的观察值。7. 观测数据:通过调查或观测而收集到的数据。8. 实验数据:在实验中控制实验对象而收集到的数据。9. 截面数据:在相同或近似相同的时间点上收集的数据。10. 时间序列数据:在不同时间上收集到的数

36、据。11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。12. 普查:为特定目的而专门组织的全面调查。13. 总体:包含所研究的全部个体(数据)的集合。14. 样本:从总体中抽取的一部分元素的集合。15. 样本容量:也称样本量,是构成样本的元素数目。16. 参数:用来描述总体特征的概括性数字度量。17. 统计量:用来描述样本特征的概括性数字度量。18. 变量:说明现象某种特征的概念。19. 分类变量:说明事物类别的一个名称。20. 顺序变量:说明事物有序类别的一个名称。21. 数值型变量:说明事物数字特征的一个名称。22. 离散型变量:

37、只能取可数值的变量。23. 连续型变量:可以在一个或多个区间中取任何值的变量。四、习题答案1.D12. C23. C34.A45. A2.D13. B24. B35.A46. B3.A14. A25. D36.A47. C4.B15. C26. C37.D48. A5.A16. D27. B38.B49. C6.D17. C28. D39.B50. D7.C18. A29. A40.C51. A8.B19. C30. D41.C52. C9.A20. D31. A42.D53. D10.A21. A32. B43.C54. A11.C、22. C33. C44.D55. B21第2章数据的图表

38、展示一、学习指导数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。早节主要内容学习要点2.1数据的预处理数据审核数据审核的目的。原始数据和二手数据的审核内容。数据排序数据排序的目的。分类数据和数值型数据的排序方法。数据筛选数据筛选的目的。用Excel进行数据筛选。数据透视表数据透视表的用途。 用Excel进行数据透视。2.2品质数据的整理与展示分类数据的整理与图示概念:频数,频数分布,比例,百分比,比 率。用Excel制作分类数据的频数分布表。分类数据的图示:条形图,帕累托

39、图,对比 条形图,饼图。顺序数据的整理与图示概念:累积频数,累积频率。 累积频数分布图。2.3数值型数据的 整理与展示数据分组概念:数据分组,单变量值分组,组距分组, 等距分组,不等距分组,组距,组中值。频数分布表的制作步骤。用Excel制作频数分布表。数值型数据的图示直方图的绘制。茎叶图的绘制。箱线图的绘制。直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。散点图的绘制。气泡图的绘制。雷达图的绘制。2.4合理使用图表鉴别图形优劣的准则图形应包括的基本特征。 鉴别图形优劣的准则。统计表的设计统计表的结构。统计表的设计。、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。25

40、. 频数分布:数据在各类别(或组)中的分配。26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。27. 比率:样本(或总体)中各不同类别数值之间的比值。28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。31. 组距:一个组的上限与下限的差。32. 组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2 。33. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。34. 茎叶图:由“茎”

41、和“叶”两部分组成的、反应原始数据分布的图形。35. 箱线图: 由一组数据的最大值、 最小值、中位数和两个四分位数 5 个特征值绘制而成的、 反应原始数据分布的图形。四、习题答案1.C8.B15.C22.D29.D2.A9.B16.B23.D30.C3.B10.C17.D24.B31.B4.C11.A18.D25.D32.C5.D12.B19.C26.B33.C6.B13.B20.B27.B34.A7.C14.C21.C28.D35.B23第3章数据的概括性度量一、学习指导数据分布的特征可以从三个方面进行描述: 一是分布的集中趋势, 反映各数据向其中心 值靠拢或聚集的程度; 二是分布的离散程度

42、, 反映各数据远离其中心值的趋势; 三是分布的 形状,反映数据分布偏斜程度和峰度。 本章将从数据的不同类型出发, 分别介绍集中趋势测 度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。早节主要内容学习要点3.1集中趋势 的度量众数概念:众数。 众数的特点。中位数和分位数概念:中位数,四分位数。 中位数和四分位数的特点。 中位数和四分位数的计算。平均数概念:平均数,简单平均数,加权平均数, 几何平均数。简单平均数和加权平均数的计算。平均数的性质。几何平均数的计算和应用场合。众数、中位数和平均数 的比较众数、中位数和平均数在分布上的关系。 众数、中位数和平均数的特点及应用场

43、合。3.2离散程度 的度量异众比率概念:异众比率。异众比率的计算和应用场合。四分位差概念:四分位差。四分位差的计算和应用场合。方差和标准差概念:极差,平均差,方差,标准差。 极差的计算和特点。平均差的计算和特点。样本方差和标准差的计算。总体方差和标准差的计算。相对位置的度量概念:标准分数。标准分数的计算和应用。经验法则。切比雪夫不等式。离散系数概念:离散系数。 离散系数的计算。离散系数的用途。3.3偏态与峰 态的度量偏态及其测度概念:偏态,偏态系数。 偏态系数的计算。偏态系数数值的意义。峰态及其测度概念:峰态,峰态系数。 峰态系数的计算。峰态系数数值的意义。 用Excel计算描述统计量。 Ex

44、cel统计函数的应用。二、主要术语和公式(一)主要术语1. 众数:一组数据中出现频数最多的变量值,用M。表示。2. 中位数:一组数据排序后处于中间位置上的变量值,用Me表示。3. 四分位数:一组数据排序后处于25唏口 75%位置上的值。4. 平均数:一组数据相加后除以数据的个数而得到的结果。5. 几何平均数:n个变量值乘积的n次方根,用Gm表示。6. 异众比率:非众数组的频数占总频数的比率。7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。8. 极差:也称全距,一组数据的最大值与最小值之差。9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。10. 方差:各变

45、量值与其平均数离差平方的平均数。11. 标准差:方差的平方根。12. 标准分数:变量值与其平均数的离差除以标准差后的值。13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。14. 偏态:数据分布的不对称性。15. 偏态系数:对数据分布不对称性的度量值。16. 峰态:数据分布的平峰或尖峰程度。17. 峰态系数:对数据分布峰态的度量值。(二)主要公式名称公式中位数Me = *11 'n为奇数* n为偶数简单样本平均数n送x一iTx -n26加权样本平均数k、Mifi-1X 二几何平均数Gm = n Xj X2 Xn = n i【Xi 7异众比率V 'fi _ f

46、mVr四分位差x27x#极差R = max(xj - min(xjx#x#简单平均差加权平均差Mdk、Mi - x fii吕简单样本方差、(Xi -X)2i Tn1简单样本标准方差、(Xi -X)2i A加权样本方差kM -x)2fj加权样本标准差k' (Mi -x)2fii=1标准分数Xj -X离散系数Vsx28未分组数据的偏态系数n(x - xSK=Z i(n-1)( n2)i s 丿分组数据的偏态系数k3送(M i - X ) fiSK=3ns未分组数据的峰态系数42 2n(n+1)迟(人X) -30 (Xi -x) (n-1)K =4(n 1)(n2)( n-3)s分组数据的峰

47、态系数k迟 M X)4fiK =4-3ns四、习题答案1. A19. C37. A55. B73. D2. C20. A38. C56. A74. C3. B21. B39. B57. B75. A4. C22. C40. A58. D76. D5. D23. C41. A59. A77. D6. B24. C42. B60. B78. A7. D25. C43. B61. C79. A8. A26. D44. A62. D80. C9. A27. A45. B63. A81. D10. C28. A46. A64. C82. D11. B29. B47. C65. D83. A12. C30

48、. B48. D66. D84. A13. A31. A49. B67. C85. A14. B32. A50. A68. B86. D15. A33. B51. C69. D16. B34. B52. D70. D17. A35. A53. B71. A18. B36. B54. D72. B29第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一, 它是在抽样及抽样分布的基础上,根 据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知 识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参 数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。早节主要内容学习要点4.1抽样与 抽样分布概率抽样方法概念:简单随机抽样,简单随机样本, 重复抽样,不重复抽样,分层抽样,系 统抽样,整群抽样。用Excel抽取简单随机样本。抽样分布概念:抽样分布,样本均值的抽样分 布,样本比例的抽样分布,样本方差的 抽样分布。中心极限定理。样本均值抽样分布的特征。样本均值的抽样分布与总体分布的关 系。样本比例抽样分布的形式和特征。样本方差抽样分布的形式。4.2参数估 计的一般问题估计量与估计值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论