第三讲描述统计_第1页
第三讲描述统计_第2页
第三讲描述统计_第3页
第三讲描述统计_第4页
第三讲描述统计_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 推断统计推断统计 分析工具分析工具 分析方法分析方法 描述统计描述统计 思维方法思维方法 经济经济 社会 管理管理 医学医学 工程工程 . 生活生活计量计量 从应用角度来从应用角度来 讲,任何专业都需讲,任何专业都需 要。在专业学科中要。在专业学科中 ,处于基础地位,处于基础地位, 属于基础专业课,属于基础专业课, 在学生的知识体系在学生的知识体系 中的地位,统计学中的地位,统计学 是为学生实践、实是为学生实践、实 际工作、生活能力际工作、生活能力 做准备。做准备。 为什么?为什么? 数据数据 分析分析Data Data AnalysisAnalysis 做出决策做出决策 DecisionD

2、ecision -Making-Making ?1984-1994 T/Maker Co. 啤酒销售量的累计次数(频率)表 销售桶数 频数相对频数 向上累计 向下累计 (% )次数频率次数频率 101 911.711.760100 202 93546.75998.3 303 958.39155693.3 404 91626.72541.75185 505 92033.345753558.3 606 991554901525 707 946.75896.7610 808 923.36010023.3 合计60100 173.6165.8168.7173.6173.7177.8180.3173.1

3、173.0172.6 173.6175.3178.4181.5170.5176.4170.8171.8180.7170.7 173.8164.4170.0175.0177.7171.4162.9179.0174.9178.3 174.5174.3170.4173.2174.5173.7173.4173.9172.9177.9 168.3175.0172.1166.9172.7172.2168.0172.7172.3175.2 171.9168.6167.6169.1166.8172.0168.4166.2172.8166.1 173.5168.6172.4175.7178.8169.1175.

4、5170.8171.7164.6 171.2177.1170.7173.6167.2170.7174.7171.8167.3174.8 168.5178.7177.3165.9174.0170.2169.5172.1178.2170.9 171.3176.1169.7177.9171.1179.3183.5168.5175.5175.9 身高组段身高组段 频数 组中值组中值 (1) (2)(3) 162 1163 164 4165 166 7167 168 12169 170 18171 172 24173 174 15175 176 8177 178 7179 180 3181 182 18

5、4 1183 合计合计100 0 200 400 600 800 48121620 人数 年份 196619641962196019581956195419521950 死 亡 率 ( 1/10万 ) 200 100 50 40 30 20 10 5 4 3 2 1 .5 .4 .3 伤 寒 结 核 病 副教授 33.2% 教辅人员 25.5% 讲师 21.4% 助教 10.2% 教授 9.8% 数据分布性质数据分布性质 集中趋势集中趋势 离中趋势离中趋势分布形态分布形态 主主 要要 内内 容容 算术平均数算术平均数 中位数 众数 几何平均数和调和平均数几何平均数和调和平均数 挠头的数值挠头的

6、数值 公司员工的月薪如下:公司员工的月薪如下: N X X f fX X 350 1190 %10%40%50 %1095%4095%5085 42.5389.5 9090 %10%40%50 %1095%4085%5095 47.5349.5 91 由上可知选手由上可知选手B B获得第一名,选手获得第一名,选手A A获得第二名获得第二名 212 198192 164155 121 133 9894 1.1.2 1.1.2 算术平均数的性质算术平均数的性质 算术平均数受抽样变动影响较小算术平均数受抽样变动影响较小 分组资料如遇有开放组距时,不经特殊处理分组资料如遇有开放组距时,不经特殊处理 不

7、能进行算术平均数的计算不能进行算术平均数的计算 受极端值影响较大受极端值影响较大 (天津市(天津市20052005统计年鉴)统计年鉴) n r . rr G n 21 rrr521 ,., 121.8120.8131.0124.1.6191114.0 5 在上式中,在上式中,依次为依次为114.0114.0,119.6119.6,124.1124.1, 十五期间天津市工业总产值年均增长率为十五期间天津市工业总产值年均增长率为21.8%21.8%。 。 131.0131.0,120.8120.8于是几何平均数:于是几何平均数: 例例1.某产品经过三个流水连续作业的车间加某产品经过三个流水连续作业

8、的车间加 工生产而成,本月第一车间的产品合格率为工生产而成,本月第一车间的产品合格率为 90%,第二车间的产品合格率为,第二车间的产品合格率为80%,第三,第三 车间的产品合格率为车间的产品合格率为70%。则全厂的总合格。则全厂的总合格 率为:率为: %4.50%70%80%90总合格率 这样平均合格率为这样平均合格率为 3 21 %70%80%90n n xxxG平均合格率 %58.79%4.50 3 %49.108 205 06. 1 5 08. 1 10 1 . 1)1 (r? %49. 81%49.108r? 24 1 30 1 20 1 2 11 H 24,H , (公里(公里/ /

9、小时)小时) 定义:一组定义:一组n n个数据的调和平均数个数据的调和平均数H H,由下式定义,由下式定义 R n RR nH 11111 21 在上例中在上例中 调和平均数调和平均数 (练习练习) ) / (38. 1 1667. 2 3 2 1 5 . 1 1 1 1 3 1 ? n n H 6.5 6.5 6.519.5 1.38(/ ) 1111 14.0833 6.56.56.5 11.52 m H m x 公 斤元 3 2 16 1.24(/) 1111 4.83 321 11.52 m H m x 公斤元 元)(公斤/5 . 1 3 25 . 11 n x x 200 200 2

10、00600 25.2(/) 1111 23.81 200200200 302820 m H m x 公 里小 )/(26 6 156 222 220228230 f xf x小时公里 dL d ffff ff LM 21 1 )10)10 )10 0 ( ( dU d ffff ff UM 21 2 )10)10 )10 0 ( ( 某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数 (CM) (人)(人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数 (CM) (人)(人

11、) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计总计 83 身高身高 人数人数 比重比重 (CM) (人)(人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100 某年级某年级83名女生身高资料名女生身高资料 dLM o 21 1 48.1635 1023 23 160 o M Me xx x Me nn n 1 22 2 1 2 1 当当n n为奇数为奇数 当当n n

12、为偶数为偶数 n例例1:9个家庭的人均月收入数据个家庭的人均月收入数据 5 2 19 2 1 n 位置 2 1 ne XM n例例2:10个家庭的人均月收入数据个家庭的人均月收入数据 5 . 5 2 110 2 1 n 位置 1020 2 1080960 中位数 2 1 22 nn e XX M 2 f 2 f =40,354055 中位数组为中位数组为“20-30百万元百万元” 20百万元百万元 30百万元百万元 第第35个个 第第55个个 第第40个个 共共20个个 1 e m S e m S 20 3540 10 20)( 5 .225 . 220百万元 )(5.2210 20 4055

13、 30百万元 2 f e e e e m m m e m d f S f LM 1 2 e e e e e m m m m d f f S UM 2 向上累计时向上累计时 向下累计时向下累计时 e e e e e m m m d f m S f UM 12 MeMoMeMo MeMoMeMo =Me=Mo=Me=Mo x x x 可以看出,对于单峰的分布可以看出,对于单峰的分布 对称态:对称态: 左 偏 态 :左 偏 态 : 右偏态:右偏态: )( 甲 cmx170 )( 乙 cmx170 )( 甲 cmR20160180 )( 乙cmR4168172 极差的优点是计算简便,直观,容易理解。不

14、足之处是它极差的优点是计算简便,直观,容易理解。不足之处是它 只以两个极端的标志值计算,而不考虑总体内部的分配状只以两个极端的标志值计算,而不考虑总体内部的分配状 况,不能充分利用数列的全部信息,因此,它无法反映标况,不能充分利用数列的全部信息,因此,它无法反映标 志值变动的一般程度。志值变动的一般程度。 改进方法:计算四分位差改进方法:计算四分位差 n xx DA . f fxx DA. (元) 甲 1000 x(元) 乙 1000 x )(120 5 10001200100011001000100010009001000800 .元 甲 n xx DA )(60 5 10001100100010501000100010009501000900 .元 乙 n xx DA n xx 2 )( n xx 2 2 )( f fxx 2 2 )( f fxx 2 )( n xx 2 )( 2 甲 5 2 )10001200( 2 )10001100( 2 )10001000( 2 )10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论