




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1统计先是思维而后才是数学统计先是思维而后才是数学 第二章第二章 统计数据的描述统计数据的描述 如同给人画像一样如同给人画像一样2统计先是思维而后才是数学统计先是思维而后才是数学 n第一节第一节 统计数据的整理统计数据的整理n第二节第二节 分布集中趋势的测度分布集中趋势的测度n第三节第三节 分布离散程度的测度分布离散程度的测度n第四节第四节 分布偏态与峰度的测度分布偏态与峰度的测度n第五节第五节 统计表和统计图统计表和统计图3统计先是思维而后才是数学统计先是思维而后才是数学 学习目标学习目标掌握数据的整理方法掌握数据的整理方法掌握集中、离散趋势的测度掌握集中、离散趋势的测度掌握偏态峰度的测度掌
2、握偏态峰度的测度掌握统计表和统计图的使用掌握统计表和统计图的使用4统计先是思维而后才是数学统计先是思维而后才是数学 录取中有无歧视?录取中有无歧视?n某高校两个系(财经系、工程系)的报考及录取某高校两个系(财经系、工程系)的报考及录取情况情况男生男生女生女生录取录取350200未录取未录取450400报考人数报考人数800600 录取比率:录取比率:男生:男生:350/800=44%女生:女生:200/600=33% 男生成绩好男生成绩好?性别歧视性别歧视?5统计先是思维而后才是数学统计先是思维而后才是数学 两个系的报考及录取情况两个系的报考及录取情况工程系工程系财经系财经系男生男生女生女生男
3、生男生女生女生录取录取30010050100未录取未录取300100150300报考人数报考人数600200200400工程系:男女录取比率工程系:男女录取比率50%,财经系:男女录取比率,财经系:男女录取比率25%。说明的问题:对数据说明的问题:对数据 1.1.要从不同的角度进行分析;要从不同的角度进行分析; 2. 2.要注意结构或是权数的影响。要注意结构或是权数的影响。6统计先是思维而后才是数学统计先是思维而后才是数学 2.1 统计数据的整理统计数据的整理7统计先是思维而后才是数学统计先是思维而后才是数学 统计整理统计整理或已经加工或已经加工的综合资料的综合资料使数据系统化、条理化,反映事
4、物的总体特使数据系统化、条理化,反映事物的总体特征,并在建立数据库的基础上达到一源多用征,并在建立数据库的基础上达到一源多用统计整理的概念和作用统计整理的概念和作用8统计先是思维而后才是数学统计先是思维而后才是数学 统计整理的步骤统计整理的步骤9统计先是思维而后才是数学统计先是思维而后才是数学 数据的审核数据的审核(原始数据(原始数据第一手数据)第一手数据)n审核的内容审核的内容完整性审核完整性审核检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全准确性审核准确性审核检查数据是否真实反映客观实际情况,内检查数据是否真
5、实反映客观实际情况,内容是否符合实际容是否符合实际检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等10统计先是思维而后才是数学统计先是思维而后才是数学 审核数据准确性的方法审核数据准确性的方法逻辑检查逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。理,各项目或数字之间有无相互矛盾的现象。主要用于对定类和定序数据的审核(品质数据)主要用于对定类和定序数据的审核(品质数据)计算检查计算检查检查调查表中的各项数据在计算结果和计算方法上检查调查表中的各项数据在计算结果和计算方法上有无错误有无错误
6、主要用于对数值型数据的审核(数量数据)主要用于对数值型数据的审核(数量数据)11统计先是思维而后才是数学统计先是思维而后才是数学 数据的审核数据的审核(第二手数据)(第二手数据)完整性和准确性审核完整性和准确性审核适用性审核适用性审核弄清楚数据的来源、数据的口径以及有关的背景弄清楚数据的来源、数据的口径以及有关的背景材料材料确定这些数据是否符合自己分析研究的需要确定这些数据是否符合自己分析研究的需要时效性审核时效性审核应尽可能使用最新的统计数据应尽可能使用最新的统计数据确认是否必要做进一步的加工整理确认是否必要做进一步的加工整理12统计先是思维而后才是数学统计先是思维而后才是数学 数据的筛选数
7、据的筛选l对审核过程中发现的错误应尽可能予以纠正对审核过程中发现的错误应尽可能予以纠正. .l当发现数据中的错误不能予以纠正,或者有些数当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据不符合调查的要求而又无法弥补时,需要对数据进行筛选据进行筛选l数据筛选的内容包括:数据筛选的内容包括:l将某些不符合要求的数据或有明显错误的数将某些不符合要求的数据或有明显错误的数据予以剔除据予以剔除l将符合某种特定条件的数据筛选出来,而不将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出符合特定条件的数据予以剔出13统计先是思维而后才是数学统计先是思维而后才是
8、数学 数据的排序数据的排序(data rank)按一定顺序将数据排列,以发现一些明显的特征或趋按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组排序有助于对数据检查纠错,以及为重新归类或分组等提供依据等提供依据在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成排序可借助于计算机完成14统计先是思维而后才是数学统计先是思维而后才是数学 数据的排序数据的排序( (方法方法) ) 定类数据的排序定类数据的排序字母型数据,排序有升序降序之分,习惯上用升序字母型数据,排序
9、有升序降序之分,习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分按笔画排序,其中也有笔画多少的升序降序之分定距和定比数据的排序定距和定比数据的排序递增排序:设一组数据为递增排序:设一组数据为X1,X2,XN,递增排,递增排序可表示为:序可表示为:X(1)X(2)X(2)X(N)排序后的数据称为顺序统计量排序后的数据称为顺序统计量15统计先是思维而后才是数学统计先是思维而后才是数学 2.1.1 统计数据的分组统计数据的分组16统计先是思维而后才是数学统计先是思维而后才是数学 统计分组的基本原则统计分组的
10、基本原则: 必须保证在某一标志上,组内各单位的同质必须保证在某一标志上,组内各单位的同质性和组与组之间的差异性。性和组与组之间的差异性。 分组兼有分组兼有“分和合分和合”双重含义双重含义 一、统计分组的概念和作用一、统计分组的概念和作用17统计先是思维而后才是数学统计先是思维而后才是数学 分组分组25334218统计先是思维而后才是数学统计先是思维而后才是数学 统计分组的作用统计分组的作用 发现现象的特点与规律。发现现象的特点与规律。(1)划分现象的类型。)划分现象的类型。 例如:例如: 将工业企业按生产要素组合特征划分为将工业企业按生产要素组合特征划分为: 资金密集型资金密集型; 技术密集型
11、技术密集型; 劳动密集型。劳动密集型。19统计先是思维而后才是数学统计先是思维而后才是数学 (2)研究总体的结构。)研究总体的结构。 例如:按照年龄将人口总体分组,说明人口的例如:按照年龄将人口总体分组,说明人口的年龄结构,以此判断人口总体属于增长型、稳定年龄结构,以此判断人口总体属于增长型、稳定型还是减少型。型还是减少型。例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%) 1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产
12、业第三产业21.1 31.943.0 45.520统计先是思维而后才是数学统计先是思维而后才是数学 (3)研究现象之间的依存关系。分组后,计算有关)研究现象之间的依存关系。分组后,计算有关指标,来观察指标间的联系。指标,来观察指标间的联系。例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元) 200 300 400 500 600 800 0 为为右偏分布右偏分布偏态系数偏态系数 SK0 为为左偏分布左偏分布SK的绝对值越大,表示偏斜的程度就越大的绝对值越大,表示偏斜的程度就越大l 例例2.3 ( P37)152统计先
13、是思维而后才是数学统计先是思维而后才是数学 偏态系数偏态系数( (例题分析例题分析) ) 某电脑公司销售量偏态计算表某电脑公司销售量偏态计算表 按销售量份组按销售量份组(台台) 组中值组中值(xi)频(天)数频(天)数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 5-256000-243000-128000 -27000 0 17000 80000 216000 256000 625000合计合计1
14、20540000 iifxx3 58.21185/ snfxxii153统计先是思维而后才是数学统计先是思维而后才是数学 448. 0)58.21(120540000)58.21(120)185()(331013313 iiikiiifxnsfxxSK结论:偏态系数为正值,但与结论:偏态系数为正值,但与0 0的差异不大,说的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数天数占据多数,而销售量较多的天数则占少数154统计先是思维而后才是数学统计先是思维而后才是数学 偏态偏态( (从直方图上观察从直方图上观察
15、) )155统计先是思维而后才是数学统计先是思维而后才是数学 2.4.2 峰度峰度(kurtosis)及其测度及其测度统计学家统计学家Pearson于于1905年首次提出年首次提出v峰度是分布集中趋势高峰的形状。记为峰度是分布集中趋势高峰的形状。记为K,是对数据分布平峰或尖峰程度的测度。是对数据分布平峰或尖峰程度的测度。156统计先是思维而后才是数学统计先是思维而后才是数学 l它通常是与标准正态分布相比较而言它通常是与标准正态分布相比较而言157统计先是思维而后才是数学统计先是思维而后才是数学 峰度系数计算公式为峰度系数计算公式为 3)(414 nsfxxKkiii式中:式中:K表示偏态系数,
16、表示偏态系数, s4是标准差的四次方是标准差的四次方,xi 是组中值是组中值n峰态系数峰态系数 K=0 标准正态分布标准正态分布n峰态系数峰态系数 K0 为尖峰分布为尖峰分布n注意:公式中也可以不减注意:公式中也可以不减3。此时,当。此时,当K3时为平峰时为平峰分布;当分布;当K3时为尖峰分布。时为尖峰分布。n例例2.4(P39)158统计先是思维而后才是数学统计先是思维而后才是数学 峰态系数峰态系数( (例题分析例题分析) ) 某电脑公司销售量峰度计算表某电脑公司销售量峰度计算表 按销售量份组按销售量份组(台台) 组中值组中值(xi)频(天)数频(天)数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 230230 24014515516
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论