版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、631李德智李德智 副教授副教授/博士博士东南大学土木工程学院建设与房地产系东南大学土木工程学院建设与房地产系第第3章章 统计整理统计整理统计工作的过程统计工作的过程统计整理统计整理统计分析统计分析统计设计统计设计统计调查统计调查统计预测统计预测统计决策统计决策第第2章章 统计调查统计调查思考题思考题某市场调查共发放某市场调查共发放问卷问卷2000份,其中每份问卷包份,其中每份问卷包含含15题、每题题、每题4个选项,请问个选项,请问如何整理如何整理?需要利?需要利用计算机吗?如果需要,请问如将统计数据用计算机吗?如果需要,请问如将统计数据输入输入计算机计算机?某课程共有某课程共有96人参加考试
2、,其成绩分布为:人参加考试,其成绩分布为:8人人优秀、优秀、40人良好、人良好、35人中等、人中等、9人及格、人及格、4人不及人不及格。请问用什么图表可以较好地表示该格。请问用什么图表可以较好地表示该成绩分布成绩分布?第第3 3章章 统计整理统计整理3.1 3.1 统计整理的涵义统计整理的涵义3.2 3.2 数据的预处理数据的预处理3.3 3.3 分类数据的整理与显示分类数据的整理与显示3.4 3.4 顺序数据的整理与显示顺序数据的整理与显示3.5 3.5 数值型数据的整理与显示数值型数据的整理与显示3.6 3.6 统计表统计表3.1 统计整理的涵义统计整理的涵义一、统计整理的概念一、统计整理
3、的概念二、统计整理的内容二、统计整理的内容使统计数据由使统计数据由特征特征过渡到过渡到的工作过程的工作过程万元万元万元75012501000050201AAA1000+1250+750=5亿元亿元 5亿亿/50=1000万元万元/家家例如例如:通过调查得某班平均成绩为:通过调查得某班平均成绩为3.53.5分分/ /人(五分制)人(五分制)则则百分制百分制下其平均成绩:下其平均成绩: 5 5:100 = 3.5100 = 3.5:X X,X =70X =70分。分。统计整理的概念统计整理的概念统计整理的统计数据包括统计整理的统计数据包括一手数据一手数据和和二手数据二手数据例如例如:某市:某市50
4、50家建筑企业年利润额如下,求其家建筑企业年利润额如下,求其平均值平均值统计整理的内容统计整理的内容3.2 数据的预处理数据的预处理数据的预处理数据的预处理数据录入数据录入数据审核数据审核数据筛选数据筛选数据排序数据排序完整性完整性准确性准确性递增排序递增排序递减排序递减排序数据的预处理(数据的预处理(举例举例)8 8名同学四门课程成绩分布名同学四门课程成绩分布姓名姓名统计学成绩统计学成绩数学成绩数学成绩英语成绩英语成绩经济学成绩经济学成绩王翔王翔91 91 75 75 95 95 94 94 袁方袁方75 75 58 58 76 76 90 90 张松张松69 69 68 68 84 84
5、86 86 赵颖赵颖75 75 96 96 81 81 83 83 田雨田雨54 54 88 88 67 67 78 78 陈风陈风87 87 76 76 92 92 77 77 宋媛宋媛83 83 72 72 66 66 71 71 李华李华81 81 60 60 86 86 64 64 数据的预处理(数据的预处理(要求要求)将试卷上的成绩;录入数据的准确性和完整性;出四门课程成绩没有不及格者;将统计学成绩。3.3 分类数据的整理与显示分类数据的整理与显示一、基本问题一、基本问题二、分类数据的整理二、分类数据的整理三、分类数据的图示三、分类数据的图示 基本问题基本问题不同类型数据不同类型数据
6、所采取的整理与显示所采取的整理与显示方法不同方法不同。对分类数据和顺序数据主要是做对分类数据和顺序数据主要是做分类整理分类整理。 对数值型数据主要是做对数值型数据主要是做分组整理分组整理。适用于适用于低层次低层次数据的整理和显示方法也数据的整理和显示方法也适用于高适用于高层次层次的数据;而的数据;而高层次高层次数据的整理和显示方法数据的整理和显示方法并并不适用于低层次不适用于低层次数据数据。分类分类数据的整理数据的整理(举例举例)1、您所居住的小区所处的行政区域是、您所居住的小区所处的行政区域是 区。区。分类数据的整理分类数据的整理(基本过程基本过程)列出各类别;列出各类别;计算各类别的计算各
7、类别的频数频数;制作频数分布表;制作频数分布表;用图形显示数据。用图形显示数据。落在某一特定类别(或落在某一特定类别(或组)中的数据个数组)中的数据个数分类数据的整理分类数据的整理(转换并计数转换并计数)分类数据的图示分类数据的图示(条形图、饼形图)条形图、饼形图)能在能在PPT上直接作吗?上直接作吗?The Answer isThe Answer is: : Yes!Yes!分类数据的图示分类数据的图示(条形图、饼形图条形图、饼形图)3.4 顺序数据的整理与图示顺序数据的整理与图示一、顺序数据的整理一、顺序数据的整理二、顺序数据的图示二、顺序数据的图示顺序数据的整理(顺序数据的整理(举例举例
8、)关于新关于新南京市物业管理办法南京市物业管理办法实施情况的实施情况的调调查(一)查(一): 1、您知道今年2月份施行的新南京市物业管理办法吗? A. 不知道 B. 知道一些 C. 知道9、您知道本小区的维修专项资金的使用情况吗? A. 不知道 B. 知道一些 C. 知道顺序数据的整理顺序数据的整理(结果录入结果录入)顺序数据顺序数据是从类别顺序的开始一方向其最后一方累加是从类别顺序的开始一方向其最后一方累加频数,而频数,而数值型数据数值型数据是从小的一方向大的累加频数。是从小的一方向大的累加频数。顺序数据的整理顺序数据的整理(结果整理结果整理)顺序数据的图示顺序数据的图示(累计频数图累计频数
9、图)顺序数据的图示顺序数据的图示(累计频数图累计频数图)顺序数据的图示(顺序数据的图示(环形图环形图)在在PPT里能做吗?里能做吗?Just try !3.5 数值型数据的整理与显示数值型数据的整理与显示一、数值型数据的分组一、数值型数据的分组二、数值型数据的整理二、数值型数据的整理三、数值型数据的图示三、数值型数据的图示数值型数据的分组数值型数据的分组分组方法分组方法单变量值分组单变量值分组组距分组组距分组等距分组等距分组异距分组异距分组单变量值分组单变量值分组将将每一个变量值作每一个变量值作为一组为一组。适用于适用于离散变量离散变量。适用于适用于变量值较少变量值较少的情况下。的情况下。A
10、A 班班学学生生年年龄龄分分布布表表年年龄龄 人人数数 频频率率 1 17 7 1 18 8 1 19 9 2 20 0 2 21 1 6 6 1 14 4 1 18 8 9 9 3 3 0 0. .1 12 20 0. .2 28 80 0. .3 36 60 0. .1 18 80 0. .0 06 6合合计计 5 50 0 1 1. .0 00 0组距分组(组距分组(举例举例)组距分组(组距分组(要点要点)将全部变量值依次划分为若干个区间,并将这将全部变量值依次划分为若干个区间,并将这一区间的变一区间的变量值称为一组量值称为一组适用于适用于连续变量连续变量或或变量值较多变量值较多的情况下
11、的情况下需要遵循需要遵循“不重不漏不重不漏”的原则的原则如何做到如何做到呢?呢?(1)不重:)不重: 1)连续变量:相邻组限重叠,)连续变量:相邻组限重叠,“上组限不在本组内上组限不在本组内” 2)离散变量:另外可采用)离散变量:另外可采用相邻组限间隔相邻组限间隔的办法的办法(2)不漏:)不漏: 1)认真检查;)认真检查; 2)在最大最小值与其它值相距甚远时采用)在最大最小值与其它值相距甚远时采用开口组开口组组距分组(组距分组(基本概念基本概念)组数(组数(K):):组的数目组的数目组限组限:分组的数量界限,包括上限(:分组的数量界限,包括上限(U)、下)、下限(限(L)闭口组闭口组:上限和下
12、限齐全的组:上限和下限齐全的组开口组开口组:有上限而缺下限或者有下限而缺上限:有上限而缺下限或者有下限而缺上限的组的组组距(组距(i) :各组上限与下限之差(:各组上限与下限之差(i= UL )组距分组(组距分组(基本概念基本概念)全距(全距(R): R =Xmax Xmin= i 如:某班某门课的考试成绩最高为如:某班某门课的考试成绩最高为98分,最低为分,最低为45分分R=53分分组中值组中值:各组上限与下限的中点值各组上限与下限的中点值推测本组平均水平推测本组平均水平(1)在闭口组中在闭口组中:组中值组中值= =(U+L)/2(2)在开口组中在开口组中:首组组中值首组组中值= =(U+L
13、)/2=U+(Ui)/2= =Ui/2=U邻组邻组i/2末组组中值末组组中值=(U+L)/2=L+(L+i)/2 =L+i/2=L+邻组邻组i/2前提(假定):各组数据在本组内均匀分布或组中前提(假定):各组数据在本组内均匀分布或组中值两侧呈对称分布值两侧呈对称分布组距分组(组距分组(基本步骤基本步骤)确定组数确定组数K 。组数的确定应以能够显示数据的分布特组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可采用征和规律为目的。在实际分组时,可采用斯特奇斯斯特奇斯(Sturges )经验公式确定,亦可根据数据的多少和特点)经验公式确定,亦可根据数据的多少和特点及分析的要求,参考这
14、一标准灵活确定。及分析的要求,参考这一标准灵活确定。lg1lg2,nK 其 中 n为 数 据 的 个 数 ,结 果 四 舍 五 入 取 整 数确定组距确定组距 i 。(1)等距分组:)等距分组:i=R/K(2)异距异距分组:对某些特定现象或为了特定研究目的需分组:对某些特定现象或为了特定研究目的需要,可自行确定不等的组距。要,可自行确定不等的组距。根据分组整理成频数分布表根据分组整理成频数分布表频数分布表(频数分布表(相邻组组限间隔相邻组组限间隔)频数分布表(频数分布表(相邻组组限重叠)相邻组组限重叠)频数分布表(频数分布表(使用开口组使用开口组)异距分组异距分组它适用于某些特殊情况或特定需要
15、。它适用于某些特殊情况或特定需要。为消除各组次数受组距大小不同的影响,更确切地反映各为消除各组次数受组距大小不同的影响,更确切地反映各组次数的实际分布,可计算组次数的实际分布,可计算次数密度次数密度或或标准组距次数标准组距次数。次数密度次数密度就是单位组距内分布的次数。就是单位组距内分布的次数。()( )ifi次数次数密度组距标准组距次数标准组距次数是选定数列中某一合适的组距作为标准组距,是选定数列中某一合适的组距作为标准组距,用各组次数密度分别乘以标准组距得到的折合次数。用各组次数密度分别乘以标准组距得到的折合次数。标准组距次数次数密度 标准组距数值型数据的图示数值型数据的图示(一)分组数据
16、:(一)分组数据:直方图和折线图直方图和折线图(二)未分组数据:(二)未分组数据:茎叶图和箱形图茎叶图和箱形图(三)时间序列数据:(三)时间序列数据:线图线图(四)多变量数据:(四)多变量数据:雷达图雷达图适用于低层次数据的整理和显示方法也适用于高层次的数适用于低层次数据的整理和显示方法也适用于高层次的数据;而高层次数据的整理和显示方法并不适用于低层次数据。据;而高层次数据的整理和显示方法并不适用于低层次数据。条形图、饼图、环形图、累积分布图等都适用于显示数值型数据条形图、饼图、环形图、累积分布图等都适用于显示数值型数据其他图示形其他图示形式式分组数据(分组数据(直方图直方图)分组数据(分组数
17、据(直方图直方图VS条形图条形图)条形图条形图是用条形的长度表示各类别频数的多少,是用条形的长度表示各类别频数的多少,其宽其宽度是固定的。度是固定的。直方图直方图是用面积表示各组频数的多少,矩形的高度表是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距,因此示每一组的频数或频率,宽度表示各组的组距,因此其高度与宽度均有意义。其高度与宽度均有意义。直方图的各矩形通常是连续排列的,而条形图是分开直方图的各矩形通常是连续排列的,而条形图是分开排列。排列。条形图主要用于展示分类数据,而直方图则主要用于条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据展示数值型数
18、据分组数据(分组数据(折线图折线图)折线图也称为频数多边形图。折线图也称为频数多边形图。它是在直方图的基础上,把直方图顶部的中点(组中值)它是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。用直线连接起来,再把原来的直方图抹掉。折线图的两个终点要与横轴相交,具体做法是:折线图的两个终点要与横轴相交,具体做法是:1)第一个矩形的顶部中点通过竖边中点第一个矩形的顶部中点通过竖边中点(即该组频数一(即该组频数一半的位置)半的位置)连接到横轴,最后一个矩形顶部中点与其竖边连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴中点连接到横轴;2)折线图下围成的面积与直
19、方图的面积相等,两者所表)折线图下围成的面积与直方图的面积相等,两者所表示的频数分布是一致的。示的频数分布是一致的。分组数据分组数据-折线图(折线图(举例举例)某电脑公司某电脑公司20022002年前年前4 4个月销量分布折线图个月销量分布折线图未分组数据(未分组数据(茎叶图茎叶图-举例举例)未分组数据(未分组数据(茎叶图茎叶图-基本茎叶图基本茎叶图)未分组数据(未分组数据(茎叶图茎叶图-概念概念)由由“茎茎”和和“叶叶”两部分组成,其图形由数字组成。两部分组成,其图形由数字组成。以该组数据的以该组数据的高位数值高位数值作树作树茎茎,低位数字低位数字作树作树叶叶。树叶上只保留树叶上只保留最后一
20、位最后一位数字数字;对于对于n(20300)个数据,茎叶图)个数据,茎叶图最大行数最大行数不超过不超过5. 茎叶图类似于横置的直方图,但又有区别:茎叶图类似于横置的直方图,但又有区别: 直方图可观察一组数据的分布状况,但没有给出具体直方图可观察一组数据的分布状况,但没有给出具体的数值的数值 茎叶图既能给出数据的分布,又能给出每一个原始数茎叶图既能给出数据的分布,又能给出每一个原始数值,保留了原始数据的信息值,保留了原始数据的信息10lgLn未分组数据(未分组数据(茎叶图茎叶图-扩展茎叶图扩展茎叶图)未分组数据(未分组数据(箱形图箱形图-举例举例)未分组数据(未分组数据(单批数据箱形图单批数据箱
21、形图)销售量260240220200180160140120利用利用SPSS绘制的绘制的“某电脑公司某电脑公司2002年前年前4个月销售量的箱形图个月销售量的箱形图”如何手绘或利用如何手绘或利用EXCEL绘制?绘制?未分组数据(未分组数据(箱形图箱形图-概念概念)由一组数据的由一组数据的最大值最大值、最小值最小值、中位数中位数和和下四位数下四位数QL、上四位数上四位数QU5个特征值绘制个特征值绘制而成的,它由而成的,它由一个箱子一个箱子和和两条线段两条线段组成。组成。绘制步骤:绘制步骤:(1)首先找出一组数据的)首先找出一组数据的5个特征值;个特征值;(2)连接两个四分位数画出箱子,再将两)连
22、接两个四分位数画出箱子,再将两个极值点与箱子相连接。个极值点与箱子相连接。箱形图与数据分布的关系箱形图与数据分布的关系未分组数据(未分组数据(多批数据箱形图多批数据箱形图)8门课程考试成绩箱形图1010101010101010N =体育土木工程思想道德计算机环境保护高等数学程序设计工程制图100959085807570656011名同学8门课程考试成绩箱形图8888888888N =ZJBLXMSJYXZYLDCRZPCBBHYHCN100908070604时间序列数据(时间序列数据(线图线图) 时间序列数据时间序列数据:在不同时间点上获取的数值型数据:在不同时间点上获取的数值型数据 线图线图
23、:在平面坐标上用折线表现数量变化特征和规律的图形:在平面坐标上用折线表现数量变化特征和规律的图形1993-2000年城乡居民年城乡居民人均可支配人均可支配收入对比表收入对比表时间数列(时间数列(线图线图-举例举例)多变量数据(多变量数据(雷达图雷达图-举例举例)多变量数据(多变量数据(雷达图雷达图-概念概念)它是一种用于它是一种用于显示多变量的图示方法显示多变量的图示方法。它在显示或对比各变量的数值总和时十分它在显示或对比各变量的数值总和时十分有用。有用。假定各变量的取值具有相同的正负号,则假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。总的绝对值与图形所围成的区域成正
24、比。利用它可以研究利用它可以研究多个样本之间的相似程度多个样本之间的相似程度。多变量数据(多变量数据(雷达图雷达图-步骤步骤)数据类型及图示数据类型及图示小结小结3.6 统计表统计表一、统计表的构成一、统计表的构成二、统计表的设计二、统计表的设计统计表的构成统计表的构成1999-2000年城镇居民家庭资料抽样调查资料年城镇居民家庭资料抽样调查资料项目项目单位单位19992000调查户数调查户数户户 40 044 42 220平均每户家平均每户家庭人口庭人口人人3.143.13平均每人全平均每人全部年收入部年收入元元5 888.776 316.81平均每人消平均每人消费性支出费性支出元元4 615.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024简单家具维修合同范本
- 2024年加工承揽合同标的与质量标准
- 2024建筑材料采购合同范本下载
- 2024年度公园绿化树苗采购合同
- 2024年山东潍坊物业委托管理合同
- 迷雾解说课件教学课件
- 2024年度互联网金融产品研发与推广合同
- 04版智能家居系统研发与销售合同
- 2024年度云服务提供商合同
- 2024年店铺投资合作协议
- 护理质量安全与风险管理的案例分析
- 工程流体力学课后习题答案-(杜广生)
- AI智能客服应用实践
- 《止吐药临床应用》课件
- 幕墙工程检验批质量验收记录
- 危险化学品经营企业安全生产奖惩制度范本
- 报价单模板完
- 30题药品质量检测岗位常见面试问题含HR问题考察点及参考回答
- 《婴幼儿行为观察、记录与评价》期末试卷及答案 卷3
- 企业战略管理概述
- 消防安全概述
评论
0/150
提交评论