




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学原理李德智副教授/博士东南大学土木工程学院建设与房地产系163第3章统计整理统计工作的过程统计整理统计分析实际问题统计设计统计调查统计预测统计决策第2章统计调查思考题某市场调查共发放问卷2000份,其中每份问卷包含15题、每题4个选项,请问如何整理?需要利用计算机吗?如果需要,请问如将统计数据输入计算机?某课程共有96人参加考试,其成绩分布为:8人优秀、40人良好、35人中等、9人及格、4人不及格。请问用什么图表可以较好地表示该成绩分布?第3章统计整理3.1统计整理的涵义3.2数据的预处理3.3分类数据的整理与显示3.4顺序数据的整理与显示3.5数值型数据的整理与显示3.6统计表3.1统计整理的涵义一、统计整理的概念二、统计整理的内容使统计数据由个体特征过渡到总体特征的工作过程1000+1250++750=5亿元
5亿/50=1000万元/家例如:通过调查得某班平均成绩为3.5分/人(五分制)则百分制下其平均成绩:5:100=3.5:X,X=70分。统计整理的概念统计整理的统计数据包括一手数据和二手数据例如:某市50家建筑企业年利润额如下,求其平均值统计整理的内容3.2数据的预处理数据的预处理数据录入数据审核数据筛选数据排序完整性准确性递增排序递减排序数据的预处理(举例)8名同学四门课程成绩分布姓名统计学成绩数学成绩英语成绩经济学成绩王翔91759594袁方75587690张松69688486赵颖75968183田雨54886778陈风87769277宋媛83726671李华81608664数据的预处理(要求)将试卷上的成绩录入EXCEL;审核录入数据的准确性和完整性;筛选出四门课程成绩没有不及格者;将统计学成绩递增排序。思考:如何对调查问卷中的数据进行预处理呢?3.3分类数据的整理与显示一、基本问题二、分类数据的整理三、分类数据的图示
基本问题不同类型数据所采取的整理与显示方法不同。对分类数据和顺序数据主要是做分类整理。对数值型数据主要是做分组整理。适用于低层次数据的整理和显示方法也适用于高层次的数据;而高层次数据的整理和显示方法并不适用于低层次数据。思考:如何确定数据类型呢?分类数据的整理(举例)1、您所居住的小区所处的行政区域是
区。分类数据的整理(基本过程)列出各类别;计算各类别的频数;制作频数分布表;用图形显示数据。落在某一特定类别(或组)中的数据个数思考:EXCEL、SPSS能够处理文字吗?分类数据的整理(转换并计数)分类数据的图示(条形图、饼形图)能在PPT上直接作吗?TheAnsweris:
Yes!分类数据的图示(条形图、饼形图)思考:还有别的方法吗?3.4顺序数据的整理与图示一、顺序数据的整理二、顺序数据的图示顺序数据的整理(举例)关于新《南京市物业管理办法》实施情况的调查(一):
1、您知道今年2月份施行的新《南京市物业管理办法》吗?
A.
不知道B.
知道一些C.
知道9、您知道本小区的维修专项资金的使用情况吗?
A.
不知道B.
知道一些C.
知道顺序数据的整理(结果录入)顺序数据是从类别顺序的开始一方向其最后一方累加频数,而数值型数据是从小的一方向大的累加频数。顺序数据的整理(结果整理)顺序数据的图示(累计频数图)顺序数据的图示(累计频数图)顺序数据的图示(环形图)在PPT里能做吗?Justtry!3.5数值型数据的整理与显示一、数值型数据的分组二、数值型数据的整理三、数值型数据的图示数值型数据的分组分组方法单变量值分组组距分组等距分组异距分组单变量值分组将每一个变量值作为一组。适用于离散变量。适用于变量值较少的情况下。组距分组(举例)组距分组(要点)将全部变量值依次划分为若干个区间,并将这一区间的变量值称为一组适用于连续变量或变量值较多的情况下需要遵循“不重不漏”的原则如何做到呢?(1)不重:
1)连续变量:相邻组限重叠,“上组限不在本组内”
2)离散变量:另外可采用相邻组限间隔的办法(2)不漏:
1)认真检查;
2)在最大最小值与其它值相距甚远时采用开口组组距分组(基本概念)组数(K):组的数目组限:分组的数量界限,包括上限(U)、下限(L)闭口组:上限和下限齐全的组开口组:有上限而缺下限或者有下限而缺上限的组组距(i):各组上限与下限之差(i=U–L)组距分组(基本概念)全距(R):
R=Xmax
–Xmin=i
如:某班某门课的考试成绩最高为98分,最低为45分 R=53分组中值:各组上限与下限的中点值推测本组平均水平 (1)在闭口组中:组中值=(U+L)/2
(2)在开口组中:首组组中值=(U+L)/2=[U+(U-i)]/2=U-i/2=U-邻组i/2末组组中值=(U+L)/2=[L+(L+i)]/2=L+i/2=L+邻组i/2前提(假定):各组数据在本组内均匀分布或组中值两侧呈对称分布组距分组(基本步骤)确定组数K
。组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可采用斯特奇斯(Sturges
)经验公式确定,亦可根据数据的多少和特点及分析的要求,参考这一标准灵活确定。确定组距i
。
(1)等距分组:i=R/K
(2)异距分组:对某些特定现象或为了特定研究目的需要,可自行确定不等的组距。根据分组整理成频数分布表频数分布表(相邻组组限间隔)频数分布表(相邻组组限重叠)频数分布表(使用开口组)异距分组它适用于某些特殊情况或特定需要。为消除各组次数受组距大小不同的影响,更确切地反映各组次数的实际分布,可计算次数密度或标准组距次数。次数密度就是单位组距内分布的次数。标准组距次数是选定数列中某一合适的组距作为标准组距,用各组次数密度分别乘以标准组距得到的折合次数。数值型数据的图示(一)分组数据:直方图和折线图(二)未分组数据:茎叶图和箱形图(三)时间序列数据:线图(四)多变量数据:雷达图
适用于低层次数据的整理和显示方法也适用于高层次的数据;而高层次数据的整理和显示方法并不适用于低层次数据。条形图、饼图、环形图、累积分布图等都适用于显示数值型数据其他图示形式分组数据(直方图)思考:直方图与条形图一样吗?为什么?分组数据(直方图VS条形图)条形图是用条形的长度表示各类别频数的多少,其宽度是固定的。直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距,因此其高度与宽度均有意义。直方图的各矩形通常是连续排列的,而条形图是分开排列。条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据分组数据(折线图)折线图也称为频数多边形图。它是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。折线图的两个终点要与横轴相交,具体做法是:
1)第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴;
2)折线图下围成的面积与直方图的面积相等,两者所表示的频数分布是一致的。分组数据-折线图(举例)某电脑公司2002年前4个月销量分布折线图未分组数据(茎叶图--举例)未分组数据(茎叶图--基本茎叶图)未分组数据(茎叶图--概念)由“茎”和“叶”两部分组成,其图形由数字组成。以该组数据的高位数值作树茎,低位数字作树叶。树叶上只保留最后一位数字;对于n(20~300)个数据,茎叶图最大行数不超过5.
茎叶图类似于横置的直方图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布,又能给出每一个原始数值,保留了原始数据的信息未分组数据(茎叶图--扩展茎叶图)思考:能利用EXCEL绘制吗?SPSS呢?未分组数据(箱形图--举例)未分组数据(单批数据箱形图)利用SPSS绘制的“某电脑公司2002年前4个月销售量的箱形图”如何手绘或利用EXCEL绘制??未分组数据(箱形图--概念)由一组数据的最大值、最小值、中位数和下四位数QL、上四位数QU5个特征值绘制而成的,它由一个箱子和两条线段组成。绘制步骤: (1)首先找出一组数据的5个特征值; (2)连接两个四分位数画出箱子,再将两个极值点与箱子相连接。箱形图与数据分布的关系未分组数据(多批数据箱形图)8门课程考试成绩箱形图11名同学8门课程考试成绩箱形图时间序列数据(线图)
时间序列数据:在不同时间点上获取的数值型数据
线图:在平面坐标上用折线表现数量变化特征和规律的图形1993-2000年城乡居民人均可支配收入对比表时间数列(线图--举例)多变量数据(雷达图--举例)多变量数据(雷达图--概念)它是一种用于显示多变量的图示方法。它在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。利用它可以研究多个样本之间的相似程度。多变量数据(雷达图--步骤)数据类型及图示—小结3.6统计表一、统计表的构成二、统计表的设计统计表的构成1999-2000年城镇居民家庭资料抽样调查资料项目单位19992000调查户数户4004442220平均每户家庭人口人3.143.13平均每人全部年收入元5888.776316.81平均每人消费性支出元4615.914988.00资料来源:《中国统计年鉴2001》,北京,中国统计出版社,2001表头行标题数字资料列标题附加统计表的设计基本要求:科学、实用、简炼、美观;要合理安排统计表的结构,应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式;表头一般应包括表号、总标题和表中数据的单位等内容。如果表中全部数据同一计量单位,可在表的右上角标明;若各指标的计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 科技视角下的股市策略科技与投资的融合之道
- 生产安全管理与效率提升关系探讨
- 现代人心理健康现状与挑战
- 2025福建漳州市漳州市芗江人力资源服务有限公司招聘2人笔试参考题库附带答案详解
- 电竞产业发展与城市经济转型升级
- 科技发展与联通业务的协同增长策略
- 入股干股合同范本
- 科技发展背景下的职业教育德育新探
- 2025至2030年中国背胶袋数据监测研究报告
- 二零二五年度智能安防监控系统维护与数据安全保障合同
- 英语-广东省上进联考领航高中联盟2025届高三下学期开学考试题和答案
- 安全主任在2025年春季开学典礼上的讲话稿
- 2025届高考语文二轮复习语文备考策略
- 2025年春季新北师大版生物七年级下册全册教学课件
- 培训课件:律师客户沟通技巧
- 2025年春新外研版(三起)英语三年级下册课件 Unit5第1课时Startup
- 2025年春新外研版(三起)英语三年级下册课件 Unit1第2课时Speedup
- 区域临床检验中心
- 生物新教材培训的心得体会
- 2024年07月长沙农村商业银行股份有限公司2024年招考3名信息科技专业人才笔试历年参考题库附带答案详解
- 中医预防流感知识讲座
评论
0/150
提交评论