统计数据的整理及其显示_第1页
统计数据的整理及其显示_第2页
统计数据的整理及其显示_第3页
统计数据的整理及其显示_第4页
统计数据的整理及其显示_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章统计数据的整理与显示统计整理是根据统计研究的目的,将统计调查所得到的原始资料(也称初级资料)进行科学的分类和汇总,或对已经经过加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的、能够反映总体特征的综合资料的工作过程。例如,某班50名学生,调查其考分资料如下:7765835668709965737288667463718462528078847981645882766273758979616554928673685169647863766872778176上述这些考分(原始资料)的特点是零星分散、不系统、无规律,不能反映学生总体的学习情况。按考分分组(分)学生人数(人)60以下60~7070~8080~9090~10051518102合计50由表3-1可见,整理后的学生考分资料,较整理前的考分资料明显要条理、系统。由上表可见,在学生总体中,60分以下和90分以上的学生人数都较少,绝大多数学生的考分分布在60—89分之间。表3-1

所以,统计整理是统计调查的继续,是统计分析的前提,它实现了从个别单位的标志表现(标志值)向总体综合指标的过渡,在统计研究中起着承前启后重要的作用。统计数据的整理与显示3.1统计数据的整理程序

3.2品质数据的整理与显示

3.3数值型数据的整理与显示3.4次数分布及其类型3.5统计表与统计图学习目标充分认识统计整理在统计研究中的承前启后的地位;掌握统计数据的整理和显示方法,特别是分组与变量数列的编制;了解统计表和统计图的构成和展示,能实际设计统计表和统计图。统计数据整理的程序1.制定整理方案(汇总方案);2.对调查资料进行审核和纠正等(预处理);3.进行统计分组(关键);4.进行统计汇总;5.汇总后审核;6.编制统计表,绘制统计图,显示整理结果。

根据统计调查目的,获得统计资料的整理流程计划:一是对总体资料的处理方法,如如何分组;二是确定用哪些具体的统计指标来说明总体。一、制定统计整理方案数据的审核发现数据中的错误数据的筛选找出符合条件的数据数据排序发现数据的基本特征升序和降序二、数据的预处理(1)统计资料的审核资料的审核

原始资料完整性准确性逻辑检查计算检查二手资料适用

时效审核对第一手数据:(1)完整性审核:检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全(2)准确性审核:

真实性:检查数据是否真实反映客观实际情况,内容是否符合实际——逻辑检查正确性:检查数据是否有错误,计算是否正确等——计算检查(定量数据)

审核核对第第二二手手数数据据::完整整性性::准确确性性::适用用性性::数据据的的来来源源、、口口径径以以及及有关背景资料料;时效性:尽可能使用最最新的数据。。(2)数据筛筛选当数据中的错错误不能予以以纠正,或者者有些数据不不符合调查的的要求而又无无法弥补时,,需要对数据据进行筛选。。数据筛选的内内容:将某些不符合合要求的数据据或有明显错错误的数据予予以剔除;将符合某种特特定条件的数数据筛选出来来,而不符合合特定条件的的数据予以剔剔除。(3)数据的的排序数据的排序按一定顺序将将数据排列,,以发现一些些明显的特征征或趋势,找找到解决问题题的线索排序有助于对对数据检查纠纠错,以及为为重新归类或或分组等提供供依据在某些场合,,排序本身就就是分析的目目的之一排序可借助于于计算机完成成。定类数据的排排序字母型数据,,排序有升序序降序之分,,但习惯上用用升序汉字型数据,,可按汉字的的首位拼音字字母排列,也也可按笔画排排序,其中也也有笔画多少少的升序降序序之分定距和定比数数据的排序递增排序:设设一组数据为为X1,X2,…,XN,递增排序后后可表示为::X(1)<X(2)<…<X(N)递减排序可表表示为:X(1)>X(2)>…>X(N)(五).汇总总后审核:审核汇总工作作质量,汇总总过程有无差差错。主要四四种方法:一是复计审核核;二是表表审核核;三是表实审核核;四是对照审核核。三.统计分组组分组前分组后统计分组就是是根据统计研究的目的和和被研究现象象的本质特征征,将统计总体体按照一定的的标志划分为为若干性质不不同的部分或或组。..统计分组是在总体内部部进行的一种定性分类类,它客观上把把总体划分为为一个个性质不不同,范围更更小的总体。统计分组有两个方面的的含义,即::统计分组对总体而言即将总体区分为性质不同的若干组成部分是“合”即将性质相同的总体单位合为一组是“分”对单位而言.1、统计分组组的作用划分现象的类类型(区分事事物的类型));研究总体的结结构(构成))或比例关系系;分析(探讨))现象之间的的依存关系。。注意:统计分分组是对总体认识识深化的手段段,它是一切切统计研究的的基础,应用用于统计工作作的全过程,,是统计研究究的基本方法法。2、统计分组组的原则穷尽原则互斥原则揭露社会经济济现象的类型型,反映各类类型的特点。。⑴类型分组类型1999年2000年2001年2002年农业14106.213873.614462.814931.5林业886.3936.5938.81033.5牧业6997.67393.17963.18454.6渔业2539.02712.62815.02971.1合计24519.124915.826179.627390.8例单位:亿元说明社会经济济现象的内部部结构。⑵结构分组例年份19961997199819992000第一产业20.419.118.617.615.9第二产业49.550.049.349.450.9第三产业30.130.932.133.033.2合计100.0100.0100.0100.0100.0“九五”期间间我国国内生生产总值构成成(%)研究经济现象象之间的依存存关系。⑶分析分组例耕作深度分组(cm)地块数平均收获率(斤/亩)10-12740012-141046014-161654016-1818-20125620680某乡某种农作作物的耕作深深度与收获率率的关系..3、统计分组组的种类(一)按分组标志的的多少不同(二)按分组组标志的性质质不同简单分组品质分组数量(变量))分组复合分组.4、统计分组组的方法分组标志的选选择:选择分分组标志是统统计分组的核心问题,必须根据统统计研究的目的选择分组标志志。品质分组:是是按品质标志志进行的分组组。国民经济按产产业分组:第第一产业第二产业第三产业人口按性别分分组:男男性女性用文字来表示示各组性质上上的差别..数量分组数量分组的概概念单项式分组与与组距式分组组进行组距式分分组时应注意意的问题..数量分组是按数量标志志进行的分组组。数量分组的概概念例如,学生按考分分分组(分)用数量来表示示各组性质上上的差别60以下60~7070~~8080~9090以以上..(1)单项式式分组:即即在变量分组组中,一个组组只有一个变变量值。单项式式分组组与组组距式式分组组适用条条件::它适用用于当当变量量值变变化范范围不不大、、不同同变量量值个个数较较少的的离散型型变量量的场合合。例如::居民家家庭按按子女女数分分组::0123(离散散型变变量))(2))组距式式分组组:就是将将变量量依次次划分分为几几段区区间,,一段段区间间表现现为从从“………到到………”距距离,,把一一段区区间内内的所所有变变量值值归为为一组组。。区间间的距距离就就是组组距。。例如::企业按按人数数分组组499及以以下500~~9991000~~29993000及及以上上工人按按工资资分组组600~~700700~~800800~~12001200~~1500适用条条件::它适用用于变变量值值变化化范围围较大大、不不同变变量值值个数数较多多的离散型型变量量及连续型型变量量的场合合。(离散型型变量量)(连续型型变量量)注意::连续型型变量量的数数值不不能一一一列列举,,故其其只能能采用用组距距式分分组。。进行组组距式式分组组时应应注意意的问问题(1)组限限及划划分方方法(2)等距距分组组与不不等距距分组组(3)组中中值499及以以下500~~9991000~~29993000及及以上上600~~700700~~800800~~12001200~~1500(1))组限限及划划分方方法组限::确立每每组界界限的的两个个数字字。其中,,每组组最大大变量量值称称为上限,每组最小小变量值值称为下限。工人按工工资分组组:(连续变变量)企业按人人数分组组:(离散变变量)(重叠组组限)(不重叠叠组限))组限的划划分方法法:组限的划划分方法法不重叠组组限重叠组限限(只适用用于离散型变变量)(适用于于连续型变变量和离离散型型变量.)重叠组限限:不重叠组组限:即相邻两两组的上上下限为为同一个个数值。。即相邻两两组的上上下限为为两个不不同的确确定数值值。故当某单单位的变变量值刚刚好等于于相邻两组组的上下下限时,一般把把此值归归到作为为下限的的那一组组中,即即遵循“上限不不在其内内”的原则。。..企业按人人数分组组:499及及以下500~~9991000~~29993000及及以上(不重叠叠组限))企业按人人数分组组:500以以下500~10001000~~30003000及及以上(重叠组组限)..(2)等等距分组组与不等等距分组组组距分组组等距分组组不等距分分组例如:按身高、、考分分分组等,,应采用用等距分分组。它它便于各各组间单单位数与与变量值值的直接接对比和和各项指指标计算算。适用场合合:等距分组组:即各各组组距距相同的的分组。。凡是在变变量值分分布比较较均匀时时采用。。组距:每每组变量量值的变变动范围围,即组组距=上限限–下下限不等距分分组:即各组组组距不都都相等的的分组。。适用场合合:当变量值值分布很很不均匀匀时采用用。不等距分分组多数数是根据据事物性性质变化化的数量量界限来来确定组组距,如如人口按按年龄分分组。要注意不不同年龄龄生理变变化的特特点,可可分为::1岁以下下;1~6岁岁;7~12岁;;13~~18岁岁;19~~59岁岁;60岁岁以上。。年龄段工人按工工资分组组(元)600~~700700~~800800~12001200~~1500.(3)组组中值组中值是指组距距数列中中各组上上限和下下限之间的中点数值值。注意:组中值经经常用来来代表各各组标志志值的平平均水平平,但要要假定各组内标标志值呈呈均匀分分布。按考分分分组50~~6060~~7070~~8080~~9090~~1005575658595组中值人数51518102..若第一组出出现“×××以下”或最末组出出现“×××以上”字样的组组叫做开口组。首组组中中值=首组上限限–相邻组组组距的一一半=末组下限限+相邻组组组距的一一半末组组中中值50–10/2100+10/2例如:.首组:末组:按考分分分组组组中中值50~~605560~~706570~807580~~908590~1009550以下下100以以上45105年均收入(元)频数(村)600—4000114000—5000355000—6000146000—100001610000—2500012合计88年均收入(元)频数(村)<4000114000—5000355000—6000146000—1000016>1000012合计88或例:某地地区农户户收入分分布编制:1、单变变量数列列还是组组距式数数列:变变量的性性质及变变异程度度离散型变变量且变变异小::单变量量数列离散型变变量但变变异大或或连续型型变量::组距式式数列例如:按按以五分分制计分分的成绩绩对全班班100名学生生进行分分组,宜宜单变量量数列;;按以百百分制计计分的成成绩对全全班100名学学生进行行分组,,宜组距距式数列列;例如:按按身高对对全班100名名学生分分组,只只能组距距式数列列。2、等距距数列还还是异距距数列::变量分分布的特特征当分布值值很不均均匀时,,一般采采用异距距数列。。如学生生成绩一一般密集集于某一一区间,,低于这这一区间间的学生生为少数数,高于于这一区区间的学学生也为为少数。。合理的的做法是是在密集集区间内内使用较较短的组组距,在在稀少区区间内使使用较长长的组距距。当等量的的标志值值不具有有相同的的意义时时,一般般采用异异距数列列。如::对新生生儿和成成人的年年龄,同同样的一一年或一一月,其其意义是是不同的的。进行行人口疾疾病研究究的年龄龄分组时时,一般般1岁以以下按月月分组,,1-10岁按按年分组组,11-20岁按5年分组组……当标志值值按一定定比例发发展变化化:某些些时候采采用公比比为10的不等等距分组组。如商商场按营营业额分分组为::5万元元以下、、5—50万元元、50—500万元元、500—5000万元………3、开口口数列还还是闭口口数列::极端变变量值偏偏离分布布中心的的程度。。极端变量量值(极极大值或或极小值值)远离离分布中中心:开开口数列列极端变量值值(极大值值或极小值值)接近分分布中心::闭口数列列例如:成绩绩:20分分1人、55分1人人、58分分3人、60—70分10人人……80—90分分30人、、91分3人、92分2人、、95分1人最小组:““<60分分”优于““20—60分”((实际平均均分49.8分)最大组:““90—95分”优优于“>90分”((实际平均均分92分分)同时兼顾习习惯。四、统计汇汇总频数:各组组内的总体体单位数频率:各组组内总体单单位数占总总体全部单单位数的比比率累计频数((率):各各组的频数数(率)累累计加和向上累计制制:由标志志值较小组组向较大组组累计。每每一组的累累计次数表表示小于该该组下限((变量)值值的次数共共有多少。。向下累计制制:由标志志值较大组组向较小组组累计。每每一组的累累计次数表表示大于该该组下限((变量)值值的次数共共有多少。。例考分次数向上累计向下累计

人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.04010040100某班统计学学考试成绩绩次数分配配审核汇总工工作质量,,汇总过程程有无差错错。主要四四种方法::一是复计审审核;二是表表审审核;三是表实审审核;四是对照审审核。五、汇总后后审核3.2品品质数据据的整理与与显示数据的整理理与显示的的基本问题题要弄清所面面对的数据据类型;不同类型的的数据,处处理方式和和方法不同同。适合于低层层次数据的的整理和显显示方法也也适合于高高层次的数数据;但适适合于高层层次数据的的整理和显显示方法并并不适合于于低层次的的数据。品质数据的的整理与显显示3.2.1定类类数据的整整理与显示示3.2.2定序序数据的整整理与显示示定类数据的的整理的基基本过程2.计算算各类别的的频数;3.制作作频数分布表表;分类频数比例百分比比率ABCDE列出各类别别;4.用图形显示数据;;定类数据的的整理(可可计算的统统计量)频数(frequency):落在各类类别中的数数据个数。。比例(proportion):某某一类别数数据占全部部数据的比比值。百分比(percentage):将对比的的基数作为为100而而计算的比比值。比率(ratio):不同同类别数值值的比值。。频数分布:也叫次数分分布,就是是把各个类类别及落在在其中的相相应频数全全部列出,,并用表格格的形式表表现出来。。按品质标志志分组形成成的频数分分布某厂职工人人数统计表表按性别分组组男职工工女职工工合计计人数(人))(频数)比例(%))(频率)25311536868.7531.25100.00定类数据整整理—频数数分布表【例1】一一家市场调调查公司为为研究不同同品牌饮料料的市场占占有率,对对随机抽取取的一家超超市进行了了调查。调调查员在某某天对50名顾客购购买饮料的的品牌进行行了记录,,如果一个个顾客购买买某一品牌牌的饮料,,就将这一一饮料的品品牌名字记记录一次。右边就是是记录的原原始数据。。绿色健康饮品一、定类数数据整理——频数分布布表【例3.1】为研究究广告市场场的状况,,一家广告告公司在某某城市随机机抽取200人就广告问问题做了邮邮寄问卷调调查,其中中的一个问问题是“您您比较关心心下列哪一一类广告??”1.商品广广告;2..服务广告告;3.金金融广告;;4.房地地产广告;;5.招生生招聘广告告;6.其其他广告。。表3-1某城市居民关注广告类型的频数分布

广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100定类数据的的图形显示示1、条形图(barchart)通过宽度相相同的条形形的高度或或长短来比较各类别数据据的图形有单式条形形图、复式式条形图等等形式主要用于反反映分类数数据的频数数或频率绘制时,各各类别可以以放在纵轴轴,称为条条形图,也也可以放在在横轴,称称为柱形图图(columnchart)定类数据的的图示—条条形图人数(人)5191610211204080120

商品广告

服务广告

金融广告

房地产广告

招生招聘广告

其他广告广告类型

图3-1某城市居民关注不同类型广告的人数分布定类数据的的图示2、饼图((piechart)也称圆形图图,是用圆圆形及圆内内扇形的角角度来表示示数值大小小的图形;;主要用于表表示样本或或总体中各各组成部分分所占的比比例,用于于研究结构性问题题;绘制圆形图图时,样本本或总体中中各部分所所占的百分分比用圆内内的各个扇扇形角度表表示,这些些扇形的中中心角度,,按各部分分数据百分分比占3600的相应比例例确定。定类数据的的图示—圆圆形图

其他广告1.0%

房地产广告8.0%

商品广告56.0%

金融广告4.5%

服务广告25.5%

招生招聘广告5.8%图3-2某城市居民关注不同类型广告的人数构成3.2.2定序序数据的整整理可计算的统统计量:对于定序数数据,除了了可用定类类数据整理理和显示的的方法之外外,还可以以计算:1.累累积频数(cumulativefrequencies)::各类别频数数的逐级累累加。2.累累积频率(cumulativepercentages)::各..在研研究究次次数数和和频频率率的的分分布布时时,,常常需需要要编编制制次次数数或或频频率率的的累累计计分分布布数数列列。。1.向向上上累累计计::是指指将将各各组组次次数数或或频频率率由由变量量值值低低的的组组向变量量高高的的组组累计计。2.向向下下累累计计::是指指将将各各组组次次数数或或频频率率,,由由变量量值值高高的的组组向变量量值值低低的的组组逐组组累计计。如::表3-2.累计计分分布布有有向上上累累计计和向下下累累计计两种种::如:二、、定定序序数数据据频频数数分分布布表表【例例3.2】】在在一一项项城城市市住住房房问问题题的的研研究究中中,,研研究究人人员员在在甲甲乙乙两两个个城城市市各各抽抽样样调调查查300户,其中的一一个问题是::“您对您家家庭目前的住住房状况是否否满意?1.非常不满满意;2.不不满意;3..一般;4..满意;5..非常满意。。表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————表3-3乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————顺序数据的图图示—累计频频数分布图243001322252700100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(a)向上累积27616830300750100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(b)向下累积甲城市家庭对对住房状况评评价的累积频频数分布环形图环形图中间有有一个“空洞洞”,样本或或总体中的每每一部分数据据用环中的一一段表示;与饼图类似,,但又有区别别:饼图只能显示示一个总体各各部分所占的的比例用于结构比较研究;用于展示分类和顺序数据。8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价环形图3.3数数值型数据的的整理与展示示数数据分分组与频数分分析数数值型型数据的图示示数数据分组组与频数分布布1、排序,求全距距(全距=最最大值-最小小值);2、确定变量量的数据形式式(单变量分分组、组距分分组);3、确定组数数:斯特格斯(Sturges)经验公公式:4、确定各组组组距:组距=全距/组数=(最最大值-最小小值)/组组数5、根据分组组整理成频数数分布表(确定各组组组限,计算频频数)数据分组的步步骤频数分布表的的编制实例【例2】某生生产车间50名工人日加工工零件数如下下(单位:个个)。对数据据进行分组。。1、排序,求求全距:全距=最大值值-最小值==139-107=322、确定变量量的数据形式式表3-3某车间50名工人日加工零件数分组表(**单变量值分组)零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123、确定组数数K=1+log10N/log102=1+3.322lgN=1+3.322×lg50≈74、确定各组组组距组距=全距/组数=(最大值--最小值)/组数=32/7=4.6≈55、根根据分分组整整理成成频数数分布布表表3-4某车间50名工人日加工零件数分组表(**组距分组:等距分组)按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100等距分分组表表(使使用开开口组组)表2-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~115115~120120~125125~130130~135135以上358141064610162820128合计50100频数分分布表表的编编制【例3】表中是是某电电脑公公司2005年年前四四个月月各天天的销销售量量数据据(单单位::台)。试试对数数据进进行分分组数数据值值型数数据的的图形形显示示Excel1、分分组数数据——直方方图和和折线线图2、未未分组数数据——茎叶叶图和和箱线线图分组数数据——直方方图(histogram)用于展展示分分组数据分分布的一种种图形形。用矩形形的宽宽度和和高度度来表表示频频数分分布。。本质上上是用用矩形形的面积来表示示频数数分布布在直角角坐标标系中中,用用横轴轴表示示数据据分组组,纵纵轴表表示频频数或或频率率,各各组与与相应应的频频数就就形成成了一一个矩矩形,,即直直方图图。直方图图下的的总面面积等等于1。直方图图的绘绘制140150210直方图下的面积之和等于1某电脑脑公司司销售售量分分布的的直方方图我一眼就看出来了,销售量在170~180之间的天数最多!190200180160170频数(天)25201510530220230240销售量量(台台)直方方图图与与条条形形图图的的区区别别条形形图图是是用用条条形形的的长长度度(横横置置时时)表表示示各各类类别别频频数数的的多多少少,,其其宽宽度度(表表示示类别别)则则是是固定定的;;直方方图图是是用用面积积表示示各各组组频频数数的的多多少少,,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,,宽宽度度则则表表示示各各组组的的组组距距,,其其高高度度与与宽宽度度均均有有意意义义;;直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,,条条形形图图则则是是分分开开排排列列;;条形形图图主主要要用用于于展展示示分分类类数数据据,,直直方方图图则则主主要要用用于于展展示示数数值值型型数数据据。。分组组数数据据——折折线线图图折线线图图也也称称频频数数多多边边形形图图;;是在在直直方方图图的的基基础础上上,,把把直直方方图图顶顶部部的的中中点点(组组中中值值)用用直直线线连连接接起起来来,,再再把把原原来来的的直直方方图图抹抹掉掉;;折线线图图的的两两个个终终点点要要与与横横轴轴相相交交,,具具体体的的做做法法是是第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖竖边边中中点点连连接接到到横横轴轴;;折线图下下所围成成的面积积与直方方图的面面积相等等,二者者所表示示的频数数分布一一致。折线图的的绘制折线图与与直方图图下的面积积相等!!140150210某电脑公公司销售售量分布布的折线线图190200180160170220230240频数(天)25201510530销售量((台)未分组数数据—茎茎叶图(stem-and-leaf)用于显示示未分组组的原始始数据的的分布由“茎””和“叶叶”两部部分构成成,其图图形是由由数字组组成的以以该组数数据的高高位数值值作树茎茎,低位位数字作作树叶,,树叶上上只保留留最后一一位数字字对于n(20n300)个数据据,茎叶叶图最大大行数不不超过L=[10××lgn]茎叶图类类似于横横置的直直方图,,但又有有区别::直方图可可观察一一组数据据的分布布状况,,但没有有给出具具体的数数值茎叶图既既能给出出数据的的分布状状况,又又能给出出每一个个原始数数值,保保留了原原始数据据的信息息直方图适适用于大大批量数数据,茎茎叶图适适用于小批量数数据树茎树叶788022347778889013344579910111213数据个数数3132410茎叶图类似横置的直方图茎叶图的的制作某车间工工人日加加工零件件数的茎茎叶图未分组数数据—箱箱线图(boxplot)用于显示示未分组组的原始始数据的的分布;;由一组数数据的5个特征征值绘制制而成,,它由一一个箱子子和两条条线段组组成;绘制方法法:首先找出出一组数数据的5个特征征值,即即最大值、最小值、中位数Me和两个四分位数数(下四分分位数QL和上四分分位数QU);连接两个个四分位位数画出出箱子,,再将两两个极值值点与箱箱子相连连接;该箱线图图也称为为Median/Quart./Range箱线图。。箱线图的的构成中位数4681012QUQLX最大值X最小值Median/Quart./Range箱线图图箱线图的的构成::单批数据据箱线图图最小值141最大值237中位数182下四分位数170.25上四分位数197140150160170180190200210220230240某电脑公司销售量数据的Median/Quart./Range箱线图分布的形形状与箱箱线图对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU不同分布布的箱线线图3.4次数分布布及其类类型次数分布布及其类类型分分配数列列的概念念和构成成要素分分配数列列的种类类及编制制方法次次数分布布的主要要类型..分分配数数列的概概念和构构成要素素分配数列列是指在统计分组组的基础上上,将总总体所有有单位按按组归类类排队,,形成总总体中各各单位在在各组间间的分布布,又称称分布数列列或统计分布布。分配数列列的概念念。按性别分组男生女生合计表3-6表3-7按考分分组

50~6060~7070~8080~9090~100合计人数(人)频率(%)20306040501005人数(人)频率(%)103010151850236420100..分配数列列的构成成要素分配数列列的构成成要素总体按某某标志所所分的各各个组各组次数数或频率次数(频频数)::频率:所以,次数或频频率分布布形成的的数列叫叫分配数数列。即分布在在各组的的单位数数。即各组次次数与总总次数之之比。..分分配数数列的种种类及编编制方法法(一)品品质数列列分配数列列的种类类1.单项项式变量数列2.组距式变变量数列(二)变量数数列..(一)品质分分配数列按品质标志分组组所形成的分配配数列称为品质分配数列列(品质数列列)。按性别分组人数(人)

频率(%)男生女生30206040合计50100一般来说品质质数列较容易易编制,它通通常能准确地地反映总体的的分配特征,,一旦分组标标志确定以后后,其分布数列的的形式是唯一一的。例如:表3-8..(二)变量数数列按数量标志分组组所形成的分布布数列称为变量分配数列列(变量数列列)。按顺序列出的的各组变量值值及相应的频频率,即成为为变量的频率分分布。按考分分组人数(人)频率(%)50~6060~7070~8080~9090~10051518102103036204合计50100例如:表3-9注意:任何一个频率分布都必须满足两个条件件:一是各组频率率≥0;二是是各组频率之之和等于100%。1.单项式变变量数列2.组距式变变量数列(由单项式分分组形成)居民家庭按子女数分组(个)户数(户)0123420601509040合计360按考分分组人数(人)频率(%)50~6060~7070~8080~9090~10051518102103036204合计50100表3-10(单项式变量数数列)(组距式变量数数列)表3-11变量数列(由组距式分分组形成)..次次数分布布的主要类型型次数分布类型型主要有三种种:钟型分布、UU型分布和J型分布。其分布特征是“两头小,中中间大”,即靠近中间的的变量值分布布分布的次数数多,靠近两两端的变量值值分布分布的的次数少。1.钟型分布布:fx正态分布即其分布曲线线形如一口古古钟,故称钟钟型分布例如如,如人的身高、体体重、职工工工资、农作物物亩产量、市市场价格、学学生的考分等等现象都属于于钟型分布。其分布又可分分为以下两种种:正态分布和偏态分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论