专题一 统计数据分析——统计数据概述_第1页
专题一 统计数据分析——统计数据概述_第2页
专题一 统计数据分析——统计数据概述_第3页
专题一 统计数据分析——统计数据概述_第4页
专题一 统计数据分析——统计数据概述_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、专题一专题一 统计数据概述统计数据概述商务统计商务统计 本章主要介绍了:本章主要介绍了:u数据来源数据来源u数据的计量尺度数据的计量尺度u数据的类别数据的类别u数据的整理数据的整理第一节第一节 数据来源数据来源 (data source)data source)数据的来源一般有直接和间接两种来源:数据的来源一般有直接和间接两种来源:直接来源直接来源间接来源间接来源原始数据(原始数据(raw data) )一般通过统计调查、统计实验等手段获得;一般通过统计调查、统计实验等手段获得;次级数据(次级数据(secondary data) )一般通过查阅、购买等手段获得。一般通过查阅、购买等手段获得。数

2、据获得渠道数据获得渠道 对于公司来说,所需要的数据主要是公司自对于公司来说,所需要的数据主要是公司自身的数据,这可以从公司的各种记录中得到;行身的数据,这可以从公司的各种记录中得到;行业数据、市场数据等可以通过自己组织调查或从业数据、市场数据等可以通过自己组织调查或从咨询调查公司购买得到;宏观数据则可以从政府咨询调查公司购买得到;宏观数据则可以从政府部门发布的年鉴、报告获得。还有一种就是通过部门发布的年鉴、报告获得。还有一种就是通过统计实验活动数据。统计实验活动数据。 对于政府发布的数据,一个重要获得途径是对于政府发布的数据,一个重要获得途径是政府网站。政府网站。Example:公司内部数据公

3、司内部数据职员记录职员记录:姓名、地址、社会保障号码、工薪、姓名、地址、社会保障号码、工薪、任职状况、其他个人情况;任职状况、其他个人情况;生产记录生产记录:部件或产品、生产量、管理成本、原部件或产品、生产量、管理成本、原料成本等;料成本等;销售记录销售记录:产品、销售量、区域销售量、客户类产品、销售量、区域销售量、客户类型销售量、营销成本等;型销售量、营销成本等;信用记录信用记录:客户名称、地址、电话、信用限额、客户名称、地址、电话、信用限额、应收帐款余额;应收帐款余额;客户记录客户记录:年龄、性别、收入水平、家庭情况、年龄、性别、收入水平、家庭情况、地址、爱好。地址、爱好。Example:

4、从专门收集和维护数据的组织中获从专门收集和维护数据的组织中获得商务和经济数据得商务和经济数据国外国外 如:邓布拉斯公司如:邓布拉斯公司( (Dun & Bradstreet) )、道、道- -琼斯公司是两个向客户琼斯公司是两个向客户提供大量商业数据的公司提供大量商业数据的公司;国内国内 如:央视调查咨询中心、零点市场如:央视调查咨询中心、零点市场调查与分析公司调查与分析公司。Example:试验数据试验数据例如:制药公司通过实验了解一种新药是否会影响例如:制药公司通过实验了解一种新药是否会影响血压或其他副作用;血压或其他副作用;又如,在正式实施某一策略前,进行小规模的试点,又如,在正式实施某一

5、策略前,进行小规模的试点,等等等等Example:政府机构是数据的重要来源政府机构是数据的重要来源中国统计年鉴及各省市地区统计年鉴中国统计年鉴及各省市地区统计年鉴各级政府工作报告各级政府工作报告国务院各有关部委发布的公告国务院各有关部委发布的公告其他官方资料其他官方资料Appendix:常用的一些免费数据网络地址常用的一些免费数据网络地址中国国家统计局以及各省市统计局官方网站中国国家统计局以及各省市统计局官方网站 http:/中国劳动社会保障部中国劳动社会保障部 http:/国家外汇管理局国家外汇管理局 http:/ http:/ Department of Commerce Bureau o

6、f Economic Analysis) 美国劳工部(美国劳工部(BLS,U.S. Department of Labor Bureau of Labor Statistics ) 第二节第二节 数据的计量尺度数据的计量尺度 (Scales of Measurement) 统计数据统计数据是对客观现象采用某种计量尺度对事物是对客观现象采用某种计量尺度对事物进行计量的结果进行计量的结果。 Data are the facts and figures that are collected, analyzed, and summa

7、rized for presentation and interpretation. 按照对事物计量的精确程度,可将所采用的按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级分为四个层次:计量尺度由低级到高级分为四个层次: 定类尺度定类尺度(Nominal Scale) 定序尺度定序尺度(Ordinal Scale) 定距尺度定距尺度(Interval Scale) 定比尺度定比尺度(Ratio Scale) 定类尺度(列名尺度),按照事物的某种属性对其进行平定类尺度(列名尺度),按照事物的某种属性对其进行平行的分类或分组。行的分类或分组。 例例1 1:人的性别(男、女);企业的所有制

8、性质(国有、:人的性别(男、女);企业的所有制性质(国有、私营等)私营等)u 特点特点 1 1、定类尺度只测度了事物之间的类别差,而对各类之间、定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,顺序可以的其他差别却无法从中得知,因此各类地位相同,顺序可以任意改变;具有对称性和传递性的特点。任意改变;具有对称性和传递性的特点。 ( 对称性:对称性:A A对对B B的关系,也就是的关系,也就是B B对对A A的关系;的关系; 传递性:传递性:A=B B=CA=B B=C,也即,也即A=CA=C) 2 2、对定类尺度的计量结果,可以且只能计算每一类别中、对定类

9、尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数各元素个体出现的频数(frequency)。 注意注意 对事物进行分类时,必须符合穷尽对事物进行分类时,必须符合穷尽(exhaustive)和互斥和互斥(mutually exclusive)要求要求。一、定类尺度一、定类尺度 定序尺度(顺序尺度),是对事物之间等级或顺序差别定序尺度(顺序尺度),是对事物之间等级或顺序差别的一种测度。的一种测度。 例例2 2:产品等级(一等品、二等品、产品等级(一等品、二等品、) 考试成绩(优、良、中、可、差)考试成绩(优、良、中、可、差)u 特点特点: 1 1、不仅可以测度类别差(分类),还可以测度

10、次序差、不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序);具有传递性(比较优劣或排序);具有传递性(ABAB,BC,BC,则则ACAC),不),不具有对称性。具有对称性。 2 2、无法测出类别之间的准确差值,因此该尺度的计量结、无法测出类别之间的准确差值,因此该尺度的计量结果只能排序,不能进行算术运算果只能排序,不能进行算术运算。二、定序尺度二、定序尺度 定距尺度(间隔尺度),是对事物类别或次序之间间距定距尺度(间隔尺度),是对事物类别或次序之间间距的测度。的测度。 例例3 3:100100分制考试成绩;分制考试成绩; 摄氏温度对不同地区温度的测量。摄氏温度对不同地区温度的测量。

11、u 特点特点: 1 1、具有定序尺度的所有特征,不仅能将事物区分为不同、具有定序尺度的所有特征,不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少;类型并进行排序,而且可准确指出类别之间的差距是多少; 2 2、定距尺度通常以自然或物理单位为计量尺度,因此测、定距尺度通常以自然或物理单位为计量尺度,因此测量结果表现为数值;量结果表现为数值; 3 3、计量结果可以进行加减运算、计量结果可以进行加减运算( (加减运算有意义加减运算有意义) ); 4 4、“0 0”是测量尺度上的一个测量点,并不代表是测量尺度上的一个测量点,并不代表“没有没有”三、定距尺度三、定距尺度 定比尺度(

12、比率尺度):是能够测算两个测度值之间比值定比尺度(比率尺度):是能够测算两个测度值之间比值的一种计量尺度。的一种计量尺度。 例例4 4:职工月收入;企业产值;公制的距离、重量:职工月收入;企业产值;公制的距离、重量u 特点特点: 1 1、与定距尺度属于同一层次,具有定距尺度的所有特征,、与定距尺度属于同一层次,具有定距尺度的所有特征,而且存在绝对零点。计量结果表现为数值;而且存在绝对零点。计量结果表现为数值; 2 2、除了具有其他三种计量尺度的计算特点外,还具有可、除了具有其他三种计量尺度的计算特点外,还具有可计算两个测度值之间比值的特点;计算两个测度值之间比值的特点; 3 3、“0 0”表示

13、表示“没有没有”,即它有一固定的绝对,即它有一固定的绝对“零点零点”,因此它可进行加、减、乘、除运算。因此它可进行加、减、乘、除运算。四、定比尺度四、定比尺度注意注意: 定距尺度中的定距尺度中的“0 0”并不表示并不表示“没有没有”,不是一个绝对的,不是一个绝对的“零点零点”;而定比尺度中的;而定比尺度中的“0 0”表示表示“没有没有”,是一个绝对的,是一个绝对的“零点零点”。 摄氏温度中的摄氏温度中的0 0度不是绝对零点;度不是绝对零点; 热力学温度中的热力学温度中的0K0K可以认为是绝对零点。可以认为是绝对零点。1 1、四种计量尺度对事物的计量层次是由低级到高级、由、四种计量尺度对事物的计

14、量层次是由低级到高级、由粗略到精确逐步递进的。粗略到精确逐步递进的。2 2、高层次的计量尺度可以计量低层次计量尺度能够计量、高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但反之不行;的事物,但反之不行;3 3、可将高层次计量尺度的计量结果转换为低层次计量尺、可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来。度的计量结果,但不能反过来。 Summarization: 四种计量尺度的区别与联系四种计量尺度的区别与联系 Exercises指出下面变量的测量尺度:指出下面变量的测量尺度: 学生住址距学校的距离;学生住址距学校的距离; 学生某门课的一次测验成绩(百分制);

15、学生某门课的一次测验成绩(百分制); 学生的出生地;学生的出生地; 按年级分类的高校学生;按年级分类的高校学生; 每周学生学习的小时数;每周学生学习的小时数; 夏季室外温度。夏季室外温度。第三节第三节 数据的分类数据的分类u 从数据的表现形式不同:从数据的表现形式不同: 定性数据和定量数据定性数据和定量数据u 从计量尺度的不同:从计量尺度的不同: 定类数据、定序数据、定距数据和定比数据定类数据、定序数据、定距数据和定比数据u 从数据的反映方式不同:从数据的反映方式不同: 绝对数、相对数和平均数绝对数、相对数和平均数u 从样本性质不同:从样本性质不同: 截面数据、时间序列和面板数据截面数据、时间

16、序列和面板数据u 从数据反映的范围不同:从数据反映的范围不同: 总体数据和样本数据总体数据和样本数据u 从数据内容不同:宏观经济数据、微观经济数据、从数据内容不同:宏观经济数据、微观经济数据、社会学数据、自然科学数据等等社会学数据、自然科学数据等等 从不同的角度可以对数据进行分类从不同的角度可以对数据进行分类一、数据表现形式不同一、数据表现形式不同u 定性数据定性数据(Qualitative data) 说明的是事物的品质特征,不能用数值表示(可以采用说明的是事物的品质特征,不能用数值表示(可以采用一定技术手段进行定量化),由定类尺度或定序尺度计量形一定技术手段进行定量化),由定类尺度或定序尺

17、度计量形成;成;u 定量数据定量数据 (Quantitative data) 说明的是事物的数量特征,能够用数值表示,由定距尺说明的是事物的数量特征,能够用数值表示,由定距尺度或定比尺度计量形成度或定比尺度计量形成。 对不同类型的数据,采用的统计方法会有所不同对不同类型的数据,采用的统计方法会有所不同 定性数据采用的分析方法较少:如组频率、非参数统计定性数据采用的分析方法较少:如组频率、非参数统计方法等;定量数据除了可采用定性数据的分析方法外,还可方法等;定量数据除了可采用定性数据的分析方法外,还可以采用更多的统计分析方法以采用更多的统计分析方法。二、按计量尺度的数据分类二、按计量尺度的数据分

18、类u定类数据定类数据:对称性和传递性(如性别、门牌号、生产日期)对称性和传递性(如性别、门牌号、生产日期)u定序数据定序数据:传递性(如产品等级、学历等):传递性(如产品等级、学历等)u定距数据定距数据:可比较相对大小(如温度)可比较相对大小(如温度)u定比数据定比数据:具有绝对零点,可比较相对大小和绝对大小:具有绝对零点,可比较相对大小和绝对大小(如收入、支出、产值、人口数等)(如收入、支出、产值、人口数等) 定类数据和定序数据属于定性数据,定距数据和定比数定类数据和定序数据属于定性数据,定距数据和定比数据属于定量数据。据属于定量数据。商务统计商务统计 实践中,对于通过计数和数学运算得到的定

19、量数据具有三种实践中,对于通过计数和数学运算得到的定量数据具有三种基本表现形式:绝对数、相对数和平均数。(均可现实解释)基本表现形式:绝对数、相对数和平均数。(均可现实解释)三、数据反映形式不同(经济统计中)三、数据反映形式不同(经济统计中)1 1、绝对数、绝对数( (Absolute number ) ) 绝对数是统计数据的最基本表现形式,表明事物(现绝对数是统计数据的最基本表现形式,表明事物(现象)的绝对数量特征,即绝对规模或水平。象)的绝对数量特征,即绝对规模或水平。 如:人口、如:人口、GDPGDP、进口额、出口额、商品零售额等、进口额、出口额、商品零售额等绝对数由于反映的是现实中的现

20、象规模和水平,因此具绝对数由于反映的是现实中的现象规模和水平,因此具有计量单位:有计量单位: 实物单位(吨、公里)实物单位(吨、公里) 价值单位(元、万元)、价值单位(元、万元)、 复合单位(吨公里、千瓦时)复合单位(吨公里、千瓦时) 双重双重/ /多重单位(马力多重单位(马力/ /台、吨台、吨/ /(立方米(立方米座座年)年)时期数和时点数特点时期数和时点数特点: 1 1、时期数可连续计量,并可累加;、时期数可连续计量,并可累加;2 2、时点数只可间断计量,一般不能累加(累加无现实解、时点数只可间断计量,一般不能累加(累加无现实解释)。释)。 绝对数按其反映事物现象的时间状况不同可分为时期数

21、绝对数按其反映事物现象的时间状况不同可分为时期数和时点数:和时点数: 时期数(时期数(periodical number) 反映事物现象在一定反映事物现象在一定时期内的总量,如:产量、产值、出生人口;时期内的总量,如:产量、产值、出生人口; 时点数时点数(time-point number)反映事物现象在某一瞬反映事物现象在某一瞬间时刻上的总量,如:人口数、土地面积等。间时刻上的总量,如:人口数、土地面积等。2 2、相对数(、相对数(relative number) ) 相对数是一般是两个绝对数的比值,反映事物的相对水相对数是一般是两个绝对数的比值,反映事物的相对水平;但有时也可以是两个相对数

22、或者两个平均数的对比。平;但有时也可以是两个相对数或者两个平均数的对比。100%1或NNNNNNk21u相对数的表现形式:相对数的表现形式: 比例、比率。比例、比率。 例例5 5:一数量为一数量为N N的总体被分为的总体被分为K K个部分,各部分的数量分别个部分,各部分的数量分别为为 N Ni i,则比例定义为:,则比例定义为:N Ni i/N/N。显然有:。显然有:比例比例(ProportionProportion) : 总体中各个部分的数量占总体数量的比重,反映总总体中各个部分的数量占总体数量的比重,反映总体的构成或结构体的构成或结构。一般以百分数等表示一般以百分数等表示。百分数(百分数(

23、PercentagePercentage):将对比的基数抽象化为):将对比的基数抽象化为100100而计算的相对数。而计算的相对数。比率比率(RationRation) :各不同类别的数量比值。各不同类别的数量比值。可以是同一总体中不同部分的比较可以是同一总体中不同部分的比较(系数、倍数)(系数、倍数) 如,人口中:男性人口数如,人口中:男性人口数/ /女性人口数;女性人口数; GDPGDP中:投资中:投资/ /消费;消费;可以是同一现象在不同空间上的对比可以是同一现象在不同空间上的对比(系数、倍数(系数、倍数) 如,不同地区如,不同地区GDPGDP之比之比 两个地区经济水平差异两个地区经济水

24、平差异 可以是同一总体同一现象在不同时空的对比,即速度可以是同一总体同一现象在不同时空的对比,即速度(% %) 如,不同年份如,不同年份GDPGDP之比之比 经济发展速度经济发展速度 可以是不同现象绝对数之间的对比,即强度相对数可以是不同现象绝对数之间的对比,即强度相对数 如,人均如,人均GDPGDP、数字电视普及率、外贸依存度等、数字电视普及率、外贸依存度等 可以是不同相对数或平均数对比(系数、倍数)可以是不同相对数或平均数对比(系数、倍数) 如,需求价格弹性、相对汇率等如,需求价格弹性、相对汇率等 3 3、平均数(、平均数(average numberaverage number) 一般来

25、说,经济统计中平均数是两个绝对数之比,分子一般来说,经济统计中平均数是两个绝对数之比,分子反映总体某种特征总量,分母则是总体(总体可是某个时间反映总体某种特征总量,分母则是总体(总体可是某个时间跨度)中所包含的元素(元素可以是时期或时点)总数。可跨度)中所包含的元素(元素可以是时期或时点)总数。可以分为空间(静态)平均数和序时(动态)平均数。以分为空间(静态)平均数和序时(动态)平均数。 经济统计中,一般要求计算过程和计算结果有实际含义经济统计中,一般要求计算过程和计算结果有实际含义(时点数计算过程除外),因此:(时点数计算过程除外),因此: 计算相对数或者平均数的空间(静态)平均数时,计算相

26、对数或者平均数的空间(静态)平均数时,总是先转化为分子绝对数和分母绝对数,再对比;总是先转化为分子绝对数和分母绝对数,再对比;计算相对数或者平均数的序时(动态)平均数时,则计算相对数或者平均数的序时(动态)平均数时,则是先计算相对数或者平均数分子绝对数、分母绝对数的是先计算相对数或者平均数分子绝对数、分母绝对数的序时平均数,再对比。序时平均数,再对比。四、按样本性质不同四、按样本性质不同u截面数据(截面数据(Cross-sectional dataCross-sectional data) ) :同一时点或时期的:同一时点或时期的总体各单位的数据。总体各单位的数据。 u时间序列数据(时间序列数

27、据(Time series dataTime series data) :将若干个时间上:将若干个时间上搜集来的反映相同内容的数据按时间先后顺序排列在一起,搜集来的反映相同内容的数据按时间先后顺序排列在一起,便形成了时间序列数据。便形成了时间序列数据。 u面板数据(面板数据(Panel dataPanel data):截面数据和时间序列数据交织):截面数据和时间序列数据交织在一起所形成的数据集。面板数据既具有截面数据的特征,在一起所形成的数据集。面板数据既具有截面数据的特征,又具有时间序列数据的特征。又具有时间序列数据的特征。 年份年份进口总额进口总额20032003119.3119.3200

28、2200293.793.72001200188.088.02000200081.281.21999199955.255.21998199846.946.9表表1 1 辽宁省各年进口总额辽宁省各年进口总额单位:亿美元单位:亿美元资料来源:资料来源:中国统计年鉴中国统计年鉴20042004Example:Time series data地地 区区消费品零售总额消费品零售总额(亿元人民币)(亿元人民币)进口总额进口总额(亿美元)(亿美元) 北京北京1916.71916.7516.1516.1天津天津922.3922.3149.9149.9河北河北1841.61841.630.530.5山西山西729

29、.37内蒙古内蒙古676.8676.816.716.7辽宁辽宁2330.82330.8119.3119.3表表2 20032 2003年中国各地区主要经济指标年中国各地区主要经济指标资料来源:资料来源:中国统计年鉴中国统计年鉴20042004Example:Cross-sectional dataExample:Panel data地区 年份200320022001200019991998北京1916.71744.81593.51443.31313.31167.2天津922.3941.4832.7736.6657.3587.1河北1841.61968.31778.31613

30、.91458.81332.6山西729.3755.4679.9629.1587.1547.1内蒙古676.8606537.3484437.4399.5辽宁2330.82258.42034.91847.61696.11568.7表表3 3 中国各地区社会消费品零售总额中国各地区社会消费品零售总额资料来源:资料来源:中国统计年鉴中国统计年鉴20042004单位:亿元单位:亿元第四节第四节 数据整理数据整理(Summarizing Data)Summarizing Data) 按照升序(按照升序(ascending)ascending)或者降序(或者降序(descendingdescending)将

31、所)将所有数据排列,这是整理的第一步。有数据排列,这是整理的第一步。u排序目的排序目的 通过浏览数据发现一些明显的特征趋势或解决问题的通过浏览数据发现一些明显的特征趋势或解决问题的线索;线索; 有助于数据的检查纠错;有助于数据的检查纠错; 为分组提供依据。为分组提供依据。一、排序(一、排序(ordering data)二、数据分组和分布数列二、数据分组和分布数列数据分组数据分组/ /分类分类(data grouping/classificationdata grouping/classification) 统计整理的重要手段。数据分组就是根据研究的需要,统计整理的重要手段。数据分组就是根据研究

32、的需要,将总体按照一定的标志区分为若干个组成部分的一种统计将总体按照一定的标志区分为若干个组成部分的一种统计方法。进行排序分组后,再计算出组频数或频率,列成一方法。进行排序分组后,再计算出组频数或频率,列成一定的表式就是分布数列(定的表式就是分布数列(distribution series)。)。u目的目的 将总体中的具有不同性质元素进行分类,以对数据的将总体中的具有不同性质元素进行分类,以对数据的内部结构进行了解,以便进一步进行统计分析。内部结构进行了解,以便进一步进行统计分析。组内差异小和组间差异大组内差异小和组间差异大 确定组数确定组数 确定组距确定组距(按组按组)整理成分布频数表整理成

33、分布频数表 三、分组及频数计算基本步骤三、分组及频数计算基本步骤例例6 一会计事务所对其一会计事务所对其2020家客户家客户(clients)(clients)年底帐目辑核年底帐目辑核(audits)(audits)时间(天)统计如下表:时间(天)统计如下表:Table 4 Year-End Audit Times(in days) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13这里分组主要指组距数列的分组。这里分组主要指组距数列的分组。u 第一步,确定组数第一步,确定组数(Number of classes)(Numbe

34、r of classes)。组数的确定一。组数的确定一般视数据本身的特点及数据的多少而定。般视数据本身的特点及数据的多少而定。210101loglogNK 经验上以经验上以5 52020之间为好,尤其注意不要确定太多的组之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。数,使得每组包含的数据太少。 其中其中N N为数据的个数,一般对结果取整数。为数据的个数,一般对结果取整数。例例9 9中:中:K=1+lg20/lg2=1+4.32=5.32K=1+lg20/lg2=1+4.32=5.32 5 5 实际分组时常按斯特格斯(实际分组时常按斯特格斯(SturgesSturges)提出的经

35、验公)提出的经验公式来确定组数式来确定组数K K:u 第二步,确定组距第二步,确定组距(Width of classes)(Width of classes):组距是一个:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定:值及所分的组数来确定: 组距组距= =(最大值(最大值 - - 最小值)最小值)/ /组数组数 例例6 6中,组距中,组距=(33-12)/5=4.2=(33-12)/5=4.2,可取整数,可取整数5 5为最后选定为最后选定的组距。的组距。 u第三步,确定各组组限第三步,确定各组组限(Class l

36、imits)(Class limits)并据此整理频数并据此整理频数分布表分布表。 分组所遵循的主要原则是分组所遵循的主要原则是“不重不漏不重不漏”(each data value (each data value belongs to one class and only one class)belongs to one class and only one class)。因此,。因此, 最低组限最低组限(The lower class limit)(The lower class limit) 数据的最小值数据的最小值 最大组限最大组限(The upper class limit)(The

37、 upper class limit) 数据的最大值数据的最大值注意:注意: 对离散型数据,可采用相邻两组组限间断的办法解决对离散型数据,可采用相邻两组组限间断的办法解决“不不重重”的问题(如的问题(如6 61010,11111515,16162020等);等); 对连续型数据,往往采用相邻两组组限重叠,根据对连续型数据,往往采用相邻两组组限重叠,根据“上限上限不在内原则不在内原则”解决解决“不重不重”问题(如问题(如 5 5, ,1010) ),(,(1010, ,1515) ), 1515, ,2020) )等)。等)。 例例6 6是离散型数据(天),采用组限间断方法,因此可得频是离散型数

38、据(天),采用组限间断方法,因此可得频数分布表如下:数分布表如下: Table5 Frequency distribution, relative frequency and percent frequency distribution for the audit-time data Audit Frequency Relative Percent Time(days) Frequency Frequency 1014 4 0.20 20 1519 8 0.40 40 2024 5 0.25 25 2529 2 0.10 10 3034 1 0.05 5 Total 20 1.00 100 在

39、最大值与最小值与其他数据相差悬殊时,为避免空白在最大值与最小值与其他数据相差悬殊时,为避免空白组出现,第一组和最后一组可采用组出现,第一组和最后一组可采用“XXXX以下以下”及及“XXXX以上以上”这样的开口组;这样的开口组; 在组距分组时,如果各组组距相等则称为等距分组,否在组距分组时,如果各组组距相等则称为等距分组,否则为不等距分组。则为不等距分组。 不等距分组各组的频数受组距大小不同的影响,因此需不等距分组各组的频数受组距大小不同的影响,因此需要计算频数密度(要计算频数密度(= =频数频数/ /组距),才能准确反映频数分布的组距),才能准确反映频数分布的实际;实际; 有时为了统计需要,需进一步计算累积频数(某数值以有时为了统计需要,需进一步计算累积频数(某数值以上或以下的频之数和)。上或以下的频之数和)。 一些注意事项一些注意事项四、组中值计算(四、组中值计算(class mark/class midpiont)闭口组:闭口组:2 2组组距距- -上上限限2 2组组距距下下限限2 2下下限限上上限限组组中中值值 开口组:开口组:2 2邻邻组组组组距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论