




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题一统计数据概述商务统计
本章主要介绍了:数据来源数据的计量尺度数据的类别数据的整理第一节数据来源
(datasource)数据的来源一般有干脆和间接两种来源:干脆来源间接来源原始数据(rawdata)一般通过统计调查、统计试验等手段获得;次级数据(secondarydata)一般通过查阅、购买等手段获得。数据获得渠道对于公司来说,所须要的数据主要是公司自身的数据,这可以从公司的各种记录中得到;行业数据、市场数据等可以通过自己组织调查或从询问调查公司购买得到;宏观数据则可以从政府部门发布的年鉴、报告获得。还有一种就是通过统计试验活动数据。对于政府发布的数据,一个重要获得途径是政府网站。Example:公司内部数据职员记录:姓名、地址、社会保障号码、工薪、任职状况、其他个人状况;生产记录:部件或产品、生产量、管理成本、原料成本等;销售记录:产品、销售量、区域销售量、客户类型销售量、营销成本等;信用记录:客户名称、地址、电话、信用限额、应收帐款余额;客户记录:年龄、性别、收入水平、家庭状况、地址、爱好。Example:从特地收集和维护数据的组织中获得商务和经济数据国外——如:邓布拉斯公司(Dun&Bradstreet)、道-琼斯公司是两个向客户供应大量商业数据的公司;国内——如:央视调查询问中心、零点市场调查与分析公司。Example:试验数据例如:制药公司通过试验了解一种新药是否会影响血压或其他副作用;又如,在正式实施某一策略前,进行小规模的试点,等等Example:政府机构是数据的重要来源中国统计年鉴及各省市地区统计年鉴各级政府工作报告国务院各有关部委发布的公告其他官方资料Appendix:常用的一些免费数据网络地址中国国家统计局以及各省市统计局官方网站://中国劳动社会保障部://国家外汇管理局:///model_safe/index.html世经中国:///美国经济分析局(BEA,U.S.DepartmentofCommerceBureauofEconomicAnalysis)
://美国劳工部(BLS,U.S.DepartmentofLaborBureauofLaborStatistics)://其次节数据的计量尺度
(ScalesofMeasurement)统计数据是对客观现象接受某种计量尺度对事物进行计量的结果。Dataarethefactsandfiguresthatarecollected,analyzed,andsummarizedforpresentationandinterpretation.依据对事物计量的精确程度,可将所接受的计量尺度由低级到高级分为四个层次:定类尺度(NominalScale)定序尺度(OrdinalScale)定距尺度(IntervalScale)定比尺度(RatioScale)定类尺度(列名尺度),依据事物的某种属性对其进行平行的分类或分组。例1:人的性别(男、女);企业的全部制性质(国有、私营等)特点1、定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,依次可以随意变更;具有对称性和传递性的特点。(对称性:A对B的关系,也就是B对A的关系;传递性:A=BB=C,也即A=C)2、对定类尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数(frequency)。▼留意对事物进行分类时,必需符合穷尽(exhaustive)和互斥(mutuallyexclusive)要求。一、定类尺度定序尺度(依次尺度),是对事物之间等级或依次差别的一种测度。例2:产品等级(一等品、二等品、…)考试成果(优、良、中、可、差)特点:1、不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序);具有传递性(A>B,B>C,则A>C),不具有对称性。2、无法测出类别之间的精确差值,因此该尺度的计量结果只能排序,不能进行算术运算。二、定序尺度定距尺度(间隔尺度),是对事物类别或次序之间间距的测度。例3:100分制考试成果;摄氏温度对不同地区温度的测量。特点:1、具有定序尺度的全部特征,不仅能将事物区分为不同类型并进行排序,而且可精确指出类别之间的差距是多少;2、定距尺度通常以自然或物理单位为计量尺度,因此测量结果表现为数值;3、计量结果可以进行加减运算(加减运算有意义);4、“0”是测量尺度上的一个测量点,并不代表“没有”三、定距尺度定比尺度(比率尺度):是能够测算两个测度值之间比值的一种计量尺度。例4:职工月收入;企业产值;公制的距离、重量特点:1、与定距尺度属于同一层次,具有定距尺度的全部特征,而且存在确定零点。计量结果表现为数值;2、除了具有其他三种计量尺度的计算特点外,还具有可计算两个测度值之间比值的特点;3、“0”表示“没有”,即它有一固定的确定“零点”,因此它可进行加、减、乘、除运算。四、定比尺度▼留意:定距尺度中的“0”并不表示“没有”,不是一个确定的“零点”;而定比尺度中的“0”表示“没有”,是一个确定的“零点”。摄氏温度中的0度不是确定零点;热力学温度中的0K可以认为是确定零点。1、四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。2、高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但反之不行;3、可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来。
Summarization:四种计量尺度的区分与联系Exercises指出下面变量的测量尺度:学生住址距学校的距离;学生某门课的一次测验成果(百分制);学生的诞生地;按年级分类的高校学生;每周学生学习的小时数;夏季室外温度。第三节数据的分类从数据的表现形式不同:定性数据和定量数据从计量尺度的不同:定类数据、定序数据、定距数据和定比数据从数据的反映方式不同:确定数、相对数和平均数从样本性质不同:截面数据、时间序列和面板数据从数据反映的范围不同:总体数据和样本数据从数据内容不同:宏观经济数据、微观经济数据、社会学数据、自然科学数据等等
从不同的角度可以对数据进行分类一、数据表现形式不同定性数据(Qualitativedata)说明的是事物的品质特征,不能用数值表示(可以接受确定技术手段进行定量化),由定类尺度或定序尺度计量形成;定量数据(Quantitativedata)说明的是事物的数量特征,能够用数值表示,由定距尺度或定比尺度计量形成。▼对不同类型的数据,接受的统计方法会有所不同定性数据接受的分析方法较少:如组频率、非参数统计方法等;定量数据除了可接受定性数据的分析方法外,还可以接受更多的统计分析方法。二、按计量尺度的数据分类定类数据:对称性和传递性(如性别、门牌号、生产日期)定序数据:传递性(如产品等级、学历等)定距数据:可比较相对大小(如温度)定比数据:具有确定零点,可比较相对大小和确定大小(如收入、支出、产值、人口数等)
▼定类数据和定序数据属于定性数据,定距数据和定比数据属于定量数据。商务统计实践中,对于通过计数和数学运算得到的定量数据具有三种基本表现形式:确定数、相对数和平均数。(均可现实说明)三、数据反映形式不同(经济统计中)1、确定数(Absolutenumber)确定数是统计数据的最基本表现形式,表明事物(现象)的确定数量特征,即确定规模或水平。如:人口、GDP、进口额、出口额、商品零售额等▼确定数由于反映的是现实中的现象规模和水平,因此具有计量单位:实物单位(吨、公里)价值单位(元、万元)、复合单位(吨公里、千瓦时)双重/多重单位(马力/台、吨/(立方米·座·年))时期数和时点数特点:1、时期数可连续计量,并可累加;2、时点数只可间断计量,一般不能累加(累加无现实说明)。▼确定数按其反映事物现象的时间状况不同可分为时期数和时点数:时期数(periodicalnumber)反映事物现象在确定时期内的总量,如:产量、产值、诞生人口;
时点数(time-pointnumber)反映事物现象在某一瞬间时刻上的总量,如:人口数、土地面积等。2、相对数(relativenumber)相对数是一般是两个确定数的比值,反映事物的相对水平;但有时也可以是两个相对数或者两个平均数的对比。相对数的表现形式:比例、比率。例5:一数量为N的总体被分为K个部分,各部分的数量分别为Ni,则比例定义为:Ni/N。明显有:比例(Proportion)
:总体中各个部分的数量占总体数量的比重,反映总体的构成或结构。一般以百分数等表示。▼百分数(Percentage):将对比的基数抽象化为100而计算的相对数。比率(Ration)
:各不同类别的数量比值。可以是同一总体中不同部分的比较(系数、倍数)如,人口中:男性人口数/女性人口数;GDP中:投资/消费;可以是同一现象在不同空间上的对比(系数、倍数)如,不同地区GDP之比两个地区经济水平差异可以是同一总体同一现象在不同时空的对比,即速度(%)如,不同年份GDP之比经济发展速度可以是不同现象确定数之间的对比,即强度相对数如,人均GDP、数字电视普及率、外贸依存度等可以是不同相对数或平均数对比(系数、倍数)如,需求价格弹性、相对汇率等
3、平均数(averagenumber)一般来说,经济统计中平均数是两个确定数之比,分子反映总体某种特征总量,分母则是总体(总体可是某个时间跨度)中所包含的元素(元素可以是时期或时点)总数。可以分为空间(静态)平均数和序时(动态)平均数。经济统计中,一般要求计算过程和计算结果有实际含义(时点数计算过程除外),因此:计算相对数或者平均数的空间(静态)平均数时,总是先转化为分子确定数和分母确定数,再对比;计算相对数或者平均数的序时(动态)平均数时,则是先计算相对数或者平均数分子确定数、分母确定数的序时平均数,再对比。四、按样本性质不同截面数据(Cross-sectionaldata):同一时点或时期的总体各单位的数据。时间序列数据(Timeseriesdata):将若干个时间上搜集来的反映相同内容的数据按时间先后依次排列在一起,便形成了时间序列数据。面板数据(Paneldata):截面数据和时间序列数据交织在一起所形成的数据集。面板数据既具有截面数据的特征,又具有时间序列数据的特征。年份进口总额2003119.3200293.7200188.0200081.2199955.2199846.9……表1辽宁省各年进口总额单位:亿美元资料来源:《中国统计年鉴2004》Example:Timeseriesdata地区消费品零售总额(亿元人民币)进口总额(亿美元)…北京1916.7516.1…天津922.3149.9…河北1841.630.5…山西729.38.2…内蒙古676.816.7…辽宁2330.8119.3……………表22003年中国各地区主要经济指标资料来源:《中国统计年鉴2004》Example:Cross-sectionaldataExample:Paneldata地区年份200320022001200019991998北京1916.71744.81593.51443.31313.31167.2天津922.3941.4832.7736.6657.3587.1河北1841.61968.31778.31613.91458.81332.6山西729.3755.4679.9629.1587.1547.1内蒙古676.8606537.3484437.4399.5辽宁2330.82258.42034.91847.61696.11568.7…………………表3中国各地区社会消费品零售总额资料来源:《中国统计年鉴2004》单位:亿元第四节数据整理
(SummarizingData)依据升序(ascending)或者降序(descending)将全部数据排列,这是整理的第一步。排序目的通过阅读数据发觉一些明显的特征趋势或解决问题的线索;有助于数据的检查纠错;为分组供应依据。一、排序(orderingdata)二、数据分组和分布数列数据分组/分类(datagrouping/classification)统计整理的重要手段。数据分组就是依据探讨的须要,将总体依据确定的标记区分为若干个组成部分的一种统计方法。进行排序分组后,再计算出组频数或频率,列成确定的表式就是分布数列(distributionseries)。目的将总体中的具有不同性质元素进行分类,以对数据的内部结构进行了解,以便进一步进行统计分析。▼组内差异小和组间差异大
确定组数
确定组距(按组)整理成分布频数表
三、分组及频数计算基本步骤例6一会计事务所对其20家客户(clients)年底帐目辑核(audits)时间(天)统计如下表:Table4Year-EndAuditTimes(indays)1214191815151817202722232221332814181613这里分组主要指组距数列的分组。
第一步,确定组数(Numberofclasses)。组数的确定一般视数据本身的特点及数据的多少而定。阅历上以5~20之间为好,尤其留意不要确定太多的组数,使得每组包含的数据太少。
其中N为数据的个数,一般对结果取整数。例9中:K=1+lg20/lg2=1+4.32=5.325实际分组时常按斯特格斯(Sturges)提出的阅历公式来确定组数K:其次步,确定组距(Widthofclasses):组距是一个组的上限与下限之差,可依据全部数据的最大值和最小值及所分的组数来确定:组距=(最大值-最小值)/组数例6中,组距=(33-12)/5=4.2,可取整数5为最终选定的组距。
第三步,确定各组组限(Classlimits)并据此整理频数分布表。
分组所遵循的主要原则是“不重不漏”(eachdatavaluebelongstooneclassandonlyoneclass)。因此,最低组限(Thelowerclasslimit)
数据的最小值
最大组限(Theupperclasslimit)
数据的最大值▼留意:对离散型数据,可接受相邻两组组限间断的方法解决“不重”的问题(如6~10,11~15,16~20等);对连续型数据,往往接受相邻两组组限重叠,依据“上限不在内原则”解决“不重”问题(如[5,10),(10,15),[15,20)等)。例6是离散型数据(天),接受组限间断方法,因此可得频数分布表如下:Table5Frequencydistribution,relativefrequencyandpercentfrequencydistributionfortheaudit-timedataAuditFrequencyRelativePercentTime(days)FrequencyFrequency10~1440.202015~1980.404020~2450.252525~2920.101030~3410.055Total201.00100在最大值与最小值与其他数据相差悬殊时,为避开空白组出现,第一组和最终一组可接受“XX以下”及“XX以上”这样的开口组;在组距分组时,假如各组组距相等则称为等距分组,否则为不等距分组。不等距分组各组的频数受组距大小不同的影响,因此须要计算频数密度(=频数/组距),才能精确反映频数分布的实际;有时为了统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公路工程执照考试的未来展望与试题及答案
- 计算机三级嵌入式行业趋势分析试题及答案
- 行政理论全景式复习试题及答案
- 金属制品行业绿色制造与环保政策研究考核试卷
- 计算机三级数据库解题思路试题及答案
- 危运消防设备管理制度
- 单位资金使用管理制度
- 农村聚餐工作管理制度
- 商贸公司费用管理制度
- 医院账务预算管理制度
- 机械通气基础知识及基础操作课件
- 打印版医师执业注册健康体检表(新版)
- 《空中领航》全套教学课件
- 人教版五年级下册数学操作题期末专项练习(及解析)
- 中药熏洗法操作评分标准与流程
- 学习解读《执业兽医和乡村兽医管理办法》课件
- 室内装饰不锈钢技术交底
- 1.3.1动量守恒定律课件(共13张PPT)
- 白黑白装饰画欣赏黑白装饰画的特点黑白装饰画的表现形式黑白装饰 bb
- TCECS 850-2021 住宅厨房空气污染控制通风设计标准
- 调度指挥与统计分析课程教学设计
评论
0/150
提交评论