数据类型与描述统计_第1页
数据类型与描述统计_第2页
数据类型与描述统计_第3页
数据类型与描述统计_第4页
数据类型与描述统计_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章:数据类型与描述统计数据类型与描述统计共29页,您现在浏览的是第1页!节:数据的类型数据的计量尺度:1、定类尺度2、定序尺度3、定距尺度4、定比尺度数据类型与描述统计共29页,您现在浏览的是第2页!定类尺度(类别尺度、列名尺度)是最粗略、计量层次最低的尺度;只能区别事物是同类或不同类;必须符合穷尽和互斥的要求。

例:0表示女性,1表示男性数据类型与描述统计共29页,您现在浏览的是第3页!定序尺度(顺序尺度),是对事物之间等级差或顺序差别的一种测度;不仅有类别,这些类别之间是可以比较的;不能进行加减乘除运算。

例:一等品、二等品、三等品小学、初中、高中、大学及以上非常不同意、不同意、中立、同意、非常同意数据类型与描述统计共29页,您现在浏览的是第4页!定比尺度(比率尺度),与定距尺度属于同一层次,一般可不作区分,计量结果也表现为数值;要求有一个绝对固定的“零点”;可以进行加减乘除运算。

例:甲月薪3000,乙月薪1000,甲为乙的三倍数据类型与描述统计共29页,您现在浏览的是第5页!横截面数据:如2008武汉“8+1”城市圈GDP增速;时间序列数据:如2000-2009武汉市GDP增速;面板数据:2000-2008武汉“8+1”城市圈GDP增速。数据类型与描述统计共29页,您现在浏览的是第6页!数据筛选:一些不符合要求的数据或有明显错误的数据剔除;将符合某种特定条件的数据筛选出来。例题:见Excel例(数据筛选)数据类型与描述统计共29页,您现在浏览的是第7页!变量的类型定类变量定序变量数字变量(离散变量、连续变量)多数情况下,变量指的是数字变量。数据类型与描述统计共29页,您现在浏览的是第8页!统计指数广义:凡是能够说明现象变动的相对数都是指数;如计划完成相对数狭义:用来表明不能直接相加和不能直接对比的现象在不同时期的变动程度。如价格指数数据类型与描述统计共29页,您现在浏览的是第9页!第三节:描述统计数据类型与描述统计共29页,您现在浏览的是第10页!描述统计集中趋势均值中位数众数几何平均数描述统计离散程度方差标准差离散系数数据类型与描述统计共29页,您现在浏览的是第11页!度量集中趋势的最常用变量受到异常值的影响0123456789100123456789101214均值=5均值=6(continued)数据类型与描述统计共29页,您现在浏览的是第12页!众数众数的值就是出现次数最多的数值不受异常数据的影响可用于数字型和定类型数据可能没有众数也可能有多个众数01234567891011121314众数=90123456无众数数据类型与描述统计共29页,您现在浏览的是第13页!标准差是最重要的分散程度度量指标表示对均值的分散程度与原始数据是同一量纲样本标准差:总体标准差:数据类型与描述统计共29页,您现在浏览的是第14页!CoefficientofVariation(离散系数)考察现对离散程度一般用百分比表示(%)表示相对于均值的离散情况比较不同度量单位多组数据的离散程度

数据类型与描述统计共29页,您现在浏览的是第15页!分布的形状描述数据是如何分布的对形状的度量对称还是不对称Mean=Median=Mode

Mean<Median<Mode

Mode<

Median<Mean右偏左偏对称数据类型与描述统计共29页,您现在浏览的是第16页!定距尺度(间隔尺度),不仅区分类型和排序,而且可以准确地指出类别之间的差距是多少;通常可以使用自然或度量衡单位作为计量尺度;定距尺度的计量结果表现为数值;可以进行加减运算。

例:考试成绩相差10分今天武汉的温度比广州的温度低6摄氏度数据类型与描述统计共29页,您现在浏览的是第17页!数据的类型定性数据(品质数据):包括定类数据和定序数据。不能用数值表示,其结果表现为类别。定量数据(数量数据):包括定距数据和定比数据。能够用数值来表现,反映数量特征。数据类型与描述统计共29页,您现在浏览的是第18页!数据的预处理

数据审核:对于原始数据,从完整性和准确性两方面加以审核。对于异常值的处理:若是记录错误,则予以纠正;若是准确,则保留。对于二手数据,弄清数据来源,审核时效性。数据类型与描述统计共29页,您现在浏览的是第19页!数据的显示统计图:集中常用统计图介绍统计表:表头、行标题、列标题、数字资料。3W要求。表外附加(数据来源)数据类型与描述统计共29页,您现在浏览的是第20页!第二节:指标和指数统计指标

包括总量指标、相对指标、平均指标总量指标:反映总体规模,如人口总数、GDP。相对指标:经济增长率、股价指数。平均指标:人均消费水平、某股票的10日均价数据类型与描述统计共29页,您现在浏览的是第21页!统计指数的分类反映对象范围的不同:个体指数、总指数;按性质不同:数量指标指数(产量指数)、质量指标指数(劳动生产率指数)按所采用基期的不同:定基指数、环比指数按研究的目的不同:动态指数、静态指数。数据类型与描述统计共29页,您现在浏览的是第22页!Topics集中趋势的度量Mean(均值),median(中位数),mode(众数)离散的度量Range(变动幅度),varianceandstandarddeviation(标准差),coefficientofvariation(离散系数)形状对称与不对称数据类型与描述统计共29页,您现在浏览的是第23页!均值(算术平均)数据的算术均值样本均值总体均值样本规模总体规模数据类型与描述统计共29页,您现在浏览的是第24页!中位数主要用于测度定序数据的集中趋势不受异常值的影响

在一个排好序的数列中,中位数就是这个序列中间的数值:若N为奇数,中位数就是中间那个数的数值若N为偶数,中位数就是中间那两个数的平均值0123456789100123456789101214中位数=5中位数=5数据类型与描述统计共29页,您现在浏览的是第25页!是离散程度的最重要的度量指标反映的是对均值的离散程度样本方差:总体方差:方差数据类型与描述统计共29页,您现在浏览的是第26页!标准差比较均值=15.5s=3.338

11121314151617181920211112131415161718192021DataBDataA均值=15.5s=.92581112131415161718192021均值=15.5s=4.57DataC数据类型与描述统计共29页,您现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论