描述性统计量_第1页
描述性统计量_第2页
描述性统计量_第3页
描述性统计量_第4页
描述性统计量_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

描述性统计针对不同类型的数据,采用不同的描述性统计量进行刻划:集中趋势,离散程度,分布的形状描述性统计量四种计量尺度数据的计量尺度定类尺度定序尺度定距尺度定比尺度描述性统计量定类尺度

(概念要点)计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或的数学特性描述性统计量定序尺度

(概念要点)对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有>或<的数学特性描述性统计量定距尺度

(概念要点)1. 对事物的准确测度2. 比定序尺度精确3. 数据表现为“数值”4.没有绝对零点5. 具有+或-的数学特性描述性统计量定比尺度

(概念要点)1. 对事物的准确测度2. 与定距尺度处于同一层次3. 数据表现为“数值”4.有绝对零点5. 具有或

的数学特性描述性统计量四种计量尺度的比较四种计量尺度的比较定类尺度定序尺度定距尺度定比尺度

分类(=,≠)排序(<,>)

间距(+,-)比值(×,÷)√√√√√√√√√√计量尺度数学特性“√”表示该尺度所具有的特性描述性统计量数据类型与统计方法数据类型与统计方法定类数据定序数据品质数据数量数据定距数据定比数据参数方法非参数方法描述性统计量变量及其类型变量定序变量离散变量连续变量定类变量数字变量描述性统计量统计指标及其类型时期指标时点指标统计指标相对指标总量指标平均指标比例比率描述性统计量定类数据的整理与显示

(基本问题)要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的对定类数据和定序数据主要是做分类整理对定距数据和定比数据则主要是做分组整理适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据描述性统计量定类数据的整理

(基本过程)1. 列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据描述性统计量定类数据的整理

(可计算的指标)1.频数:落在各类别中的数据个数2.比例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比率:不同类别数值的比值描述性统计量定类数据的图示—条形图

(条形图的制作)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图描述性统计量定类数据的图示—条形图

人数(人)5191610211204080120

商品广告

服务广告

金融广告

房地产广告

招生招聘广告

其他广告广告类型

图3-1某城市居民关注不同类型广告的人数分布描述性统计量定类数据的图示—圆形图

(圆形图的制作)也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推描述性统计量定类数据的图示—圆形图

其他广告1.0%

房地产广告8.0%

商品广告56.0%

金融广告4.5%

服务广告25.5%

招生招聘广告5.8%图3-2某城市居民关注不同类型广告的人数构成描述性统计量定序数据的整理

(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加描述性统计量定距定比数据频数分布表的编制确定组数编制频数分布表的步骤确定组距计算频数编制表格描述性统计量分组方法分组方法等距分组异距分组单变量值分组组距分组描述性统计量分布的形状与箱线图

对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU描述性统计量数据分布的特征集中趋势(位置)离中趋势

(分散程度)偏态和峰度(形状)描述性统计量数据分布的特征和测度数据的特征和测度分布的形状集中趋势离散程度众数中位数均值变异系数方差和标准差峰度四分位差异众比率偏态描述性统计量集中趋势的测度一.定类数据:众数二.定序数据:中位数和分位数三.定距和定比数据:均值四.众数、中位数和均值的比较描述性统计量中位数

(概念要点)集中趋势的测度值之一排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即描述性统计量定序数据:中位数和分位数

(计算公式)描述性统计量四分位数

(概念要点)1. 集中趋势的测度值之一2. 排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%描述性统计量四分位数

(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N4描述性统计量定距和定比数据:均值

(概念要点)1. 集中趋势的测度值之一2. 最常用的测度值3. 一组数据的均衡点所在4. 易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据描述性统计量几何平均数

(概念要点)1.集中趋势的测度值之一2.N

个变量值乘积的N

次方根3.适用于特殊的数据4.主要用于计算平均发展速度5.计算公式为6.可看作是均值的一种变形描述性统计量众数、中位数和均值的关系对称分布

均值=中位数=众数左偏分布均值

中位数

众数右偏分布众数

中位数

均值描述性统计量数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值※众数※中位数※均值※均值—四分位数众数调和平均数—众数中位数几何平均数——四分位数

中位数———四分位数———众数描述性统计量离散程度的测度一.定类数据:异众比率二.定序数据:四分位差三.定距和定比数据:方差及标准差四.相对离散程度:变异系数描述性统计量定类数据:异众比率

(概念要点)1. 离散程度的测度值之一2. 非众数组的频数占总频数的比率3. 计算公式为

4.用于衡量众数的代表性描述性统计量异众比率

(算例)表3-1某城市居民关注广告类型的频数分布

广告类型人数(人)频率(%)

商品广告服务广告金融广告房地产广告招生招聘广告其他广告1125191610256.025.54.58.05.01.0合计200100解:在所调查的200人当中,关注非商品广告的人数占44%,异众比率还是比较大。因此,用“商品广告”来反映城市居民对广告关注的一般趋势,其代表性不是很好

Vr=200-112200

=1-112200

=0.44=44%描述性统计量定序数据:四分位差

(概念要点)1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差

QD

=QU-QL4. 反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性描述性统计量定距和定比数据:方差、标准差和极差

(概念要点及计算公式)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910未分组数据

R

=max(Xi)-min(Xi).=组距分组数据

R

最高组上限-最低组下限5.计算公式为描述性统计量方差和标准差

(概念要点)1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3描述性统计量总体方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式未分组数据:描述性统计量样本方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式未分组数据:描述性统计量样本方差

自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为

n

时,若样本均值x

确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量描述性统计量变异系数

(概念要点和计算公式)1. 标准差与其相应的均值之比2. 消除了数据水平高低和计量单位的影响3. 测度了数据的相对离散程度4. 用于对不同组别数据离散程度的比较5.计算公式为描述性统计量数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据类型定类数据定序数据定距数据或定比数据适用的测度值※异众比率※四分位差※方差或标准差—

异众比率※变异系数(比较时用)——

平均差——

极差——

四分位差——

异众比率描述性统计量偏态与峰度分布的形状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论