统计学课件(第2章)_第1页
统计学课件(第2章)_第2页
统计学课件(第2章)_第3页
统计学课件(第2章)_第4页
统计学课件(第2章)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章统计数据的描述2/1/20231统计学课件(第2章)§2.1数据的计量尺度列名尺度顺序尺度间隔尺度比例尺度数据的四种计量尺度2/1/20232统计学课件(第2章)§2.1数据的计量尺度一、列名尺度

1.也称定类尺度2.计量层次最低3.对事物进行平行的分类4.各类别可以指定数字代码表示5.使用时必须符合类别穷尽和互斥的要求6.数据表现为“类别”7.具有=或的数学特性2/1/20233统计学课件(第2章)§2.1数据的计量尺度二、顺序尺度

1.也称定序尺度2.对事物分类的同时给出各类别的顺序3.比列名尺度精确4.未测量出类别之间的准确差值5.数据表现为“类别”,但有序6.具有>或<的数学特性2/1/20234统计学课件(第2章)§2.1数据的计量尺度三、间隔尺度

1.也称定距尺度2.对事物的准确测度3.比顺序尺度精确4.数据表现为“数值”5.没有绝对零点6.具有+或-的数学特性2/1/20235统计学课件(第2章)§2.1数据的计量尺度四、比例尺度1.也称定比尺度2.对事物的准确测度3.与间隔尺度处于同一层次4.数据表现为“数值”5.有绝对零点6.具有或

的数学特性2/1/20236统计学课件(第2章)§2.1数据的计量尺度四种计量尺度的比较列名尺度顺序尺度间隔尺度比例尺度

分类(=,≠)排序(<,>)间距(+,-)比值(×,÷)√√√√√√√√√√计量尺度数学特性“√”表示该尺度所具有的特性2/1/20237统计学课件(第2章)§2.2统计数据的来源一、直接获取的数据1.普查为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄总体2/1/20238统计学课件(第2章)§2.2统计数据的来源

2.抽样调查从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法具有经济性、时效性强、适应面广、准确性高等特点总体随机样本2/1/20239统计学课件(第2章)§2.2统计数据的来源3、统计报表制度统计报表制度:是指按照一定的表式和程序,自下而上地定期报送统计资料的制度。它是定期取得统计资料的一种重要组织形式。统计报表按报送周期长短不同,分为日报、旬报、月报、季报、半年报和年报等。

2/1/202310统计学课件(第2章)§2.2统计数据的来源二、间接获取的数据

数据出自于报纸、杂志、图书、统计年鉴和其他媒体。近年来,互联网已经成为数据来源的重要渠道。2/1/202311统计学课件(第2章)§2.2统计数据的来源中国政府及相关机构网址数据内容国家统计局统计年鉴、统计月报等国务院发展研究中心信息网宏观经济、财经、货币金融等中国经济信息网经济信息及各类网站华通数据中心国家统计局授权的数据中心中国决策信息网决策知识及案例提供统计数据的部分政府网站2/1/202312统计学课件(第2章)§2.2统计数据的来源美国政府机构网址数据内容人口普查局人口和家庭等联邦储备局http://www.bog.frb.fed.us货币供应、信誉、汇率等预算编制办公室/omb财政收入、支出、债券等商务部商业、工业等提供统计数据的部分政府网站2/1/202313统计学课件(第2章)§2.3统计数据的质量非抽样误差:是由于调查过程中各有关环节工作失误造成的误差。其中的系统偏差是可以避免的。抽样误差:是利用样本推断总体时产生的误差。它虽然是不可避免的,但它又是可以计算的,并且是可以控制的。2/1/202314统计学课件(第2章)§2.4统计数据的整理一、统计分组

1.概念统计分组:是按照统计研究的目的,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。

2.统计分组的两个种类按品质标志分组,即按照事物的性质和属性划分,分组标准为列名尺度和顺序尺度;(例1)按数量标志分组,即按照事物的数量标准划分,分组标准为间隔尺度和顺序尺度。(例2)2/1/202315统计学课件(第2章)§2.4统计数据的整理3.组距分组要点将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”和“上组限不在内”的原则组数不应少于5组,也不应多于15组可采用等距分组,也可采用不等距分组~~~~~2/1/202316统计学课件(第2章)§2.4统计数据的整理4.组距分组的步骤确定组数:组数的确定应以能够显示数据的分布特征和规律为目的确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数统计出各组的频数并整理成频数分布表2/1/202317统计学课件(第2章)§2.4统计数据的整理5.组距分组的几个概念

下限:一个组的最小值

上限:一个组的最大值

组距:上限与下限之差

组中值:下限与上限之间的中点值开口组:只有上限无下限或只有下限无上限的组下限值+上限值2组中值=2/1/202318统计学课件(第2章)§2.4统计数据的整理二、次数分配

1.概念次数分配:是观察值(数据)按其分组标志分配在各组内的次数。(例2)分组数列(组距数列):依据分组编制的变量数列。有等距数列与异距数列之分。

2.次数分配表示方法——表示法、图示法(后面讲到)

2/1/202319统计学课件(第2章)§2.4统计数据的整理

3.表示法中的“累积”频数(例3)向下累积:由表的上方向表的下方相加。向上累积:由表的下方向表的上方相加。含义:向下累积说明的是下限以上的次数;向上累积说明的是上限以下的次数。2/1/202320统计学课件(第2章)§2.4统计数据的整理三、统计表与统计图1.统计表统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料。教材P50注意:第一、表外附加。目的是列示注意事项或表内的逻辑关系。第二、行标题与列标题是可以互换的;表头一般应包括表号、总标题和表中数据的单位等内容;表中的上下两条横线一般用粗线,中间的其他线要用细线。;统计表的左右两边不封口;表中的数据一般是右对齐;对于没有数据的表格单元,一般用“—”表示,不能出现空白单元格。2/1/202321统计学课件(第2章)§2.4统计数据的整理2.统计图直方图、圆形图、茎叶图和箱线图等都是最常用的图形工具。(例4、例5)次数分配直方图直方图与折线图的区别与联系。次数分布曲线正态分布曲线(钟形曲线)J形曲线U形曲线(生命曲线、浴盆曲线)

2/1/202322统计学课件(第2章)§2.4统计数据的整理几种常见的频数分布对称分布右偏分布左偏分布正J型分布反J型分布U型分布2/1/202323统计学课件(第2章)§2.4统计数据的整理(3)洛伦茨曲线与基尼系数2/1/202324统计学课件(第2章)§2.5数据分布集中趋势的测度一、众数1.概念一组数据中出现次数最多的变量值2.特征适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据2/1/202325统计学课件(第2章)§2.5数据分布集中趋势的测度3.计算众数的计算公式、举例(例6)4.注意事项众数是一种位置代表值,它的应用场合比较有限。2/1/202326统计学课件(第2章)

§2.5数据分布集中趋势的测度二、中位数1.概念中位数是数据排序后,位置在最中间的数据。2.特征不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即表明中位数与数据值的距离最短。Me50%50%2/1/202327统计学课件(第2章)

§2.5数据分布集中趋势的测度3.计算未分组资料

第一步:先找出中位数的位置

第二步:再计算分组资料

第一步:先按N(∑f)/2求出中位数所在组的位置

●第二步:利用公式计算举例(例7)2/1/202328统计学课件(第2章)

§2.5数据分布集中趋势的测度三、均值(平均数)1.特征集中趋势的最主要测度值一组数据的均衡点所在(重心)易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据数据观测值与均值的离差之和为零数据观测值与均值的离差平方和最小2/1/202329统计学课件(第2章)

§2.5数据分布集中趋势的测度3.计算(例8)简单算术平均数计算(未分组资料)加权算术平均数计算(分组资料)2/1/202330统计学课件(第2章)§2.5数据分布集中趋势的测度四、几何均值1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均发展速度4.几何均值是算术平均数公式的变形5.几何均值的计算公式2/1/202331统计学课件(第2章)

§2.5数据分布集中趋势的测度五、众数、中位数和均值的关系1.联系众数和中位数是从数据分布形状及位置角度来考虑的集中趋势代表值,而均值是经过对所有数据计算后得到的集中趋势值。三者都是作为分布集中趋势的测度。

2.区别众数最容易计算,但不是永远存在,并且应用的场合很少;中位数很容易理解、很直观,它不受极端数值的影响;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。2/1/202332统计学课件(第2章)

§2.5数据分布集中趋势的测度3.三者比较左偏分布均值

中位数

众数对称分布

均值=中位数=

众数右偏分布众数

中位数均值2/1/202333统计学课件(第2章)§2.6数据分布离散程度的测度一、极差1.概念

极差(全距):是数据最大值减去最小值之差。它是数据离散或差异程度的最简单测度值。2.计算方法

未分组资料:R=最大标志值-最小标志值

组距分配数列:R=最高组上限-最低组下限3.注意事项

极差的计算只利用了数据两端的信息,所以容易受极端值的影响。2/1/202334统计学课件(第2章)§2.6数据分布离散程度的测度二、方差1.概念方差是离差平方的平均数。2.计算公式:举例(例9)3.注意事项为什么分母是(n-1)。教材P40方差是以平方的形式使有正有负的离差变成正的离差平方。注意:样本方差用自由度n-1去除!2/1/202335统计学课件(第2章)§2.6数据分布离散程度的测度三、标准差(例9)1.概念标准差是方差的正平方根。2.计算公式四、离散系数(例9)1.概念标准差对算术平均数之比。2.计算公式V=σ/x或V=S/x

2/1/202336统计学课件(第2章)众数

(不惟一性)无众数

原始数据:10591268一个众数

原始数据:65

9866多个众数

原始数据:252828

3642422/1/202337统计学课件(第2章)复习思考题1、数据的计量尺度有哪几种,并说明它们与标志的关系。2、直接获取数据有几种形式,并说明其优缺点。3、分清什么是非抽样误差、抽样误差?4、统计分组的关键在哪里?核心问题是什么?5、“不重不漏”原则的含义6、理解并说明“上组限不在内”规定。7、简述众数、中位数和均值的区别联系。8、直方图与折线图的区别联系。9、洛伦茨曲线与基尼系数反映的是什么问题。2/1/202338统计学课件(第2章)作业题(一)1、教材PP59-60第2题(分组、频数分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论