统计学的复习提要_第1页
统计学的复习提要_第2页
统计学的复习提要_第3页
统计学的复习提要_第4页
统计学的复习提要_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学的复习提要第一章数据与统计一、统计统计的三种含义:统计活动(统计工作)、统计数据(统计资料)和统计学。一、数据1、统计数据的四种计量尺度定类尺度、定序尺度、定距尺度和定比尺度2、数据类型(依据四种不同的计量尺度分为)分类数据、顺序数据、数值型数据3、常用的统计调查组织方式:普查:为某一特定的目的而专门组织的一次性全面调查方 式。抽样调查:从总体中抽取样本进行调查,利用样本调查的 结果对总体的特征进行推断的一种非全面调查方式。统计报表:按照规定,自上而下统一布置,自下而上逐级 填报的一种调查组织方式。重点调查:从总体中选择少数重点单位进行调查的调查组 织方式。(5)典型调查:从总体中选择一

2、个或几个代表性的单位深入细 致调查的一种调查组织方式。第二章描述统计一、数据预处理1、数据审核包括准确性审核、全面性审核和及时性审核。目的是最大程度上剔除并修正差错。2、数据筛选包括将不符合要求或存在明显错误的数据剔除;将符合条件的数据筛 选出来。3、数据排序二、定性数据的图表分析1、频数分布(1)频数和频率(2)频数分布分类数据分组分类计算落入各组频数或频率频数分布顺序数据分组分类计算落入各组频数或频率(或者累积频数或累积频率)频数分布2、图形表示主要有条形图、饼图和环形图等。三、定量数据的图表分析1、定量数据分组(1)单变量分组单变量分组是把一个变量值作为一组,这种方法一般适用于离散 型变

3、量且数目较少的情况。(2)组距分组组距分组是将全部变量值依次划分为若干个数值区间,每一个数 值区间作为一组,这种方法一般适用于离散型变量变量值较多或者连 续型变量。组距分组的步骤。注意:分组过程中,为解决“不重”问题,采用“上限不在内” 的原则;对于开口组,如何确定首组的下限和末组的上限?以及如何计算 组中值?2、频数分布的类型频数分布主要的三种类型,即钟形分布、U型分布和J型分布(1)钟形分布。特征:中间大,两头小,即靠近中间变量值得频数多,两头的频数少。(2)U型分布。特征:中间小两头大,即靠近中间变量值得频 数少,两头的频数多。(3)J型分布。有两种,一种是正J型分布,频数随着变量值 得

4、增大而增多,另一种是反J型分布,频数随着变量值得增大而减少。3、图形表示主要有直方图、折线图、茎叶图和箱线图。第三章描述统计:数值方法一、集中趋势测度集中趋势测度值的反映的是数据一般水平的代表值或者数据分 布的中心值。重点会计算各种刻画集中趋势的测度值。1、平均数(适用于数值型数据)(1)算术平均数(2)调和平均数(3)几何平均数2、众数(1)一组数据中出现次数最多的变量值(2)不受极端值的影响一组数据可能没有众数或有几个众数不仅适用于数值型数据也适用于分类数据和顺序数据注意:对于组距分组数据,如何计算众数?3、中位数排序后处于中间位置上的值不受极端值的影响主要用于顺序数据,也可用数值型数据,

5、但不能用于分类数注意:对于未分组和组距分组数据,如何计算中位数?4、四分位数5、均值、众数和中位数的关系二、离中趋势测度离中趋势测度值的反映的是数据的各变量值偏离中心值的程度。重点会计算各种刻画离中趋势的测度值。1、全距一组数据的最大值与最小值之差R = max(xi) - min(xi)2、内距3、方差与标准差重点计算总体方差与标准差和样本的方差与标准差。(未分组数据和分组数据)4、标准分数5、离散系数(标准差系数)(1)什么是离散系数?标准差与均值的比值。(2)为什么计算离散系数?三、分布形态的度量1、分布的对称性偏态:数据分布的不对称性。偏态系数=0为对称分布偏态系数0为右偏分布偏态系数

6、0为左偏分布2、分布的陡峭性峰度及峰度系数峰度系数=0为峰度适中峰度系数0为扁平分布峰度系数0为尖峰分布第四章抽样及抽样分布一、抽样技术中的基本问题1、基本概念总体和样本参数和统计量抽样单元与抽样框2、基本抽样技术简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样以及不等概抽样二、抽样分布1、样本均值的抽样分布当总体服从正态分 布时,来自该总体的所有容量为n的样本的均值 、一 - - - - - - - 一 - - -X也服从正态分布,x的数学期望为,方差为b 2/n。即设从均值为山方差为b 2的一个任意总体中抽取容量为n的样 本,当n充分大时(nN30),样本均值的抽样分布近似服从均值为

7、、 方差为b 2/n的正态分布2、样本比例的抽样分布当样本容量n足够大时,样本比例p近似服从均值为n、方差为 n (1-n )/n的正态分布。3、样本方差的抽样分布当总体,从中抽取容量为n的样本,则第五章参数估计一、两种参数估计 1、点估计:用样本估计量的某个值直接作为总体参数的估计值。2、区间估计3、评价点估计量的标准无偏性:估计量的数学期望等于被估计的总体参数.(2)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的 估计量更有效一致性:随着样本容量的增大,估计量的值越来越接近被估计的 总体参数.二、一个总体参数的区间估计1、总体均值的区间估计(1)总体服从正态分布,且方差(g2)已

8、知(2)总体服从正态分布,且方差(b2)未知非正态总体均值的区间估计(大样本)2、总体比例的区间估计3、总体方差的区间估计三、样本容量的确定1、估计总体均值时样本容量的确定2、估计总体比例时样本容量的确定第八章相关与回归分析一、相关分析1、相关分析是研究两个或两个以上的变量之间相关程度的大小的一 种统计方法。重点研究两个随机变量之间相关程度,且变量之间不必 区别自变量和因变量。2、相关系数(1)相关系数实际上指线性的单相关系数,其大小判断两个变量是否具有线性性以及强弱如何;(2)相关系数的性质二、一元线性回归1、一元回归分析研究的是一个随机变量与另一个非随机变量之间相 互关系的统计方法,变量之

9、间必须区别自变量和因变量。2、一元线性回归模型估计回归方程判定系数:是对估计的回归方程拟合优度的度量预测第九章时间序列分析一、时间序列概念1、随着时间的推移记录的数据序列称为时间序列,也称动态数列2、时间序列的分类(1)绝对数时间序列又分时期序列和时点序列(2)相对数时间序列(3)平均数时间序列3、编制时间序列的原则二、时间序列的水平分析1、平均发展水平重点是会计算各种时间序列的平均数2增长量(1)逐期增长量(2)累积增长量重点会计算增长量以及逐期和累积增长量两者数量关系。3、平均增长量重点会计算平均增长量三、时间序列的速度分析1、发展速度(1)环比发展速度(2)定基发展速度计算以及两者之间的

10、数量关系。2增长速度3平均发展速度利用几何平均数计算4平均增长速度四、时间序列的构成因素五、趋势变动分析一直线趋势方程拟合法第十章统计指数一、指数的概念及分类二、综合指数1、综合指数编制的基本原理。首先引入同度量因素,解决多种事物不能加总的综合问题;其次固定同度量因素,使综合总量的对比只反映指数化指标的 变化。2、拉氏指数(1)拉氏指数将同度量因素固定在基期;(2)计算数量指标的综合指数一般采用拉氏指数;(3)同度量因素固定在基期时,指标化因素的变动所引起总指标的绝对数量为3、派(帕)氏指数派氏指数将同度量因素固定在报告期期;计算质量指标的综合指数一般采用派氏指数;同度量因素固定在报告期时,指标化因素的变动所引起总指 标的绝对数量为三、平均指数1、平均指数编制的基本原理首先对构成总体的个别元素计算个体指数,得到无量纲化的 相对数作为编制总指数的基础;其次选择合适的权数对个体指数进行加权平均,从而得到 反映总体现象数量对比关系的总指数。2、加权算术平均指数在已知基期总量的条件下,以其为权数对个体指数进行加权平均3、加权调和平均指数在已知报告期总量的条件下,以其为权数对个体指数进行加权平均四、指数体系与因素分析1、指数体系的概念以及作用概念:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论