已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 2012015 5 中级统计师考试中级统计师考试- -统计方法 统计方法 知识考试重点归纳知识考试重点归纳 第一章 统计和数据 统计是用来处理数据的, 是关于数据的一门学问。 1、统计学:是用以收集数据、分析数据和由数据得 出结论的一组概念、原则和方法。 2、统计分析数据的方法分为: (1)描述统计 (2) 推断统计 3、描述统计:是研究数据搜集、处理和描述的统计 学方法。 4、 推断统计: 是研究如何利用样本数据来推断总体 特征的统计学方法。 5、推断统计包括: (1)参数估计 (2) 假设检验 6、定性变量的特点: 只反映现象的属性特点,不能说明具体量的大小和 差异。 定性变量包括分类变量和顺序变量。 只反映现象分类特征的变量称分类变量。分类变 量没有数值特征, 所以不能对其数据进行数学运算。 如果类别具有一定的顺序,这样的变量称为顺序 变量。顺序变量不仅能用来区分客观现象的不同类 别,而且还可以表明现象之间的大小、高低、优劣 关系。 7、定量变量的特点: 可以用数值表示其观察结果,而且这些数值具有明 确的数值含义,不仅能分类而且能测量出来具体大 小和差异。 数值型数据(定量数据)作为统计研究的主要资 料,其特征在于它们都是以数值的形式出现的,有 些数值型数据只可以计算数据之间的绝对差,而有 些数值型数据不仅可以计算数据之间的绝对差,还 可以计算数据之间的相对差。其计量精度远远高于 定性数据。在统计学研究中,数值型数据有着最广 泛的用途。 8、 数据按获取的方法不同分为:(1) 观测数据 (2) 实验数据 9、 观测数据: 是对客观现象进行实地观测所取得的 数据,在数据取得的过程中一般没有人为的控制和 条件约束。 10、实验数据:一般是在科学实验环境下取得的数 据。 11、统计数据资料的来源: (1) 通过直接的调查或实验获得的原始数据, 这是 统计数据的直接来源; (2) 别人调查的间接数据, 并将这些数据进行加工 和汇总后公布的数据,这是数据的间接来源。 12、 数据的直接来源: (1) 统计调查 (2) 实验法 通过统计调查得到的数据,一般称为观测数据。 运用实验法时,实验组和对照组的产生应当是随 机的。 13、数据的间接来源: (1)公开出版的统计数据 (2)尚未 公开发表的统计数据 14、搜集数据的方法: (1) 普查 (2) 抽样调查 (3) 统计报表 (4)重点调查 (5)典型调查 15、普查:是专门组织一次性的全面调查,用来调 查属于一定时点或时期内的社会现象总量。 普查适用于搜集某些不能或不适宜于定期的全面 统计报表搜集的统计资料,以摸清重大的国情、国 力。 16、普查的特点: (1)是一种全面调查,具有资料包括范围全面、详 尽、系统的优点。 2 (2)是一次性的专门调查,因为普查的工作量大, 耗资也多,时间周期较长,一般不宜经常举行。 17、抽样调查的特点: (1) 样本单位按随机原则抽取, 排除了主观因素对 选取样本单位的影响。 (2) 能够根据部分调查的实际资料对调查对象的总 体的数量特征进行推断,从而达到对调查总体的认 识。 (3) 在抽样调查中会存在抽样误差, 但是这个误差 可以事先计算并加以控制。 18、在实际调查中抽样的方法: (1)概率抽样 (2)非概率抽样 19、常用的概率抽样形式有: (1) 简单随机抽样 (2) 分层抽样 (3) 整群抽样 (4)系统抽样 20、分层抽样:是先将总体各单位按主要标志加以 分层,然后在每一层内进行抽样。 21、系统抽样:又称等距抽样,是在总体的名录框 中每隔一定距离抽选一个被调查者。 22、统计报表:是按照国家统一规定的调查要求与 文件自下而上的提供统计资料的一种调查方式。 23、统计报表按照报送范围分为: (1)全面报表 (2)非全面报表 24、统计报表的内容包括: (1)表式 (2) 填表说明 25、重点调查:是在调查对象中选择一部分对全局 具有决定性作用的重点单位进行的一种非全面调 查。 当调查的任务只要求掌握事物的基本状况与基本 的发展趋势,而不要求掌握全面的准确资料,而且 在总体中确实存在着重点单位时,进行重点调查是 比较适宜的。 26、典型调查:是一种非全面的调查,是根据调查 的目的与要求,在对被调查对象进行全面分析的基 础上,有意识地选择若干具有典型意义的或有代表 性的单位进行的调查。 27、典型调查的作用: (1)补充全面调查的不足 (2) 在一定条件下可以验证全面调查数据的真实性 典型调查具有灵活机动、通过少数典型即可取得 深入详实的统计资料的优点,但是易受人们主观认 识上的影响,必须同其他调查结合起来使用,才能 避免出现片面性. 第二章 数据描述 1、定性数据的图形表示有: (1) 饼图 (2) 条形图 (3) 环形图 饼图是利用圆形及圆内扇形面积来表示数值大小 的图形。 条形图是用宽度相同的条形的高度或长度来表述 数据多少的图形。 如果想比较不同变量之间的结构差异,可以通过 环形图来实现。 定性数据的图示表示方法, 也都适用于定量数据。 但定量数据还有一些特定的图示方法,它们并不适 用于定性数据。 2、 频数: 是指频数分布表中落在某一特定类别的数 据个数。 3、生成定量数据的频数分布表的步骤: (1)对数据进行分组 (2)确定 组距 (3)统计出各组的频数及频数分布表 组距是每个组变量值中的最大值与最小值之差, 也就是上限与下限之差。 4、在确定组距时应掌握的原则: (1) 要考虑各组的划分是否能区分总体内部各个组 3 成部分的性质差别。 (2)要能准确地清晰地反映总体单位的分布特征。 在确定组距时,在研究的现象变动比较均匀的情 况下,可以采用等距分组;而当研究的现象变动很 不均匀时,一般采用不等距分组。 在统计各组频数时,恰好等于某一组的组限时, 则采取上限不在内的原则,即将该频数计算在与下 限相同的组内。 5、定量数据的图形表示有: (1) 直方图 (2) 折线图 (3) 散点图 直方图的横坐标代表变量分组,纵坐标代表各变 量值出现的频数。 6、统计表的五个组成部分: (1)表头 (2)行标题 (3)列标题 (4)数 字资料 (5)表外附加 7、数据的分布特征: (1) 集中趋势, 即一组组数据的数值向其中心值的 靠拢程度 (2) 离散程度, 即一组数据的各个数值远离其中心 的趋势和程度 8、定性数据的集中趋势常用的计算方法: (1) 百分比 (2) 中位数 (3) 众数 9、 中位数: 是数据按照大小排列之后位于中间的那 个数。 如果样本量为偶数, 则是中间两个数的平均。 10、众数:就是数据中出现次数或出现频率最多的 数值。 11、反映定量数据特征的统计量有: 反映数据集中趋势的水平度量: (1)平均数 (2)中位数 (3)众数 (4)分 位数 反映数据离散程度的差异度量: (1)极差 (2)四分位差 (3)标准差 (4) 方差 平均数易为多数人理解和接受,实际中用的也较 多,但主要缺点是更容易受少数极端数值的影响。 中位数和众数提供的信息不像平均数那样多,但具 有统计上的稳健性,当数据为偏态分布,特别是偏 斜程度较大时,中位数和众数的代表性要比平均数 好。 12、极差:又称全距,是一组数据中的最大值和最 小值之差。 极差非常容易受数据中极端值的影响。 方差用 2 表示,总体标准差用 表示,样本标准 差用s 表示,离散系数用表示,标准分数用z 表 示。 标准差是方差的平方根,它与方差相比更具量纲 性。 在一个统计样本中,其标准差越大,说明它的各 个观测值分布的越分散,它的趋中程度就越差。反 之,其标准差越小,说明它的各个观测值分布的越 集中,它的趋中程度就越好。 标准差的大小会受到数据本身数值大小的影响。 两个数列的标准差相同,但是两数列的差异程度却 不同。为了更准确地反映差异程度,要计算离散系 数。 13、 离散系数: 是将一组数据的标准差除以其均值, 用来测度数据离散程度的相对数。 14、标准分数:是变量值与其平均数的离差除以标 准差后的值,用以测定某一个数据在该组数据中的 相对位置。 第三章 参数估计 1、总体分布:是总体中所有观测值所形成的分布。 2、总体参数:是对总体特征的某个概括性的度量。 3、总体参数指标有: (1)总体平均数( ) (2)总体方差( 2 ) (3) 4 总体比例( )等。 统计量是样本的函数。构成统计量的函数中不能 包含未知因素。 4、样本统计量指标有: (1)样本均值(x) (2)样本方差( 2 s ) (3) 样本比例( p) 统计量的概率分布构成了推断总体参数的理论基 础。 5、关于样本均值的抽样分布: (1)设总体共有n 个元素,从中随机抽取一个容 量为n的样本,在重置抽样时,共有 n n 种抽法;在 不重复抽样时,共有 )! ( ! ! n n n n c n n = 个样本。 (2) 样本均值的抽样分布就是指所有可能抽出来的 样本 x的分布。 (3)样本均值的均值就是总体均值,即 = ) (x e 。 (4) 重置抽样时, 样本均值的标准差为总体标准差 的 n 1 ,即 n x = ; 不重置抽样时,样本均值的方差为 1 2 2 = n n n n x 。 (5) 当总体服从正态分布时, 样本均值一定服从正 态分布,即有: x ) , ( 2 n 时,x ) , ( 2 n n 。 (6) 若总体为未知的非正态分布时, 只要样本容量 n足够大(通常要求n30),样本均值 x仍会接近 正态分布,其分布的期望值为总体均值,样本方差 为总体方差的 n 1 。 (7)如果总体不是正态分布,当n为小样本时(通 常n30),样本均值的分布则不服从正态分布。 6、关于样本比例的抽样分布: (1) 当样本容量比较大时, 样本比率 p近似服从正 态分布,且有 p 的数学期望就是总体比率,即 = ) (p e 。 (2)在重置抽样时, p的方差为 n p ) 1 ( 2 = 。 ( 3 ) 在 不 重 置 抽 样 时 , p 的 方 差 为 1 ) 1 ( 2 = n n n n p 。 (4) 在重置抽样时,p的分布为 p ) ) 1 ( , ( n n ( 5 ) 在 不 重 置 抽 样 时 , p 的 分 布 为 p ) 1 ) 1 ( , ( n n n n n 7、关于统计量的标准误差: (1) 统计量的标准误差用于衡量样本统计量的离散 程度。在参数估计中,用于衡量样本统计量与总体 参数之间差距。 (2)样本均值的标准误计算公式为: n x = (3)当总体标准差 未知时,可用样本标准差s 代 替计算,这时计算的标准误差称为估计标准误差。 ( 4 ) 样 本 比 例 的 标 准 误 计 算 公 式 为 : n p ) 1 ( = (5)当总体比例的方差 ) 1 ( 未知时,可用样本 比例的方差 ) 1 ( p p 代替。 8、 参数估计: 就是用样本统计量去估计未知的总体 参数。 9、用样本统计量估计总体参数的两种方法: (1)点估计 (2)区间估计 10、常用的点估计有: (1)用样本均值 x估计总体均值 (2)用样 本比例 p估计总体比例 5 (3)用样本方差 2 s 估计总体方差 2 11、 区间估计: 是包括样本统计量在内的一个区间, 该区间通常是由样本统计量加减估计标准误差得到 的。 12、关于区间估计: (1)标准正态分布n (0,1)的均值为 0,标准差 为 1。 (2)标准化的公式为: = z (观测值-均值)标 准差 (3)以 68.27%的置信水平推断总体参数 的置信 区间为 ) 1 ( z : ) , ( n x n x + (4)以 95.45%的置信水平推断总体参数 的置信 区间为 ) 2 ( z : ) 2 , 2 ( n x n x + (5)以 99.73%的置信水平推断总体参数 的置信 区间为 ) 3 ( z : ) 3 , 3 ( n x n x + 13、评价估计量的标准有: (1) 无偏性 (2) 有效性 (3) 一致性 无偏性是指估计量抽样分布的期望值等于被估计 的总体参数。 x、 p、 2 s 分别是总体均值 、总体 比例 、总体方差 2 的无偏估计量。 有效性是指估计量的方差尽可能小。对同一个总 体参数的两个无偏估计量,有更小方差的估计量更 有效。 一致性是指一个大样本给出的估计量要比一个小 样本给出的估计量更接近总体的参数。样本均值是 总体均值的一个一致估计量。 14、关于总体均值的区间估计: (1) 在对总体均值进行区间估计时, 需要考虑总体 是否为正态分布、总体方差是否已知、用于估计的 样本是大样本( 30 n )还是小样本( 30 n )等 情况。 (2)大样本情况下,总体服从正态分布,总体方差 已知,总体均值在置信水平 1 下的置信区间为 + n z x n z x 2 2 , (3)大样本情况下,总体服从正态分布,总体方差 未知,总体均值在置信水平 1 下的置信区间为 + n s z x n s z x 2 2 , (4)小样本情况下,总体服从正态分布,总体方差 已知,总体均值在置信水平 1 下的置信区间为 + n z x n z x 2 2 , (5)小样本情况下,总体服从正态分布,总体方差 未知,总体均值在置信水平 1 下的置信区间为 + n s t x n s t x 2 2 , 关于总体比例的区间估计,在大样本条件下,若 5 np , 5 ) 1 p n ( ,则二项分布可用正态分布近 似,在 1 的置信水平下的置信区间为 ( ) ( ) + n p p z p n p p z p 1 , 1 2 2 。 样本量与置信水平成正比关系,与总体方差成正 比,与允许的估计误差的平方成反比。 如果总体比例 的值不知道可以用样本比例 p代 替,或者取 =0.5,使得 ( ) 1 达到最大。 第四章 假设检验 6 1、 假设检验: 是先对总体参数或分布形式提出某种 假设,然后利用样本信息和相关统计量的分布特征 去检验这个假定,做出是否拒绝原来假设的结论。 2、 小概率事件: 是指在一次事件中几乎不可能发生 的事件,一般称为“显著性水平” ,用 表示。 显著性水平一般取值为 =0.05 或 =5%。 3、假设检验的过程: (1)提出原假设和备择假设 (2)确定检验统计量 (3)确定显著性水平 (4) 根据数据计算检验统计量值和与这个统计量值 对应的概率值p值,并进行决策 原假设也称为零假设, 记为 0 h ; 备则假设也称为 备选假设,记为 1 h 。 在对总体的均值进行检验时,大样本应用正态分 布检验,计算 z 统计量,小样本一般用t分布检验, 计算t统计量。 拒绝正确零假设的错误称为第一类错误或弃真错 误 ( ) ; 当备选假设正确时反而说零假设正确的错 误称为第二类错误或取伪错误( ) 。 4、对假设检验的总结: (1)假设检验依据的是小概率原理 (2)小概率标准在抽样前依需要确定 (3)假设检验的结果只能是拒绝或不拒绝原来假 设,而不能证明原假设成立 (4)统计假设检验的结果不是绝对正确 5、关于总体均值的假设检验: (1) 在对总体均值进行假设检验时, 采用什么检验 统计量,取决于所抽检的样本是大样本( 30 n ) 还是小样本( 30 n ) ,还需要考虑总体是否为正态 分布、总体方差是否已知等情况。 (2)大样本情况下,当总体方差已知时,总体均值 检验的统计量为: n x z / = (3)大样本情况下,当总体方差未知时,总体均值 检验的统计量为: n s x z / = (4)小样本情况下,当总体均值服从正态分布,总 体方差已知时,总体均值检验的统计量为: n x z / = (5)小样本情况下,当总体均值服从正态分布,总 体方差未知时, 总体均值检验的统计量为: n s x t / = 6、总体比例的检验的三种基本形式: (1)双侧检验: 0 0 : = h , 0 1 : h (2)左侧检验: 0 0 : h , 0 1 : h (3)右侧检验: 0 0 : h , 0 1 : h 总体比例的假设检验,在大样本时,样本比例会 近似服从正态分布, 所以检验统计量仍用z 统计量, 其基本形式为: n p z ) ( 0 0 0 1 = 第五章 相关分析与回归分析 1、 相关关系: 是存在着密切的联系但又不是严格的、 确定的关系。 2、相关关系根据相关的形态分为: (1)线性相关 (2)非线性相关 3、相关关系根据相关的方向分为: (1)正相关 (2)负相关 正相关是两个变量的变动方向总体上相同,负相 关是两个变量变动的方向总体上相反。 4、相关系数:是测定变量之间关系密切程度的量, 它能够以数字准确地描述变量之间的相关程度。 5、关于相关系数r : 7 (1)r 的取值范围为-1r 1。r 值越接近 1(或 -1)就越正(或负)相关,越接近 0 就越不相关。 (2)r 具有对称性。x与y之间的相关系数 xy r 和y 与 x之间的相关系数 yx r 相等。 (3)r =0 只表示两个变量之间不存在线性相关, 并 不表明变量之间没有任何关系。 回归方程的拟合程度分析最常用的指标是判定系 数 2 r 。 2 r 的取值范围在0,1, 2 r =1 时,拟合是 完全的, 即所有观测值都在直线上。 2 r 越接近于 0, 回归直线的拟合程度越差。 估计标准误差 e s 也是说明回归直线拟合程度的指 标, e s 越小,根据回归方程进行预测就越准确。 第六章 时间序列分析 1、时间序列:是指反映社会、经济、自然现象的数 据按时间先后顺序记录形成的数列。 2、时间序列的两个构成要素: (1)现象所属的时间 (2)对应 不同时间的统计指标数值 3、反映时间序列增长量的指标有: (1) 发展水平 (2) 增长量 (3) 平均增长量 4、 增长量: 是指时间序列中两个不同时期的发展水 平之差,反映社会经济现象报告期比基期增加或减 少的数量。 5、增长量的计算公式: 增长量=报告期水平-基期水平 6、增长量根据采用的基期不同分为: (1)逐期增长量 (2)累计增长量 7、逐期增长量:是报告期水平与前一期水平之差, 说明报告期比前一时期增长的绝对数量。 8、 累计增长量: 是报告期水平与某一固定时期水平 之差,说明本期比某一固定时期增长的绝对数量, 也说明在某一较长时期内总的增长量。 逐期增长量之和等于相对时期的累计增长量。 9、反映时间序列增长率的指标有: (1)发展速度 (2)增长速度 (3)平均发展速 度 (4)平均增长速度 10、发展速度:是表明现象发展程度的动态相对指 标,它是两个不同时期的发展水平对比的结果。 11、发展速度的计算公式: 发展速度=报告期水平基期水平100% 12、发展速度根据采用的基期不同分为: (1)环比发展速度 (2)定基发展速度 13、环比发展速度与定基发展速度的关系:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年数据中心光纤购置合同
- 2024国际快递航线运营许可合同
- 2024年技术开发合同研发内容与开发期限
- 2024年文化旅游项目合作开发协议
- 2024年新住宅转租协议
- 2024年影视作品制作与发行代理合同
- 2024年教育培训机构合作与教学资料保密合同
- 信息必刷卷01-2023年高考地理考前信息必刷卷(湖南专用)(原卷版)
- 2024年教室租赁合同(培训用)
- 2024年城市基础设施建设合同 with 标的为新建一座桥梁
- 电子天平校准规范 JJF1847-2020 (高清-现行)
- 中国古代服饰演变PPT
- T∕CSAE 237-2021 重型汽车实际行驶污染物排放测试技术规范
- 腔隙性脑梗塞诊疗临床路径
- 幼儿园绘本故事:《感谢的味道》 PPT课件
- 《工作周报管理制度管理办法》
- 消防设施设备及器材
- 胎心监护专家共识
- 环境工程专业英语翻译理论PPT选编课件
- 金融企业详细划分标准出台-共分大中小微四类型
- 好书推荐——《三毛流浪记》PPT通用课件
评论
0/150
提交评论