版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2014 中级统计师考试- 统计方法知识考试重点归纳21第一章 统计和数据统计是用来处理数据的,是关于数据的一门学问。1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和 方法。2、统计分析数据的方法分为:( 1)描述统计 (2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。5、推断统计包括:( 1)参数估计(2)假设检验6、定性变量的特点: 只反映现象的属性特点,不能说明具体量的大小和差异。 定性变量包括分类变量和顺序变量。只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对 其
2、数据进行数学运算。如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区 分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。7、定量变量的特点: 可以用数值表示其观察结果, 而且这些数值具有明确的数值含义, 不仅能分类而 且能测量出来具体大小和差异 数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数 值的形式出现的, 有些数值型数据只可以计算数据之间的绝对差, 而有些数值型 数据不仅可以计算数据之间的绝对差, 还可以计算数据之间的相对差。 其计量精 度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。8、数据按获取的方法不同分为:
3、(1)观测数据 (2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中 一般没有人为的控制和条件约束。10、实验数据:一般是在科学实验环境下取得的数据。11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是 数据的间接来源。12 、数据的直接来源:(1)统计调查(2)实验法通过统计调查得到的数据,一般称为观测数据。 运用实验法时,实验组和对照组的产生应当是随机的。 13、数据的间接来源:( 1)公开出版的统计数据( 2)尚未公开发表的统计数据14 、搜集数据
4、的方法 :( 1)普查(2)抽样调查(3)统计报表( 4)重点调查(5)典型调查15、普查:是专门组织一次性的全面调查,用来调查属于一定时点或时期内的 社会现象总量。普查适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以 摸清重大的国情、国力。16、普查的特点:(1)是一种全面调查,具有资料包括范围全面、详尽、系统的优点。(2)是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长, 一般不宜经常举行。17、抽样调查的特点: (1)样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。(2)能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从 而达到对调
5、查总体的认识。(3)在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。18、在实际调查中抽样的方法:( 1)概率抽样(2)非概率抽样19、常用的概率抽样形式有:( 1)简单随机抽样(2)分层抽样(3)整群抽样(4)系统抽样20、分层抽样:是先将总体各单位按主要标志加以分层,然后在每一层内进行 抽样。21、系统抽样:又称等距抽样,是在总体的名录框中每隔一定距离抽选一个被 调查者22、统计报表:是按照国家统一规定的调查要求与文件自下而上的提供统计资 料的一种调查方式。23、统计报表按照报送范围分为:( 1)全面报表(2)非全面报表24 、统计报表的内容包括:( 1)表式(2)填表说明
6、25、重点调查:是在调查对象中选择一部分对全局具有决定性作用的重点单位 进行的一种非全面调查。当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全 面的准确资料, 而且在总体中确实存在着重点单位时, 进行重点调查是比较适宜 的。26、典型调查:是一种非全面的调查,是根据调查的目的与要求,在对被调查 对象进行全面分析的基础上, 有意识地选择若干具有典型意义的或有代表性的单 位进行的调查。27、典型调查的作用:(1)补充全面调查的不足(2)在一定条件下可以验证全面调查数据的真实性典型调查具有灵活机动、通过少数典型即可取得深入详实的统计资料的优点, 但是易受人们主观认识上的影响, 必
7、须同其他调查结合起来使用, 才能避免出现 片面性。第二章 数据描述1、定性数据的图形表示有:( 1)饼图(2)条形图(3)环形图饼图是利用圆形及圆内扇形面积来表示数值大小的图形。条形图是用宽度相同的条形的高度或长度来表述数据多少的图形。如果想比较不同变量之间的结构差异,可以通过环形图来实现。 定性数据的图示表示方法,也都适用于定量数据。但定量数据还有一些特定的 图示方法,它们并不适用于定性数据。2、频数:是指频数分布表中落在某一特定类别的数据个数。3、生成定量数据的频数分布表的步骤:( 1)对数据进行分组( 2)确定组距(3)统计出各组的频数及频数分布表组距是每个组变量值中的最大值与最小值之差
8、,也就是上限与下限之差。4、在确定组距时应掌握的原则:(1)要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。(2)要能准确地清晰地反映总体单位的分布特征。 在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而 当研究的现象变动很不均匀时,一般采用不等距分组。在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即 将该频数计算在与下限相同的组内。5、定量数据的图形表示有:( 1)直方图(2)折线图(3)散点图 直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。6、统计表的五个组成部分:(1)表头 (2)行标题 (3)列标题 (4 )数字资料 (5
9、)表外附加7、数据的分布特征:(1)集中趋势,即一组组数据的数值向其中心值的靠拢程度(2)离散程度,即一组数据的各个数值远离其中心的趋势和程度8、定性数据的集中趋势常用的计算方法:(1)百分比(2)中位数(3)众数9、中位数:是数据按照大小排列之后位于中间的那个数。如果样本量为偶数, 则是中间两个数的平均。10、众数:就是数据中出现次数或出现频率最多的数值。11、反映定量数据特征的统计量有:反映数据集中趋势的水平度量:(1)平均数 (2)中位数(3)众数 (4)分位数反映数据离散程度的差异度量:(1)极差 (2 )四分位差(3)标准差 (4)方差平均数易为多数人理解和接受,实际中用的也较多,但
10、主要缺点是更容易受少 数极端数值的影响。中位数和众数提供的信息不像平均数那样多, 但具有统计上 的稳健性,当数据为偏态分布,特别是偏斜程度较大时,中位数和众数的代表性 要比平均数好。12、极差:又称全距,是一组数据中的最大值和最小值之差。极差非常容易受数据中极端值的影响。方差用二2表示,总体标准差用-表示,样本标准差用s表示,离散系数用:表 示,标准分数用Z表示。标准差是方差的平方根,它与方差相比更具量纲性。在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的 趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它 的趋中程度就越好。标准差的大小会受到数据本身数
11、值大小的影响。两个数列的标准差相同,但是 两数列的差异程度却不同。为了更准确地反映差异程度,要计算离散系数。13、离散系数:是将一组数据的标准差除以其均值,用来测度数据离散程度的 相对数。14、标准分数:是变量值与其平均数的离差除以标准差后的值,用以测定某一 个数据在该组数据中的相对位置。第三章参数估计统计量的概率分布构成了推断总体参数的理论基础。5、关于样本均值的抽样分布:(1) 设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时, 共有Nn种抽法;在不重复抽样时,共有CN N! 个样本。n !(N n)!(2) 样本均值的抽样分布就是指所有可能抽出来的样本x的分布。(3) 样
12、本均值的均值就是总体均值,即 E(X)二 I。(4) 重置抽样时,样本均值的标准差为总体标准差匚的丄,即二-;nn不重置抽样时,样本均值的方差为(5) 当总体服从正态分布时,样本均值一定服从正态分布,即有:_ 2X N( L,二2)时,x N( S, ) o n(6) 若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n绍0), 样本均值x仍会接近正态分布,其分布的期望值为总体均值,样本方差为总体方1差的1 on(7) 如果总体不是正态分布,当 n为小样本时(通常n 30 ),样本均值的分布 则不服从正态分布。6、关于样本比例的抽样分布:(1) 当样本容量比较大时,样本比率p近似服从正
13、态分布,且有p的数学期望就是总体比率,即E(p)1 o(2)在重置抽样时,p的方差为二2二(1 -二)n(3)在不重置抽样时,p的方差为二2二二(1 -二)N nN -1(4)在重置抽样时,p的分布为pN(打心一)n(5) 在不重置抽样时,p的分布为pN( J (1 _二)归)nN 17、关于统计量的标准误差:(1)统计量的标准误差用于衡量样本统计量的离散程度。在参数估计中,用于 衡量样本统计量与总体参数之间差距(2)样本均值的标准误计算公式为:a(J-= x . n(3)当总体标准差二未知时,可用样本标准差s代替计算,这时计算的标准误 差称为估计标准误差。(4)样本比例的标准误计算公式为:(
14、1-7:) n(5)当总体比例的方差二(1-二)未知时,可用样本比例的方差p(1-p)代替8、参数估计:就是用样本统计量去估计未知的总体参数。9、用样本统计量估计总体参数的两种方法:(1)点估计10、常用的点估计有:(2 )区间估计(1)用样本均值x估计总体均值(2)用样本比例p估计总体比例二(3)用样本方差S估计总体方差-211、区间估计:是包括样本统计量在内的一个区间,该区间通常是由样本统计 量加减估计标准误差得到的。12、关于区间估计:(1)标准正态分布N (0,1 )的均值为0,标准差为1(2)标准化的公式为:Z二(观测值-均值)十标准差(3)以68.27%的置信水平推断总体参数 的置
15、信区间为(z1):(4)以95.45%的置信水平推断总体参数的置信区间为(z-2):(X - 2 , x 2c(5)以99.73%的置信水平推断总体参数J的置信区间为(z-3):a(x -313、评价估计量的标准有:(1)无偏性(2)有效性(3) 一致性无偏性是指估计量抽样分布的期望值等于被估计的总体参数。x、p、s2分别是总体均值、总体比例二、总体方差匚2的无偏估计量。有效性是指估计量的方差尽可能小。对同一个总体参数的两个无偏估计量,有 更小方差的估计量更有效。 一致性是指一个大样本给出的估计量要比一个小样本给出的估计量更接近总体 的参数。样本均值是总体均值的一个一致估计量14、关于总体均值
16、的区间估计:(1)在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于估计的样本是大样本(n 一30)还是小样本(n : 30 )等情况。(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平/XCJ CJ1口下的置信区间为 X -Zg尸,X +zg了2和n2讪(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平1下的置信区间为- s sX - Z :,x z-.2寸n2斗n(4) 小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平1下的置信区间为-CJ -CFx _ za 厂 x + % 厂2寸n2吋n(5) 小样本情
17、况下,总体服从正态分布,总体方差未知,总体均值在置信水平1下的置信区间为关于总体比例的区间估计,在大样本条件下,若叩一5,n (1- p)_5,贝项分布可用正态分布近似,在1-的置信水平下的置信区间为I p(1 - P )丄 PZn ,p 样本量与置信水平成正比关系,与总体方差成正比,与允许的估计误差的平方 成反比。如果总体比例二的值不知道可以用样本比例p代替,或者取 二=0.5,使得 二1 -二达到最大。第四章假设检验1、假设检验:是先对总体参数或分布形式提出某种假设,然后利用样本信息和 相关统计量的分布特征去检验这个假定,做出是否拒绝原来假设的结论。2、小概率事件:是指在一次事件中几乎不可
18、能发生的事件,一般称为“显著性水 平”用a表示。显著性水平一般取值为:=0.05或=5%3、假设检验的过程:(1)提出原假设和备择假设(2)确定检验统计量(3)确定显著性水平:(4) 根据数据计算检验统计量值和与这个统计量值对应的概率值P值,并进行 决策原假设也称为零假设,记为Ho;备则假设也称为备选假设,记为 Hi。在对总体的均值进行检验时,大样本应用正态分布检验,计算z统计量,小样本一般用t分布检验,计算t统计量。拒绝正确零假设的错误称为第一类错误或弃真错误 (:);当备选假设正确时反 而说零假设正确的错误称为第二类错误或取伪错误(1 )。4、对假设检验的总结:(1)假设检验依据的是小概率
19、原理(2)小概率标准在抽样前依需要确定(3)假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立(4)统计假设检验的结果不是绝对正确5、关于总体均值的假设检验:(1)在对总体均值进行假设检验时,采用什么检验统计量,取决于所抽检的样 本是大样本(n30)还是小样本(nv30 ),还需要考虑总体是否为正态分布、 总体方差是否已知等情况。x-(2) 大样本情况下,当总体方差已知时,总体均值检验的统计量为:z=J(3) 大样本情况下,当总体方差未知时,总体均值检验的统计量为:z = Vs/n(4) 小样本情况下,当总体均值服从正态分布,总体方差已知时,总体均值检验的统计量为:x- F(5)
20、小样本情况下,当总体均值服从正态分布,总体方差未知时,总体均值检 验的统计量为:6、总体比例的检验的三种基本形式:(1)双侧检验:H :二-二 , H1 :y (2)左侧检验:Ho:_I, H1 :二v 二 (3)右侧检验:H。: :-:o, H1 :二二总体比例的假设检验,在大样本时,样本比例会近似服从正态分布,所以检验统计量仍用Z统计量,其基本形式为:p 兀z _ r二 (1-二 )n第五章相关分析与回归分析1、相关关系:是存在着密切的联系但又不是严格的、确定的关系2、相关关系根据相关的形态分为:(1)线性相关(2)非线性相关3、相关关系根据相关的方向分为:(1)正相关(2) 负相关正相关
21、是两个变量的变动方向总体上相同,负相关是两个变量变动的方向总体 上相反。4、相关系数:是测定变量之间关系密切程度的量,它能够以数字准确地描述变 量之间的相关程度。5、关于相关系数 r :(1) r的取值范围为-1 r 1。 r值越接近1 (或-1)就越正(或负)相关,越 接近 0 就越不相关。(2) r具有对称性。x与y之间的相关系数rxy和y与x之间的相关系数ryx相等。( 3) r =0 只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系。回归方程的拟合程度分析最常用的指标是判定系数 R2 o R2的取值范围在0,1, R2=1时,拟合是完全的,即所有观测值都在直线上。 R2越
22、接近于0,回归直线 的拟合程度越差。估计标准误差Se也是说明回归直线拟合程度的指标,Se越小,根据回归方程进 行预测就越准确。第六章 时间序列分析1 、时间序列:是指反映社会、经济、自然现象的数据按时间先后顺序记录形成的数列。2 、时间序列的两个构成要素:1 )现象所属的时间2)对应不同时间的统计指标数值3、反映时间序列增长量的指标有:( 1)发展水平(2)增长量(3)平均增长量4、增长量:是指时间序列中两个不同时期的发展水平之差,反映社会经济现象 报告期比基期增加或减少的数量。5、增长量的计算公式:增长量=报告期水平 -基期水平6、增长量根据采用的基期不同分为:( 1)逐期增长量(2)累计增
23、长量7、逐期增长量:是报告期水平与前一期水平之差,说明报告期比前一时期增长 的绝对数量。8、累计增长量:是报告期水平与某一固定时期水平之差,说明本期比某一固定 时期增长的绝对数量,也说明在某一较长时期内总的增长量。逐期增长量之和等于相对时期的累计增长量。9、反映时间序列增长率的指标有:(1)发展速度 ( 2)增长速度 (3)平均发展速度 (4)平均增长速度10、发展速度:是表明现象发展程度的动态相对指标,它是两个不同时期的发 展水平对比的结果。11、发展速度的计算公式:发展速度=报告期水平十基期水平X100%12、发展速度根据采用的基期不同分为:(1)环比发展速度(2)定基发展速度 13 、环比发展速度与定基发展速度的关系:(1)环比发展速度的连乘积等于对应的定基发展速度(2) 相邻时期的两个定基发展速度相除的商等于相应的环比发展速度14、增长速度:是表明现象增长程度的动态相对指标。15、增长速度的计算公式:增长速度=增长量宁基期发展水平=发展速度-116、平均发展速度:是一定时期内各个环比发展速度的平均数。17、平均发展速度与平均增长速度的关系:平均增长速度=平均发展速度-118、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度地铁隧道锚具招标书及合同模板4篇
- 二零二五年度牙科诊所医疗事故处理及责任认定合同4篇
- 二零二五年度大米产业链环境保护与可持续发展合同4篇
- 三方建筑工程分包施工合同样本(2024版)
- 二零二五年度二手车买卖与车辆年检合同3篇
- 二零二五年度奢侈品代购与售后服务合同3篇
- 2025版养老机构委托代建及养老服务合同3篇
- 2025年度鱼塘租赁合同(含渔业科研合作及成果转化)4篇
- 包含质量保证与价格波动的二零二五年度中医院药材合同3篇
- 2025仓储物流配送网络优化承包合同范本3篇
- 道路沥青工程施工方案
- 《田口方法的导入》课件
- 内陆养殖与水产品市场营销策略考核试卷
- 票据业务居间合同模板
- 承包钢板水泥库合同范本(2篇)
- DLT 572-2021 电力变压器运行规程
- 公司没缴社保劳动仲裁申请书
- 损伤力学与断裂分析
- 2024年县乡教师选调进城考试《教育学》题库及完整答案(考点梳理)
- 车借给别人免责协议书
- 应急预案评分标准表
评论
0/150
提交评论