中级统计师考试 统计方法知识考试重点归纳私藏打印版_第1页
中级统计师考试 统计方法知识考试重点归纳私藏打印版_第2页
中级统计师考试 统计方法知识考试重点归纳私藏打印版_第3页
中级统计师考试 统计方法知识考试重点归纳私藏打印版_第4页
中级统计师考试 统计方法知识考试重点归纳私藏打印版_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

20145、推断统计包括:20145、推断统计包括:(1)参数估计(2)假设检验-统计方法知识考试重点归纳第一章统计与数据•统计就是用来处理数据得,就是关于数据得一门学问。1>统计学:就是用以收集数据、分析数据与由数据得出结论得一组概念、原则与方法。2、统计分析数据得方法分为:(1)描述统计 (2)推断统计3、描述统计:就是研究数据搜集、处理与描述得统计学方法。4、推断统计:就是研究如何利用样本数据来推断总体特征得统计学方法。6、定性变量得特点:只反映现象得属性特点,不能说明具体量得大小与差异。•定性变量包括分类变量与顺序变量O•只反映现象分类特征得变量称分类变量。 分类变量没有数值特征,所以不能对其数据进行数学运算。•如果类别具有一定得顺序,这样得变量称为顺序变量。顺序变量不仅能用来区分客观现象得不同类别,而且还可以表明现象之间得大小、高低、优劣关系。7、定量变量得特点:可以用数值表示其观察结果, 而且这些数值具有明确得数值含义, 不仅能分类而且能测量出来具体大小与差异。•数值型数据(定量数据)作为统计研究得主要资料, 其特征在于它们都就是以数

而有些数值型数值得形式出现得,有些数值型数据只可以计算数据之间得绝对差,而有些数值型数据不仅可以计算数据之间得绝对差, 还可以计算数据之间得相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛得用途。8、数据按获取得方法不同分为: (1)观测数据(2)实验数据9、观测数据:就是对客观现象进行实地观测所取得得数据,在数据取得得过程中般没有人为得控制与条件约束O10、实验数据:一般就是在科学实验环境下取得得数据。11>统计数据资料得来源:通过直接得调查或实验获得得原始数据,这就是统计数据得直接来源;别人调查得间接数据,并将这些数据进行加工与汇总后公布得数据,这就是数据得间接来源。12、数据得直接来源:12、数据得直接来源:(1)统计调查(2)实验法•通过统计调查得到得数据,一般称为观测数据。•运用实验法时,实验组与对照组得产生应当就是随机得。13、数据得间接来源:(1)公开出版得统计数据(1)公开出版得统计数据(2)尚未公开发表得统计数据14>搜集数据得方法:(1)普查(2)(1)普查(2)抽样调查(3)统计报表(4)重点调查(4)重点调查(5)典型调查15、普查:就是专门组织一次性得全面调查,用来调查属于一定时点或时期内得社会现象总量。

以摸•普查适用于搜集某些不能或不适宜于定期得全面统计报表搜集得统计资料,以摸清重大得国情、国力。16、普查得特点:就是一种全面调查,具有资料包括范围全面、详尽、系统得优点。就是一次性得专门调查,因为普查得工作量大,耗资也多,时间周期较长,般不宜经常举行。17、抽样调查得特点:样本单位按随机原则抽取,排除了主观因素对选取样本单位得影响。能够根据部分调查得实际资料对调查对象得总体得数量特征进行推断,从而达到对调查总体得认识O在抽样调查中会存在抽样误差,但就是这个误差可以事先计算并加以控制。18、在实际调查中抽样得方法:(1)概率抽样(1)概率抽样(2)非概率抽样19、常用得概率抽样形式有:(1)简单随机抽样(2)(1)简单随机抽样(2)分层抽样(3)整群抽样(4)系统抽样20、分层抽样:就是先将总体各单位按主要标志加以分层,20、分层抽样:就是先将总体各单位按主要标志加以分层,然后在每一层内进行抽21、系统抽样:21、系统抽样:22、统计报表:样。又称等距抽样,就是在总体得名录框中每隔一定距离抽选一个被调就是按照国家统一规定得调查要求与文件自下而上得提供统计资料得一种调查方式。(2)(2)非全面报表23、统计报表按照报送范围分为:(1)全面报表24、统计报表得内容包括:(24、统计报表得内容包括:(1)表式(2)填表说明25、重点调查:就是在调查对象中选择一部分对全局具有决定性作用得重点单位进行得一种非全面调查。而不要求掌握全面•当调查得任务只要求掌握事物得基本状况与基本得发展趋势,而不要求掌握全面得准确资料,而且在总体中确实存在着重点单位时, 进行重点调查就是比较适宜得。26、典型调查:就是一种非全面得调查,就是根据调查得目得与要求,在对被调查对象进行全面分析得基础上,有意识地选择若干具有典型意义得或有代表性得单位进行得调查。27、典型调查得作用:补充全面调查得不足在一定条件下可以验证全面调查数据得真实性•典型调查具有灵活机动、通过少数典型即可取得深入详实得统计资料得优点,就是易受人们主观认识上得影响, 必须同其她调查结合起来使用,才能避免出现片面性。第二章数据描述1、定性数据得图形表示有:(1)饼图(2)(1)饼图(2)条形图(3)环形图•饼图就是利用圆形及圆内扇形面积来表示数值大小得图形O•条形图就是用宽度相同得条形得高度或长度来表述数据多少得图形O•如果想比较不同变量之间得结构差异,可以通过环形图来实现。•定性数据得图示表示方法, 也都适用于定量数据。但定量数据还有一些特定得图示方法,它们并不适用于定性数据。2、频数:就是指频数分布表中落在某一特定类别得数据个数。3、生成定量数据得频数分布表得步骤:(2)确定组距(2)确定组距统计出各组得频数及频数分布表•组距就是每个组变量值中得最大值与最小值之差,也就就是上限与下限之差。4、在确定组距时应掌握得原则:(1)要考虑各组得划分就是否能区分总体内部各个组成部分得性质差别。要能准确地清晰地反映总体单位得分布特征。•在确定组距时,在研究得现象变动比较均匀得情况下,可以采用等距分组;而当研究得现象变动很不均匀时,一般采用不等距分组。•在统计各组频数时,恰好等于某一组得组限时, 则采取上限不在内得原则,即将该频数计算在与下限相同得组内O5、定量数据得图形表示有:(1)直方图(2)(1)直方图(2)折线图(3)散点图•直方图得横坐标代表变量分组,纵坐标代表各变量值出现得频数O6、统计表得五个组成部分:(1)表头(2)行标题(3)列标题(4)数字资料 (5)表外附加7、数据得分布特征:集中趋势,即一组组数据得数值向其中心值得靠拢程度(2)离散程度,即一组数据得各个数值远离其中心得趋势与程度8、定性数据得集中趋势常用得计算方法:(1)百分比(2)(1)百分比(2)中位数(3)众数9、中位数:就是数据按照大小排列之后位于中间得那个数。如果样本量为偶数,则就是中间两个数得平均。10、众数:就就是数据中出现次数或出现频率最多得数值。11>反映定量数据特征得统计量有:反映数据集中趋势得水平度量:(1)平均数(1)平均数(2)中位数(3)众数(4)分位数反映数据离散程度得差异度量:(1)极差(1)极差(2)四分位差(3)标准差(4)方差•平均数易为多数人理解与接受,•平均数易为多数人理解与接受,实际中用得也较多,但主要缺点就是更容易受少数极端数值得影响。中位数与众数提供得信息不像平均数那样多, 但具有统计上得稳健性,当数据为偏态分布,特别就是偏斜程度较大时,中位数与众数得代表性要比平均数好。12、极差:又称全距,就是一组数据中得最大值与最小值之差。•极差非常容易受数据中极端值得影响。•方差用表示,总体标准差用表示,样本标准差用表示,离散系数用表示,标准分数用表示。•标准差就是方差得平方根,它与方差相比更具量纲性。•在一个统计样本中,其标准差越大,说明它得各个观测值分布得越分散, 它得趋中程度就越差。反之,其标准差越小,说明它得各个观测值分布得越集中,它得趋中程度就越好。

•标准差得大小会受到数据本身数值大小得影响•标准差得大小会受到数据本身数值大小得影响O两个数列得标准差相同,但就是两数列得差异程度却不同。为了更准确地反映差异程度,要计算离散系数。13、离散系数:就是将一组数据得标准差除以其均值, 用来测度数据离散程度得相对数。14、标准分数:就是变量值与其平均数得离差除以标准差后得值,用以测定某一个数据在该组数据中得相对位置O第三章参数估计1、总体分布:就是总体中所有观测值所形成得分布。2、总体参数:就是对总体特征得某个概括性得度量。3、总体参数指标有:(1)总体平均数()(1)总体平均数()(2)总体方差()(3)总体比例0等。•统计量就是样本得函数。构成统计量得函数中不能包含未知因素O4、样本统计量指标有:样本均值()样本方差()样本比例()样本均值()样本方差()样本比例()•统计量得概率分布构成了推断总体参数得理论基础。5、关于样本均值得抽样分布:设总体共有个元素,从中随机抽取一个容量为得样本,在重置抽样时,共有种抽法;在不重复抽样时,共有个样本。样本均值得抽样分布就就是指所有可能抽出来得样本得分布。样本均值得均值就就是总体均值,即。重置抽样时,样本均值得标准差为总体标准差得,即;不重置抽样时,样本均值得方差为。

当总体服从正态分布时,样本均值一定服从正态分布,即有:〜时,〜。30),样本若总体为未知得非正态分布时,只要样本容量足够大(通常要求》30),样本如果总体不就是正态分布,当为小样本时(通常<30),样本均值得分布则不服从正态分布O6、关于样本比例得抽样分布:当样本容量比较大时,样本比率近似服从正态分布,且有得数学期望就就是总体比率,即。在重置抽样时,得方差为。在不重置抽样时,得方差为。(4)在重置抽样时,得分布为〜(4)在重置抽样时,得分布为〜在不重置抽样时,得分布为〜7、关于统计量得标准误差:(1)统计量得标准误差用于衡量样本统计量得离散程度。在参数估计中,用于衡量样本统计量与总体参数之间差距。样本均值得标准误计算公式为:当总体标准差未知时,可用样本标准差代替计算,这时计算得标准误差称为估计标准误差。样本比例得标准误计算公式为:当总体比例得方差未知时,可用样本比例得方差代替。8、参数估计:就就是用样本统计量去估计未知得总体参数。9、用样本统计量估计总体参数得两种方法:•一致性就是指一个大样本给出得估计量要比一个小样本给出得估计量更接近总(1)点估计(2)区间估计体得参数。样本均值就是总体均值得一个一致估计量。10、常用得点估计有:14、关于总体均值得区间估计:(1)用样本均值估计总体均值(2)用样本比例估计总体比例(1)在对总体均值进行区间估计时,需要考虑总体就是否为正态分布、总体方差(3)用样本方差估计总体方差就是否已知、用于估计得样本就是大样本()还就是小样本()等情况。11、区间估计:就是包括样本统计量在内得一个区间, 该区间通常就是由样本统计(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下量加减估计标准误差得到得。得置信区间为12、关于区间估计:(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下(4)标准正态分布(0,1)得均值为0,标准差为1。标准化得公式为:(观测值-均值)十标准差68、27%得置信水平推断总体参数得置信区间为:95、45%得置信水平推断总体参数得置信区间为:99、73%得置信水平推断总体参数得置信区间为:13、评价估计量得标准有:(1)无偏性(2)有效性(3)—致性•无偏性就是指估计量抽样分布得期望值等于被估计得总体参数。、、分别就是总体均值、总体比例、总体方差得无偏估计量。•有效性就是指估计量得方差尽可能小。 对同一个总体参数得两个无偏估计量, 有更小方差得估计量更有效。得置信区间为(4)小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下得置信区间为(5)小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下得置信区间为•关于总体比例得区间估计,在大样本条件下,若,似,在得置信水平下得置信区间为P z_"2,P z_"2,则二项分布可用正态分布近•样本量与置信水平成正比关系,与总体方差成正比,与允许得估计误差得平方成反比。•如果总体比例得值不知道可以用样本比例代替,或者取=0、5,使得达到最大。第四章假设检验1、假设检验:就是先对总体参数或分布形式提出某种假设,然后利用样本信息与相关统计量得分布特征去检验这个假定,做出就是否拒绝原来假设得结论。2、小概率事件:就是指在一次事件中几乎不可能发生得事件,一般称为“显著性水平”,用表示。•显著性水平一般取值为=0、05或=5%3、假设检验得过程:提出原假设与备择假设确定检验统计量确定显著性水平根据数据计算检验统计量值与与这个统计量值对应得概率值值,并进行决策•原假设也称为零假设,记为;备则假设也称为备选假设,记为。计算统计量,小样本一;当备选假设正确时反而•在对总体得均值进行检验时,大样本应用正态分布检验,般用分布检验,计算统计量。计算统计量,小样本一;当备选假设正确时反而•拒绝正确零假设得错误称为第一类错误或弃真错误()说零假设正确得错误称为第二类错误或取伪错误()4、对假设检验得总结:假设检验依据得就是小概率原理小概率标准在抽样前依需要确定假设检验得结果只能就是拒绝或不拒绝原来假设,而不能证明原假设成立(4)统计假设检验得结果不就是绝对正确(4)统计假设检验得结果不就是绝对正确5、关于总体均值得假设检验:(1)在对总体均值进行假设检验时,采用什么检验统计量,取决于所抽检得样本就是大样本0还就是小样本0 ,还需要考虑总体就是否为正态分布、总体方差

就是否已知等情况。大样本情况下,当总体方差已知时,总体均值检验得统计量为:大样本情况下,当总体方差未知时,总体均值检验得统计量为:小样本情况下,当总体均值服从正态分布,总体方差已知时,总体均值检验得统计量为:小样本情况下,当总体均值服从正态分布,总体方差未知时,总体均值检验得统计量为:6、总体比例得检验得三种基本形式:(1)双侧检验:,(2)左侧检验:,右侧检验:,•总体比例得假设检验,在大样本时,样本比例会近似服从正态分布,所以检验统计量仍用统计量,其基本形式为:第五章相关分析与回归分析1>相关关系:就是存在着密切得联系但又不就是严格得、确定得关系。2、相关关系根据相关得形态分为:(1)线性相关(1)线性相关(2)非线性相关3、相关关系根据相关得方向分为:(1)正相关(1)正相关(2)负相关•正相关就是两个变量得变动方向总体上相同,负相关就是两个变量变动得方向总•正相关就是两个变量得变动方向总体上相同,负相关就是两个变量变动得方向总体上相反。4、相关系数:就是测定变量之间关系密切程度得量,它能够以数字准确地描述变

量之间得相关程度。5、关于相关系数:(1)得取值范围为-1<<1。值越接近1(或-1)就越正(或负)相关,越接近0就越不相关。(2)具有对称性。与之间得相关系数与与之间得相关系数相等。=0只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系。[0,1],=1•[0,1],=10,回归直线得拟合程0,回归直线得拟合程度越差。•估计标准误差也就是说明回归直线拟合程度得指标,越小,根据回归方程进行预•估计标准误差也就是说明回归直线拟合程度得指标,越小,根据回归方程进行预测就越准确。第六章时间序列分析1>时间序列:就是指反映社会、经济、自然现象得数据按时间先后顺序记录形成得数列。2、时间序列得两个构成要素:(1)现象所属得时间(1)现象所属得时间(2)对应不同时间得统计指标数值3、反映时间序列增长量得指标有:(1)发展水平(2)(1)发展水平(2)增长量(3)平均增长量4、增长量:就是指时间序列中两个不同时期得发展水平之差,反映社会经济现象报告期比基期增加或减少得数量O5、增长量得计算公式:增长量二报告期水平-基期水平(2)(2)累计增长量6、增长量根据采用得基期不同分为:(1)逐期增长量7、逐期增长量:就是报告期水平与前一期水平之差,说明报告期比前一时期增长得绝对数量。8、累计增长量:就是报告期水平与某一固定时期水平之差,说明本期比某一固定时期增长得绝对数量,也说明在某一较长时期内总得增长量O•逐期增长量之与等于相对时期得累计增长量。9、反映时间序列增长率得指标有:(1)发展速度 (2)增长速度 (3)平均发展速度 (4)平均增长速度10、发展速度:就是表明现象发展程度得动态相对指标,它就是两个不同时期得发展水平对比得结果。11>发展速度得计算公式:发展速度=报告期水平十基期水平X100%12、发展速度根据采用得基期不同分为:(1)环比发展速度(1)环比发展速度(2)定基发展速度13、环比发展速度与定基发展速度得关系:(1)环比发展速度得连乘积等于对应得定基发展速度(2)相邻时期得两个定基发展速度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论