2021年度中级统计师考试统计方法知识考试重点归纳_第1页
2021年度中级统计师考试统计方法知识考试重点归纳_第2页
2021年度中级统计师考试统计方法知识考试重点归纳_第3页
2021年度中级统计师考试统计方法知识考试重点归纳_第4页
2021年度中级统计师考试统计方法知识考试重点归纳_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7、定量变量特点:

中级记录师考试-记录办法知识考试重可以用数值表达其观测成果,并且这些数值具备明确数值含义,不但能分类并且能

点归纳测量出来详细大小和差别。

・数值型数据(定量数据)作为记录研究重要资料•,其特性在于它们都是以数值形

式浮现,有些数值型数据只可以计算数据之间绝对差,而有些数值型数据不但可以

第一章记录和数据

计算数据之间绝对差,还可以计算数据之间相对差。其计量精度远远高于定性数据。

第二章

・记录是用来解决数据,是关于数据一门学问。在记录学研究中,数值型数据有着最广泛用途。

1、记录学:是用以收集数据、分析数据和由数据得出结论一组概念、原则和办法。8、数据按获取办法不同分为:(1)观测数据(2)实验数据

2、记录分析数据办法分为:(1)描述记录(2)推断记录9、观测数据:是对客观现象进行实地观测所获得数据,在数据获得过程中普通没

3、描述记录:是研究数据收集、解决和描述记录学办法。有人为控制和条件约束。

4、推断记录:是研究如何运用样本数据来推断总体特性记录学办法。10、实验数据:普通是在科学实验环境下获得数据。

5、推断记录涉及:(1)参数预计(2)假设检查11、记录数据资料来源:

6、定性变量特点:(1)通过直接调查或实验获得原始数据,这是记录数据直接来源;

只反映现象属性特点,不能阐明详细量大小和差别。(2)别人调查间接数据,并将这些数据进行加工和汇总后发布数据,这是数据间

・定性变量涉及分类变量和顺序变量。接来源。

•只反映现象分类特性变量称分类变量。分类变量没有数值特性,因此不能对其数12、数据直接来源:(1)记录调查(2)实验法

据进行数学运算。・通过记录调查得到数据,普通称为观测数据。

•如果类别具备一定顺序,这样变量称为顺序变量。顺序变量不但能用来区别客观・运用实验法时,实验组和对照组产生应当是随机。

现象不同类别,并且还可以表白现象之间大小、高低、优劣关系。13、数据间接来源:

(1)公开出版记录数据(2)尚未公开刊登记录数据19、惯用概率抽样形式有:

14、收集数据办法:(1)简朴随机抽样(2)分层抽样(3)整群抽样

(1)普查(2)抽样调查(3)记录报表(4)系统抽样

(4)重点调查(5)典型调查20、分层抽样:是先将总体各单位按重要标志加以分层,然后在每一层内进行抽样。

15、普查:是专门组织一次性全面调查,用来调查属于一定期点或时期内社会现象21、系统抽样:又称等距抽样,是在总体名录框中每隔一定距离抽选一种被调查者。

总量。22、记录报表:是按照国家统一规定调查规定与文献自下而上提供记录资料一种调

•普查合用于收集某些不能或不适当于定期全面记录报表收集记录资料,以摸清重查方式。

大国情、国力。23、记录报表按照报送范畴分为:

16、普查特点:(1)全面报表(2)非全面报表

(1)是一种全面调查,具备资料涉及范畴全面、详尽、系统长处。24、记录报表内容涉及:(1)表式(2)填表阐明

(2)是一次性专门调查,由于普查工作量大,耗资也多,时间周期较长,普通不25、重点调查:是在调核对象中选取一某些对全局具备决定性作用重点单位进行一

适当经常举办。种非全面调查。

17、抽样调查特点:•当调查任务只规定掌握事物基本状况与基本发展趋势,而不规定掌握全面精确资

(1)样本单位按随机原则抽取,排除了主观因素对选用样本单位影响。料,并且在总体中的确存在着重点单位时,进行重点调查是比较适当。

(2)可以依照某些调查实际资料对调核对象总体数量特性进行推断,从而达到对26、典型调查:是一种非全面调查,是依照调查目与规定,在对被调核对象进行全

调查总体结识。面分析基本上,故意识地选取若干具备典型意义或有代表性单位进行调查。

(3)在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。27、典型调查作用:

18、在实际调查中抽样办法:(1)补充全面调查局限性

(1)概率抽样(2)非概率抽样(2)在一定条件下可以验证全面调查数据真实性

•典型调查具备灵活机动、通过少数典型即可获得进一步详实记录资料长处,但是(2)要能精确地清晰地反映总体单位分布特性。

易受人们主观结识上影响,必要同其她调查结合起来使用,才干避免浮现片面性。・在拟定组距时,在研究现象变动比较均匀状况下,可以采用等距分组;而当研究

现象变动很不均匀时,普通采用不等距分组。

第二章数据描述•在记录各组频数时,正好等于某一组组限时,则采用上限不在内原则,即将该频

数计算在与下限相似组内。

1、定性数据图形表达有:

5、定量数据图形表达有:

(1)饼图(2)条形图(3)环形图

(1)直方图(2)折线图(3)散点图

・饼图是运用圆形及圆内扇形面积来表达数值大小图形。

•直方图横坐标代表变量分组,纵坐标代表各变量值浮现频数。

•条形图是用宽度相似条形高度或长度来表述数据多少图形。

6、登记表五个构成某些:

•如果想比较不同变量之间构造差别,可以通过环形图来实现。

(1)表头(2)行标题(3)列标题(4)数字资料(5)表外附加

・定性数据图示表达办法,也都合用于定量数据。但定量数据尚有某些特定图示办

7、数据分布特性:

法,它们并不合用于定性数据。

(1)集中趋势,即一组组数据数值向其中心值靠拢限度

2、频数:是指频数分布表中落在某一特定类别数据个数。

(2)离散限度,即一组数据各个数值远离其中心趋势和限度

3、生成定量数据频数分布表环节:

8、定性数据集中趋势惯用计算办法:

(1)对数据进行分组(2)拟定组距

(1)比例(2)中位数(3)众数

(3)记录出各组频数及频数分布表

9、中位数:是数据按照大小排列之后位于中间那个数。如果样本量为偶数,则是

•组距是每个组变量值中最大值与最小值之差,也就是上限与下限之差。

中间两个数平均。

4、在拟定组距时应掌握原则:

10、众数:就是数据中浮现次数或浮现频率最多数值。

(1)要考虑各组划分与否能区别总体内部各个构成某些性质差别。

11、反映定量数据特性记录量有:

反映数据集中趋势水平度量:

(1)平均数(2)中位数(3)众数(4)分位数第三章参数预计

反映数据离散限度差别度量:

(1)极差(2)四分位差(3)原则差(4)方差

1、总体分布:是总体中所有观测值所形成分布。

・平均数易为多数人理解和接受,实际中用也较多,但重要缺陷是更容易受少数极

2、总体参数:是对总体特性某个概括性度量。

端数值影响。中位数和众数提供信息不像平均数那样多,但具备记录上稳健性,当

3、总体参数指标有:

数据为偏态分布,特别是偏斜限度较大时,中位数和众数代表性要比平均数好。

(1)总体平均数(〃)(2)总体方差(b?)(3)总体比例(万)等。

12、极差:又称全距,是一组数据中最大值和最小值之差。

・记录量是样本函数。构成记录量函数中不能包括未知因素。

・极差非常容易受数据中极端值影响。

4、样本记录量指标有:

・方差用a?表达,总体原则差用b表达,样本原则差用$表达,离散系数用。表

(1)样本均值(X)(2)样本方差($2)(3)样本比例(p)

达,原则分数用Z表达。

•记录量概率分布构成了推断总体参数理论基本。

・原则差是方差平方根,它与方差相比更具量纲性。

5、关于样本均值抽样分布:

•在一种记录样本中,其原则差越大,阐明它各个观测值分布越分散,它趋中限度

(1)设总体共有N个元素,从中随机抽取一种容量为〃样本,在重置抽样时,共

就越差。反之,其原则差越小,阐明它各个观测值分布越集中,它趋中限度就越好。

N'

・原则差大小会受到数据自身数值大小影响。两个数列原则差相似,但是两数列差有N"种抽法;在不重复抽样时,共有--—个样本。

别限度却不同。为了更精确地反映差别限度,要计算离散系数。

(2)样本均值抽样分布就是指所有也许抽出来样本]分布。

13、离散系数:是将一组数据原则差除以其均值,用来测度数据离散限度相对数。

(3)样本均值均值就是总体均值,即£(x)=〃。

14、原则分数:是变量值与其平均数离差除以原则差后值,用以测定某一种数据在

该组数据中相对位置。

7、关于记录量原则误差:

(4)重置抽样时,样本均值原则差为总体原则差。二,即b-==;

nAn

(1)记录量原则误差用于衡量样本记录量离散限度。在参数预计中,用于衡量样

不重置抽样时,样本均值方差为二上本记录量与总体参数之间差距。

*nN

(2)样本均值原则误计算公式为:b=%

(5)当总体服从正态分布时,样本均值一定服从正态分布,即有:

2

X〜N3b2)时,X-«(3)当总体原则差o■未知时,可用样本原则差s代替计算,这时计算原则误差称

n

为预计原则误差。

(6)若总体为未知非正态分布时,只要样本容量差足够大(普通规定〃230),

(4)样本比例原则误计算公式为:er"*兀)

样本均值嚏仍会接近正态分布,其分布盼望值为总体均值,样本方差为总体方差

O

n(5)当总体比例方差万(1-乃)未知时,可用样本比例方差〃(l-p)代替。

(7)如果总体不是正态分布,当〃为小样本时(普通〃〈30),样本均值分布则不8、参数预计:就是用样本记录量去预计未知总体参数。

服从正态分布。

9、用样本记录量预计总体参数两种办法:

6、关于样本比例抽样分布:(1)点预计(2)区间预计

()当样本容量比较大时,样本比率近似服从正态分布,且有数学盼望就是

1pp10、惯用点预计有:

总体比率,即E(p)=〃。

(1)用样本均值x预计总体均值〃(2)用样本比例p预计总体比例%

(2)在重置抽样时,p方差为兀U二兀)。

n(3)用样本方差/预计总体方差cH

(3)在不重置抽样时,P方差为bj二兀Q二兀)

11、区间预计:是涉及样本记录量在内一种区间,该区间普通是由样本记录量加减

nN-1

(4)在重置抽样时,p分布为p〜N(办型二包)预计原则误差得到。

n

(5)在不重置抽样时,p分布为p〜Ng'二兀)N」)12、关于区间预计:

nN-1

(1)原则正态分布N(0,1)均值为0,原则差为1。14、关于总体均值区间预计:

(2)原则化公式为:Z=(观测值-均值)+原则差(1)在对总体均值进行区间预计时,需要考虑总体与否为正态分布、总体方差与

(3)以68.27%置信水平推断总体参数〃置信区间为(z-l):否已知、用于预计样本是大样本(/230)还是小样本(〃<30)等状况。

(2)大样本状况下,总体服从正态分布,总体方差已知,总体均值在置信水平1—a

丘-多金+丹

Tny/n

下置信区间为IX-Za-^=,x+za

I2V/l2

(4)以95.45%置信水平推断总体参数〃置信区间为(z-2):

(3)大样本状况下,总体服从正态分布,总体方差未知,总体均值在置信水平1-a

(x-2-7=^,x+2-7=)

yjnVn

下置信区间为IX-Z&-y=,x+za

QG

(5)以99.73%置信水平推断总体参数〃置信区间为(z-3):I5

(4)小样本状况下,总体服从正态分布,总体方差已知,总体均值在置信水平1—a

丘-3爷,+3爷)

Tnyjn下置信区间为[x—z:亍,x+z

13、评价预计量原则有:

(5)小样本状况下,总体服从正态分布,总体方差未知,总体均值在置信水平1-a

(1)无偏性(2)有效性(3)一致性

下置信区间为x-t-^,x+t

・无偏性是指预计量抽样分布盼望值等于被预计总体参数。]、p、52分别是总a

I2

2

体均值〃、总体比例%、总体方差CT无偏预计量。•关于总体比例区间预计,在大样本条件下,若印25,〃(l—p)N5,则二项分

・有效性是指预计量方差尽量小。对同一种总体参数两个无偏预计量,有更小方差布可用正态分布近似,在1一。置信水平下置信区间为

预计量更有效。

•一致性是指一种大样本给出预计量要比一种小样本给出预计量更接近总体参数。

样本均值是总体均值一种一致预计量。•样本量与置信水平成正比关系,与总体方差成正比,与容许预计误差平方成反比。

•如果总体比例%值不懂得可以用样本比例p代替,或者取%=0.5,使得乃(1—万)说零假设对的错误称为第二类错误或取伪错误(P)。

达到最大。4、对假设检查总结:

(1)假设检查根据是小概率原理

第四章假设检查(2)小概率原则在抽样前依需要拟定

(3)假设检查成果只能是回绝或不回绝本来假设,而不能证明原假设成立

1、假设检查:是先对总体参数或分布形式提出某种假设,然后运用样本信息和有

(4)记录假设检查成果不是绝对对的

关记录量分布特性去检查这个假定,做出与否回绝本来假设结论。

5、关于总体均值假设检查:

2、小概率事件:是指在一次事件中几乎不也许发生事件,普通称为“明显性水平”,

(1)在对总体均值进行假设检查时,采用什么检查记录量,取决于所抽检样本是

用a表达。

大样本(〃230)还是小样本(n<30),还需要考虑总体与否为正态分布、总体

•明显性水平普通取值为a=0.05或a=5%o

方差与否己知等状况。

3、假设检查过程:

(2)大样本状况下,当总体方差已知时,总体均值检查记录量为:z=

(1)提出原假设和备择假设a/\n

(2)拟定检查记录量

(3)大样本状况下,当总体方差未知时,总体均值检查记录量为:z=

s/Nn

(3)拟定明显性水平a

(4)小样本状况下,当总体均值服从正态分布,总体方差已知时,总体均值检查

(4)依照数据计算检查记录量值和与这个记录量值相应概率值P值,并进行决策

・原假设也称为零假设,记为"o;备则假设也称为备选假设,记为记录量为:z=

•在对总体均值进行检查时,大样本应用正态分布检查,计算Z记录量,小样本普

(5)小样本状况下,当总体均值服从正态分布,总体方差未知时,总体均值检查

通用/分布检查,计算/记录量。

X-/n

记录量为:

•回绝对的零假设错误称为第一类错误或弃真错误(a);当备选假设对的时反而s/y[n

6、总体比例检查三种基本形式:间有关限度。

(1)双侧检查:H7.兀=兀0,:兀工乃05、关于有关系数r:

(1)r取值范畴为TWrWl。r值越接近1(或T)就越正(或负)有关,越接

(2)左侧检查:“。:万之与,H]:7C<

近0就越不有关。

(3)右侧检查:"o:"<与,H]:7l>7TQ

(2)r具备对称性。x与y之间有关系数%,和y与%之间有关系数《相等。

・总体比例假设检查,在大样本时,样本比例会近似服从正态分布,因此检查记录

(3)r=0只表达两个变量之间不存在线性有关,并不表白变量之间没有任何关系。

量仍用Z记录量,其基本形式为:z=[P—兀。,

名)(1—阳))・回归方程拟合限度分析最惯用指标是鉴定系数A?。A)取值范畴在[0,1],R2=l

时,拟合是完全,即所有观测值都在直线上。A?越接近于01回归直线拟合限度

越差。

第五章有关分析与回归分析・预计原则误差s«也是阐明回归直线拟合限度指标,s,越小,依照回归方程进行

预测就越精确。

1、有关关系:是存在着密切联系但又不是严格、拟定关系。

2、有关关系依照有关形态分为:第六章时间序列分析

(1)线性有关(2)非线性有关

3、有关关系依照有关方向分为:1、时间序列:是指反映社会、经济、自然现象数据准时间先后顺序记录形成数列。

(1)正有关(2)负有关2、时间序列两个构成要素:

・正有关是两个变量变动方向总体上相似,负有关是两个变量变动方向总体上相(1)现象所属时间(2)相应不同步间记录指标数值

反。3、反映时间序列增长量指标有:

4、有关系数:是测定变量之间关系密切限度量,它可以以数字精确地描述变量之

(1)发展水平(2)增长量(3)平均增长量(1)环比发展速度(2)定基发展速度

4、增长量:是指时间序列中两个不同步期发展水平之差,反映社会经济现象报告13、环比发展速度与定基发展速度关系:

期比基期增长或减少数量。(1)环比发展速度连乘积等于相应定基发展速度

5、增长量计算公式:(2)相邻时期两个定基发展速度相除商等于相应环比发展速度

增长量=报告期水平-基期水平14、增长速度:是表白现象增长限度动态相对指标。

6、增长量依照采用基期不同分为:15、增长速度计算公式:

(1)逐期增长量(2)合计增长量增长速度=增长量+基期发展水平

7、逐期增长量:是报告期水平与前一期水平之差,阐明报告期比前一时期增长绝=发展速度T

对数量。16、平均发展速度:是一定期期内各个环比发展速度平均数。

8、合计增长量:是报告期水平与某一固定期期水平之差,阐明本期比某一固定期17、平均发展速度与平均增长速度关系:

期增长绝对数量,也阐明在某一较长时期内总增长量。平均增长速

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论