中级统计师《统计基础理论》教材笔记_第1页
中级统计师《统计基础理论》教材笔记_第2页
中级统计师《统计基础理论》教材笔记_第3页
中级统计师《统计基础理论》教材笔记_第4页
中级统计师《统计基础理论》教材笔记_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、论文中级统计师统计基础理论教材笔记第一章统计和数据一.统计的含义统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据分为描述统计和推断统计两大类。描述统计是研究数据搜集、处理和描述的统计学方法。其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计与假设检验两大类。二、数据类型:1. 定性变量的观察结果称为定性数据,这类数据的最大特点是它只能反映现象的属性特点,不能说明具体量的大小和差异。如天气形势:天气晴和阴转多云

2、,职业:生产工人、公务员,教育程度:小学、大学等。这种只能反映现象分类特征的变量又称为分类变量,分类变量的观察结果就是分类数据。如果类别具有一定的顺序,如教育程度,中学的教育程度就是比小学高,大学又比中学高,这样的变量称为顺序变量,相应的观察结果就是顺序数据。用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异,这些变量就是定量变量,也称为数值变量,定量变量的观察结果成为定量数据。如天气温度、上证股指、月收入。分类变量没有数值特征,所以不能对其数据进行数学运算。分类变量只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。顺序变量不仅能用来区分客观现

3、象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。顺序变量之间虽然可以比较大小,却无法计算相互之间的大小、高低和优劣的距离。很多适用于数值型数据的统计方法并不适用于定性数据,但适用于定性数据的方法则大多可以应用于数值型数据。2. 观测和实验数据观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。是取得数据最主要的方法,用各种调查方法得到的数据都属于观测数据。观测数据可能是全面数据也可能是样本数据。实验数据一般是在科学实验环境下取得的数据。自然科学研究中所用的数据多为实验数据。三、数据来源与搜集方法1. 从使用者的角度来看,统计数据资料的来源主

4、要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。统计调查或进行实验就是统计数据的直接来源。数据的间接来源有以下一些:一是公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构;二是尚未公开发表的统计数据。在应用间接数据时应注意以下问题:一是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据;二引用间接数据时要注明数据来源,

5、尊重他人的劳动成果和知识产权。2. 搜集数据的方法:常用的统计调查种类有普查:特点是一种全面调查,具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一普查不宜经常举行。抽样调查:例如,想了解某学校学生的零花钱支出情况,可以从中抽了一个样本获得样本数据。这里“全校所有学生”就是总体;从全校学生中抽取300人进行调查,这就是一个样本,构成样本的元素的数目称为样本量。抽样调查的特点:一是样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;二是能够根据部分调查的实际资料对调查对象的总体的数据特征进行推断,从而达到对调查总体的认识;三是在抽

6、样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。是一种非全面的、一次性的或经常性的专门调查,使用非常广泛。抽样方法主要有两种:概率抽样和非概率抽样。从理论上讲,概率抽样是最科学的抽样方法。常用的概率抽样形式为简单随机抽样;分层抽样;整群抽样;系统抽样又称为等距抽样。非概率抽样由于方法简单、经济,所以也是人们常用的方法。统计报表:按报送范围分为全面报表和非全面报表;按报送周期来分分为月报、季报、年报;统计报表的内容包括以下几个方面:一是表式;二是填表说明:具体有填报范围、指标解释

7、、分类目录、其他有关事项的规定。重点调查:当调查的任务只要求掌握事物的基本善与基本的发展趋势,不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。重点调查可以节省人力、财力,而且及时。典型调查:有意识地选择若干具有典型意义的或有性的单位进行调查。主要作用是一是补充全面调查的不足;二是在一定的条件下可以验收全面调查数据的真实性;具有灵活机动、通过少数英武即可取得深入、详实的统计资料的优点。但是在这种调查由于受“有意识地选也若干有代表性”的限制,在很大程度上受人们主观认识的影响,因此,必须同其他调查结合起来使用,才能避免出现片面性。各类统计调查方法的特点:调查范围

8、调查时间收集资料方法普查全面一次采访、报告或空间遥感抽样调查非全面经常或一次直接观察或采访统计报表全面或非全面经常报告重点调查非全面经常或一次报告典型调查非全面一次采访第二章数据描述一、用图表展示定性数据定性数据包括分类数据和顺序数据,可能用频数分布表和图形来描述。常用饼图和条形图、环形图表示。饼图:又称圆饼图、图形图,是利用圆形及圆内扇形面积来表示数值大小的图形。条形图:用宽度相同的条形的高度或长度来表述数据多少的图形。环形图:环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形。二、用图表展示定量数据定性数据图示的表示方法,也都适用于定量数据。定量数据有一些特定的图示

9、方法,并不适用于定性数据。一般的分级个数在5-15之间。最大值为上限,最小值为下限。组距=上限-下限采取上限不在内的原则,计算在与下限相同的组内。常用来表述定量数据的统计图形有直方图、折线图、散点图,还有茎叶图、箱线图。直方图:横坐标代表变量分组,纵坐标代表各变量值出现的频数。用统计表来表示数据统计表由五个部分组成:表头、行标题、列标题、数字资料和表外附加构成。表头放在表的上方,说明的是表的主要内容;行标题和更标题一般放在表的第一行和第一列,表示的是所研究问题类别的名称和指标名称;表的其余部分是具体的数字资料;表外附加放在统计表的下方,用来说明资料来源、指标注释和必要的说明内容。通常情况下,统

10、计表的左右两边不能封口。四.用敷学京收fi故嵬1、汨定ft的第中程睁用的为吹JUL甘声白分比、中位数和众做.中信数(Medwn),它号拧临大小拉乱守后位=Q闾的那4卷(如果林4早F奇济.也者中闰为个救日的平均(如黑群木暴为偶敖,&(MODE)是於幅中出现汰数1n幽姬率至冬胜数值.用图留2.WE.反映收僵的实电越势水平博量,平出位、中使救、众致和分收效年.反皿越曲馥腿的差HtiLSL极差、四分位差、标准差和力差.-ZX着单EJ本平均,三:登加数51中平均Xi平均数XI单位交量信大总怵华位效/|领总瘴敷塞的附敞泰ftC”八耳木霸援的雌系数.Vx=5/;Ml分盘,标点化但皮2分貌它是安堂借与旦平均R

11、利班图除以山再差后的I用以双近美一个*8石幺铝纥推中的相后在苴,iH公式3Z(X-)A住域切里出田乐冠呈可以把何如虹据中加两个不同均值、不同归隹紊的打爆运行灯此1将靠在书姐中的位同平以鸵对工工鲍岷惠为鼻甲数据.依蒙噂空H.中恒就酣去磔:不受第向俺眄守脸具有黄计上的翦网性当墓雷为隔若分布,鼻刷录旧科理更广七曲,育14丐虚话怪干花才打次镀,日的E二的丁舌士驻比平均扑彳俄差:又脓那,豪墨荷单的惠散指快是T中吃大苞*4差.用三根墓钿S煞慎最印骸*H函匙嗝不忸港矗虬备t能蜒时分既建鹿.为叁三息中程T变量值昶其均值酒羞甲方的则喘型凝悻本中当4曲值到耳周白的平法片典程凰.*差二不F1J根号.后传差:I.J精

12、鸟.t.,.下(11咕-去i若在计区我土;?=一。酒的上尊2式t:一标浦差:,是专聿+tEU体标建讣卿必式,三丹末谷亚的it用品式,再晅堂汁肾二.4二料处市壬HU处式.未分帽防TB聋心-仃w?情的杨理斗.工多打田必准号.在一下宽计鞋军甲.MfrfffSEA.iflflfl它的铮t双富俱+H5越分题.它的越用程度我f.反之,具际市里相小,枷它的皆T棚帆分布翼/用巾,它版J史艘就阻好.方睁却也性然算静就.打有甚聿敬.它MTfel的标维都俎展均蔺,用蝴3窕讴前程度1国堂二其才苒力式上见上页第二章统计推断主要包括参校估计和邮设校验样分布给处分布是於体中用有3右斤虺成的分帚.通华甘息忤平岗裳人总体力筌L

13、-W钵比例-亚百沟样I自仲咕法,玉】可以图应久不同田有五.工重首闻柱I不以二IJ.;闻(.讨)1住本均(5的陶史乾昱总你归田.在羽亶拘样时.任本性佰力后言W十总付际福笠的u的7fF2Hf3W.杆二为白田标滔差为:其中.二为修正至短.对于稚或手迸行不争黄后样时.可以护袈年黄三村计同3r-l当总体为巧WW加,较大而之仃町.塔正手第可以简化为,当比较大而rN =2Z 二 N当*-)31时,Z=3.20.73上IJF对出的北率称先E俏度辽后十二,彬【;-)4z;王.示,的他团柝为三俏区间寓凭.2.法的白佑水平推断舄体竽款”的目但区市为4O以党金市I于倍本平恂折总作参17.的黄伫区位为Z=2/i豆99.

14、73邢1方低水平巾断总结冷冷的互信区位为7=3):(二3与,三七二)评叶里的标准马二4、无后性,口效尼(力生尽可跑小),秋邑.在对总体为后出行凶口砧计时,莪芟若吠体是否为正港颁、思休方.看是否已目干侑计的杵本是大忤本gM还是T书本(n讥信水.二不看说信区同为&与,S“kVw当息峰力差C二未泡刖.上过中的炉可用悍本方差W优甘.这田恩体均值。在1Y目低一一1口中二自二上d的车的Wir对Q住均值的信恭是珏在的纬兴从正备分市衿.定前探二匆累正意总悻方毛。:已知本拄值照过标;隹优后仍他从桁有正态号右.此时仍可用,(二-公.j.“工疗)31立总体均值至昌信区间.当E匕声的方窿(7.未知时,E本均幅逐勺褛化

15、后EE从自臼层为Irrl;P分布,是体均遇的自信区D为I,岸h:W,:=P-T,、2=-7=N(C.1)/卬二心n司总悻为W汇芭倩区间内造方法同理.可冉度:9芭信永手下的吉信凶司沏,,吃,如X吃,&段总体比率,丁未知常用样本比率-tt.Sr即CFR叵号-F三)祥小拿的电卜设允爵的由RA星fEI夏范围h可以推母出H篇的样莓*耳必箕忸下从公式目以故样本量与值;水平成正比钱赛.荏其他斛怀至的脂而下.贯造水平跑品I所用的样本金也It隹女.水量身慰体方”我正比.皂作的经异越大.所曼柒的粹熟量吧就越大.样本置与发讦的吊计误W的平方或反上匕甲册的估计网喃平方怪拈所而扪得本章铲越小.茴=2娈米个亘信程主闿百三

16、俣茎嫌小的恬甘.就翻我木搦样本堂.估廿总HH时时的基朔般二立室敷缙况下.F的取信T0M、干CZ工中目此叩困匕不注谓可L:的畤显出阐军工3百看用725-F事”】,达SI关大.假设检验假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和样本统计量的分布特征去检验这个假定,做出是否拒绝原来假设的结论.小概率事件:在一次事件中几乎不可能发生的事件。一般称之为“显著性水平”,用a表示。显著性水平一般取值为:a=0。05或a=5%假设检验的过程:首先要提出一个原假设和备择假设。原假设也称为零假设,记为H0。备择假设又称为备选假设,记为H10第二,确定检验统计量。在对总体的均值进行检验时,大样本

17、应用正态分布检验,计算Z统计量,小样本一般用t分布检验,计算t统计量。第三,确定显著性水平a。根据样本所得的数据来拒绝零假设的概率应小于0.05,当然也可能是0.01,0.005,0.001等等。拒绝正确零假设的错误常被称为第一类错误或弃真错误a。当备选假设正确时反而说零假设正确的错误,称为第二类错误或取伪错误B。假设检验决策结论及其后果实际情况决策结果H0为真H0为伪不拒绝H0正确决策取伪错误B拒绝H0弃真错误a正确决策对于两类错误的分析,要注意只有拒绝原假设时,才有可能犯第一类错误,只有不拒绝原假设时,才有可能犯第二类错误。在一般的假设的问题中,犯第一类错误的概率最大不超过a,但由于备选假

18、设往往不是一个点,所以无法算出犯第二类错误的概率B。一般情况下,人们认为犯第一类错误的后果更严重一些,因此通常会取一个较小的a的值。通常选择显著性水平为0.05或比0.05更小的概率。第四,根据数据计算检验统计量值和与这个统计量值对应的概率值P值,并进行决策。拒绝域的大小与显著性水平有关。当样本量固定时,拒绝域随a的减小而减小。如果P值小于或等于a,就拒绝原假设,这时错误的概率最多为a;P值大于a,就不能拒绝原假设,因为证据不足。检验决策准则:双侧检验:|统计量的值|临界值,或P?a时,拒绝原假设。左侧检验:统计量的值临界值,或P?a时,拒绝原假设。右侧检验:统计量的佰,临界值,或P?a时,拒

19、绝原假设。对假设检验进行总结:一是假设检验依据的是小概率原理;二是小概率标准在抽样前依需要确定;三是假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立;四是统计假设检验的结果不是正确。大样本的检验在大样本的情况下,样本均值的抽样分布服从正态分布,因此采用正态分布的检验统计量,当总体方差已知时,总体均化零为整检验的统计量为:-三十节尸坤方#上乱事可作斗小产庠米代的羽工一宁tX-Jie而I4乖罩的喳聋在寸解本500慵4E帼幅苜黄浦施曼钝或TE嘿版分布1和r,下地送择与棺体方*i已珀有关.如序三邙七彳=广生二.尊*持骑唱南京归后.叩&呜市正分叶面,疗时巧丁用才刃阵也a行加紧;上_+讲炉已

20、如果M择方差L*知,”.工均值建!极术化七谐国以匕EH型力iT:,泞*分花.EJL.器笛天田1口布寺中父.马仁的耕一弦*-:二t归仲比翁的必融敦哎四也扭1-rt=n-H-1人士工.左阳报掂:itr炉T台。1指腕T忖TWl?Ihh在大婵本时,怦本比例他期曝从正承办有,牌I检验统计里防庠二比廿置.中F-3展a-兀1斤相关分析与回归分析相关分析相关分析的主要内容包括:一是确定现象之间有无关系,这是相关分析的起点,只有存在相互储存关系,才有必要进行进一步的分析。二是确定相关关系的表现形式,只有判明了现象之间相关关系的具体表现形式,才能运用相应的回归分析方法进一步分析现象之间的数量依存关系,如果把曲线相

21、关误认为是直线相关,按直线相关来分析,便会出现认识上的偏差,导致错误的结论。三是测定相关关系的密切程度。散点图又称相关图。相关的形态:若变量Y与变量X的相关关系表现为线性组合,或绘制的散点图近似地表现为一条直线或直线带,则称之为线性相关,若Y与X是非线性组合,或绘制的散点图近似地表现为一条曲线,则称之为非线性相关或曲线相关。相关的方向:当两个变量的变动方向总体上相同,即一个变量增加,另一个变量也相应地增加,或一个变量减少,另一个变量也相应地减少时,两个变量之间的关系属于正相关;若两个变量变动的方向总体上相反,即一个变量增加的同时,另一个变量随之减少时,两个变量之间的关系属于负相关。相关系数是测

22、定变量之间关系密切程度的量,它能够以数字准确地描述变量之间的相关程度。相关系数的计算公式是:相关系数具有如下性质1 .r的取值范围在-11,即-1?r?1.r0表明x与y之间存在正线性相关关系;r0表明x与y之间存在负线性相关关系;r值越接近1(或-1)就越正(或负)相关,越接近0,就越不相关。r=1或r=-1表明x与y是安全相关关系(实际上就是函数关系)。2 .r具有对称性。3 .r数值大小与X和y的数据原点及计量尺度无关。4 .r仅仅是X与y之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系,比如他们之间可能存在

23、非线性相关关系。5 .r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。可将相关程度分为以下几种情况:当|r|?0.8时,可视为高度相关;当0.5?|r|0.8时,可视为中度相关;当0.3?|r|0.5时,可视为低度相关;当川bj卜达到整卜-兀线性回以力加其关妫估计值泊其侬计声公式为,&ydljb:=-缶十一(Wv厂.业if一般共行仍停的与统计法我三莫有:二是回归议程的杭i:松幼,包括两部分,睡)归方程的显著怪松莱;检的,河匕原品救韵馀施7桂壁罗瓦百天漫出谟艮七:P;=c(两小要理之假性关系不且若1H:花工3(两卜殳曼之间笈住关系昱署)然后计后忖湿针十篁S彳赢力J戍的

24、席率(PJ54tr(F=3L-F-SS0;-2)J/SE为回归平X和,s笠为建W平方和,u3力叵归均方(是何阳平方耶吼对应的巨由星*荏一谭I见卬目曲度是U.皿海*差州苗是域差平方押醐相幽自幽醒,在一元回归印目出境是)/程后根静播嘏率在行判断,如果雌喟率小于甜们生M三用主的显著性水平0时,拒蛆原匐取认先良是与舟零鹤睥日球B蛾性鬓素是存在HL荀鼠不费捂纳康追.即回IrFF/E用注三我*;二成4斗1,hq,:.,|W.:一一::,h/,、万福后回叼予我祖-际消斐三是国暝槌的评价郡杳程度分析.词妇为程敬摆合包度撒街母*用眄指3被系段群判定系数是用灌同回归为程次场题数信船*稗虐的一NT/他.-?-1-;

25、.-J-4-.r,一I、辛专平亍粕二丁,】-.;1段江平,和七二3ST-SM.SSE.为回归值W为书无3本礴,平方策.回归平方瓦T3SRIII,*n*I1-1-L=一一:=H.-510751riii-y*利罡界黄R0取图理拓1611胪=【眈孤管豹Mt胸.即班布即测舟E正直婕上若匕与.居x国自无助于睇丫府登差,此前一m露,f*可闻,外祝揩近千】去明园妇邛内常1自熟受崇平寿和跳tK大同回直她W君现那点超持国OHM娓的擢合祝庠计魅,子.由七,二-6】*亍T二回E直能肿粗工即式技茅.寺厂行甫息言是里L拈围口方程.用耒表示I苴公之魅“冲-J生3k说胡里胤星叮方利蓊行温不已小/哪,若例融蚱Vn-2in-2

26、生静君寺已些上,W1=(Z)基左维a回犯分出一十因堂第岁个自娟华回归戟是第元回史.次回蜘囱灯融(#救曲#L32-L,伊强f.而胃最小二乘踵第解.也就是帔残奥甲方和最小.雅)Qolu-:.?_.,三I-?-5-.一3%二min-,鼻4小时间序列分析时间序列是对一定时间问隔所发生的行为进行动态的跟踪分析,进而研究某些时间随时间变化是否有数量上的变化、有无统计上的显著性意义。时间序列有两个要素构成:一是现象所属的时间;二是对应不同时间的统计指标数值。(一)时间序列的分析指标时间数列的增长量分析主要有增长量和平均增长量。反映时间序列增长率的指标主要有:发展速度、增长速度、平均发展速度和平均增长速度禁售

27、期水早首期海平100%,分麻t 士麻请.营刊j*甘展花营I市受不总产更d=Lt;=.个:揖芒巴七七星斗卡生1%坏此堂解逑您上=1I.=E,2,,:二握舌期货,蓟一网水平环比发解意度的隹乘用等于司应的定登前履也度生M乜一出一.上这t两楣柳5.y_冉ft凰三甲麦Ju亚虺zI除屈曲一辿泳立空忌虫虐.电长地度-豆瞿需三增卜提度二步欣度:七北百注金卜.速浮“定电核地度jj,nl*.4-:-I=L.、丘基才/*度:荆斌帅缠虎星二七二6=匚-环匕发展演嚏I._二平的壶口逗11与;斗用噌一位熄间的兴戛F此*通惬匕平均雪履百席平鳖更展连同一般用水平陆计过,又肺J1同率雌,、色中41口超总示平均泥底遮赏,n至赤连

28、桑桁号.由于杯巴交横逵度的海黍利粮于虎基置展建度,目此它地受M范型公式巴可:R广月专志京思岁屎也度*王雷茴里竹痂刑图阻蒯我的县则小屏为事小主|朝,硼趋如搴节矍期、靖环匹thf则芟取M推像式:帕四种我圆I法伸互独立创时期gfi身觌术平屐骨中盖喟咽I相国的总知,层,=丁二*士一;期卞。专是隈耘玛钟变动因素存在着禺种嘴舟号哨关累.里不此.因匕啪曜冽各用鳏水平是客勺詈嘀因素相熊交和,IPTR长里屯为言孤药罡E花的R3lt%-11t三j季节变动分析季节上浮二同季平均数总平均数0-1二% 1 = DO 1310000&X) x 3000 *600 * 1500 *1000一 Fogooa=1第通找一狎、其或三是屎3期上期俎比.二朴电鼎邑钟唇世呼七胆高 MS?!日如果以&飒51湛商实在储售速三/题肿酎.提告期就工用生物入Tlioooo元(7siooor6Toocm).派氏指数:德国经济学家

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论