第五章时间数列_第1页
第五章时间数列_第2页
第五章时间数列_第3页
第五章时间数列_第4页
第五章时间数列_第5页
已阅读5页,还剩287页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 时间数列时间数列第一节第一节 时间数列概述时间数列概述n时间数列将反映某一现象数量变化的同类指标,按时间的先后顺序排列,又称为动态数列,可简称数列,记为n简记为 构成 现象所属时间 :t i 要素 现象与该时间对应的指标值 :a i012,na a aa a时间数列的作用n揭示现象发展的动态规律n可以认识现象发展的状态、速度、结果和趋势,从而反映事物的动态变化规律n对未来发展状况预测,为管理和决策提供依据时间数列的种类n绝对数时间数列排列的指标是绝对数(总量指标) n相对数时间数列排列的指标是相对数 n在平均数时间数列排列的指标是平均数 绝对数时间数列的分类n分为和两类 时间范围

2、能否加总数值大小的影响因素调查方式时期指标数列时间过程可以相加数值大小受现象发展过程时间长短的影响 连续性调查时点指标数列某一时刻不能相加数值大小不受各项间时间间隔长短的影响 一次性调查时间数列的编制原则n指标的经济内容应当一致n总体的范围应当一致n对时期数列而言,各项的时期长短必须一致 对时点数列而言,各项间的时间间隔可以不等n指标的计算方法、计量单位、计算价格等一致第二节第二节 时间数列的水平指标时间数列的水平指标n发展水平将时间数列中每一项的指标值称为相应时期的发展水平n时间数列中第一项称为最初水平,最后一项称为最末水平,其余各项称为中间水平二、平均发展水平二、平均发展水平n平均发展水平

3、是时间数列中各期发展水平的平均值,又称为序时平均数或动态平均数n表示现象随着时间的变化而变化的一般水平n是现象在不同时间,不同水平上的平均(一)绝对数数列的序时平均数n1. 时期数列的序时平均数常采用算术平均法计算n2. 时点数列的序时平均数 时点数列中任意两项的值不能相加,因此,一 般不能简单地采用算术平均法aan(1)连续时点数列n连续时点数列将每一个时点指标值都作排列所形成的数列n此类数列的序时平均数也采用算述平均法aanafaf(2)间断时点数列n 等间隔时点数列 该数列的序时平均数公式 (5-1)n 异间隔时点数列 该数列的序时平均数公式 (5-2)012122nnaaaaaan01

4、112011011222nnnnaaaaaafffafff首末斩半法简单序时平均 “加权序时平均法”(二)相对数数列的序时平均数n设 ,要计算n基本方法是:相对数列的每一项分子数列分母数列序时平均数序时平均数对比acbc aaacbbb(三)平均数时间序列的序时平均数n由所组成的平均数时间数列,实际上是两个绝对数时间数列相应项对比而形成的n分子数列是标志总量数列,分母数列是总体单位总量数列n计算方法:与相对数时间数列的序时平均数的计算方法完全相同,只是注意标志总量数列多属于时期数列,而总体单位总量数列多属于时点数列n由动态平均数动态平均数所组成的平均数时间数列的序时平均数的计算方法:n在时期相

5、等时,直接采用简单算术平均计算;n在时间不相等时,则以时期作为权数,采用加权算术平均法计算。第三节第三节 时间数列的速度指标时间数列的速度指标n反映现象发展变化速度的指标有:n增长量n发展速度n增长速度n平均发展速度n平均增长速度。增长量增长量数列中两项指标值之差n从反映现象发展变化的程度n增长量=报告期水平-基期水平n根据基期不同,增长量分为: 累计增长量=报告期水平-某一固定基期水平 逐期增长量=报告期水平-上一期水平发展速度n发展速度是报告期水平与基期水平之比n表示报告期水平是基期水平的若干倍,常用百分数表示,常简记为 vn根据采用的基期不同,发展速度可分为 报告期水平发展速度基期水平报

6、告期水平定期发展速度某一固定期水平报告期水平环比发展速度上一期水平对某一固定水平来说对前一期水平来说增长速度n增长速度是增长量与基期水平之比,说明报告期水平比基期水平增长了若干倍(或百分之几),常记为 v增长量增长速度基期水平报告期水平基期水平基期水平1发展速度增长速度的分类n根据基期不同,增长速度分为定期增长速度和环比增长速度两类定基增长量定期增长速度某一固定基期水平环比增长量环比增长速度=上一期水平n名义发展速度、名义增长率对价值量指标计算发展速度、增长速度时,未剔除价格因素影响计算出的值n实际发展速度、实际增长率 剔除价格因素影响后计算出的值n为了衡量相对变化的绝对效果,常使用每增长百分

7、之一的绝对值,常将其记作 %n该指标表示增长速度每变化一个百分点,现象在数量上变化的绝对数额。100增长量基期水平每增长百分之一的绝对值=增长速度平均发展速度n平均发展速度时间数列中各期环比发展速度的平均数,用以表明现象在一个较长时期内发展变化的平均程度。n两种计算方法: 几何平均法 高次方程法(一)几何平均法n几何平均法又称水平法,其推导过程如下:从而 0nnava12011nnnaaavaaa(二)高次方程法n即 n求解式中的高次方程即可得平均发展速度 1210ninniavvvvav平均增长速度=平均发展速度-1在运用上述速度指标时要注意如下问题:n第一,要根据现象的变化特点和研究目的确

8、定基期n第二,根据事物发展变化的特征,必要时用分段平均速度补充说明总平均速度n第三,应将发展水平、增长量、发展速度、增长速度、平均发展速度、平均增长速度等指标结合起来共同说明现象的数量变化特征。尤其应当注意相对变化的绝对效果第四节第四节 动态趋势分析动态趋势分析n时间是自变量,并记作t;现象的数量表现是因变量,在此用Y表示 影响时间数列变动的因素分解为:n长期趋势(T)n季节变动(S)n循环变动(C)n不规则变动(I)四种趋势n长期趋势现象由于受基本因素的影响,在较长时间内所表现出来的持续性的变化趋势n季节变动现象受自然界的季节变化或社会政治经济等因素的影响,在一年或较短的时间内所呈现的周期性

9、的波动n循环变动现象以若干年为周期的扩张和紧缩交替的波动n不规则变动现象受偶然因素的影响而发生的难以预测的变动两种假定模型长期趋势分析n长期趋势分析的目的 1.根据时间数列资料,找出现象在过去一段相当长的时期内持续向上增长或向下降低的发展趋势; 2.从数量上研究现象发展的规律性,据此建立数学模型,对现象的未来发展进行预测; 3.测定长期趋势,暂时消除原时间数列中长期趋势的影响,以便更好地研究季节变动等时距扩大法-方法之一 是将原来的时间数列中较小时距单位的若干项的值予以合并,得出扩大了的较大时距单位的数值。 目的:消除现象在较小的时距单位所受到的影响,从而找出现象变化的长期趋势n时距扩大法仅适

10、用于时期数列,而不能用于时点数列n扩大的时距取决于现象的特点和研究目的n对同一时间数列,每次扩大的时距应相等,以保证新数列各项间的可比性序时平均法-方法之二 先将时间数列的时距扩大 计算扩大时距后各项的序时平均数 据此序时平均数构成的新数列找出长期趋势n序时平均法适用于时期数列、时点数列移动平均法-方法之三n采用某一时距,从数列的第一项开始取数项计算序时平均数,并依次往下移动,由此得到一个新数列(又称修匀数列)。据此新数列可以找出现象发展的长期趋势n设 为时间数列中时间t的观察值, 是时间数列中时间为t的一次移动平均数,n为移动时距, ,则时间为t的一次移动平均数是:n为了计算简便,在移动时距

11、n比较长时,上式化为:tytM1,2,tn(1)(1)ttt ntyyyMn ()(1)tt nttyyMMn应用移动平均法时的注意事项n适当确定移动的时距n移动的时距不能太短或太长n实际中多作奇数项移动平均半数平均法-方法之四n原理:依据的是几何学中两点确定一条直线n步骤:1.它是先将数列分为相等的两部分(如数列为奇数项,可丢掉中间一项) 2.然后由各部分确定一个点,据此两点确定一条趋势直线 3.最后根据趋势直线说明现象的长期趋势n半数平均法适用于现象近似呈线性变化趋势的时间数列n据前半部分数列确定的点记为( , )n据后半部分数列确定的点记为( , )n其中 , 是前半部分和后半部分的均值

12、n , 是前半部分和后半部分指标的均值 然后将两点的值代入两点直一方程:(5-6)1t1y2t2y1t2t1y2y121121yyyyttttn作代数变形后,将趋势直线方程记为:yabt最小平方法配合趋势直线-方法之五n当现象的数量变化近拟呈线性趋势时,利用最小平方法(又称最小二乘法)配合的趋势直线是一条最优拟合的直线n设趋势直线是:n基本原理:要求实际值y(数列中各项的值)与理论值 (估计值)之间的离差平方和最小 即要求: yabty2()yy最小n令 22( , )()()iiiiQ a byyyabt2()( 1)0Qyabta2()()0Qyabttbn整理得如下标准方程组(正规方程组

13、):n 2ynabttyatbt(58)(59)22()ntytybnttaybt (5 10)(5 11)n因此,适当地给时间编码,使 ,方程(5-8)和(5-9)可得到简化,由此得到简捷计算法。n若项数n是奇数,则取中间位置为0,编码如下:n若项数n是偶数,则取中间位置为0,中间两项分别取-1,1,编码如下:0t 4, 3, 2, 1,0,1,2,3,4,7, 5, 3, 1,1,3,5,7,n如果作上述编码,则标准方程组(5-8)和(5-9)可化为: 2yantybt(5 12)(5 13)n在据时间数列资料配合趋势直(线)线方程时,要事先对模型形式加以判断。判断的方法有:n第一,散点图

14、法。将时间数列各项的值描在平面直角坐标系中,由此得到散点图n第二,据加以判断。若时间数列逐期增长量(又称为一次差)大体相等,可配合趋势直线:n若二次差(即一次差数列的逐期增长量)大体相等,可配合抛物线:n若时间数列环比发展速度大体相等,则配合指数曲线:n 或yabt2yabtcttyabbtcyae对该方程的拟合精度进行评价 计算估计标准误差 (5-16)n估计标准误差各拟合值(理论值)对实际值y的平均偏离程度:n估计标准误差的值愈小,表明趋势方程拟合精度愈高n估计标准误差的值愈大,表明趋势方程拟合精度愈低,此时应配合其他类型直(曲)线或不能用某种简单直(曲)线说明现象的变化趋势2()rtyy

15、Sn季节变动的分析n目的:认识现象受季节变动影响的规律性,据此为管理与决策提供依据n ()各年该月(季)平均数某月(季)季节比率=全部月 季 的总平均数第六章第六章 统计指数统计指数 第一节第一节 统计指数的概念与作用统计指数的概念与作用 统计指数的概念统计指数的概念n统计指数简称指数,是经济学中常用的一个概念n广义的指数是表示各种数量对比关系的相对数n狭义的指数是表示现象的动态变化的相对数n指数能综合反映现象的变动方向和变动程度n指数可用于作因素分析n指数可用于研究现象在较长时间内的变动趋势指数的分类 (一)根据指数包括的范围不同反映个别事物的动态变化则反映由多种事物构成的复杂现象总体的综合

16、变动情况(二)根据总指数的编制方法不同是指反映由多种事物构成的不能直接相加的复杂现象总体变动情况的指数则是综合指数的代数变形,利用平均数指数可以由个体指数求总指数(三)根据用于编制综合指数的指标的性质不同是反映数量指标变化状况的指数(如产量指数、销售量指数等等);是反映质量指标变化状况的指数(如价格指数、单位成本指数等等)(四)根据编制指数数列时所采用的基期不同是将基期固定在某一时期的指数(如我国现行综计资料公布各年对1978年的定期价格指数),说明现象在一段较长时期内总的变化状况则是反映现象每一期与上一期相比变动情况的指数,说明现象逐期的变化状况(五)根据指数所反应的时间状况不同反映现象在时

17、间上的变化情况,也就是我们前面讲的狭义的指数也就是同一时间条件下不同单位或不同地区同一经济量的不同数值的对比(即地区比较指数)2 统计指数的编制方法统计指数的编制方法n一、个体指数的计算方法一、个体指数的计算方法 个体指数的计算十分简单,它是该现象报告期水平与基期水平之比,即发展速度n个体指数k 报告期水平基期水平二、综合指数的编制方法二、综合指数的编制方法n(一)数量指标指数的编制 以编制销售量指数为例 计算三种商品的销售量总指数商品名称计量单位销售量q价格p(元)基期q0报告期q1基期p0报告期p1ABC个米件20060040025080050060201006225120n分析:分析:因

18、为这三种商品的性质不同,计量单位也不同,它们的销售量相加无实际意义。n由于销售量价格=销售额n我们称价格为同度量因素。同度量因素是指能将不可相加的现象转化为可以相加的因素。n在考虑销售量的变动时,常常将价格这个同度量因素固定在某一时期(如基期或报告期)。固定在不同时期就可得到不同的指数数值。在我国的统计实践中,常常将价格固定在基期。于是我们得到销售量总指数公式如下:1000qq pIq pn解:利用上述销售量总指数公式n n表明三种商品的销售量总的来讲增长了26.56%。n(元)n这个差值表明,按照基期价格计算,由于三种商品的销售量增长26.56%,而使销售额增加17000元。 n通则:在编制

19、数量指标指数时,常将同度量因素固定在基期,1000250 60800 20500 10081000126.56%200 60600 20400 10064000qq pIq p1000810006400017000qIq pq p(二)质量指标指数的编制n例例2试利用试利用表6-2 中三种商品的销售资料,计算三种商品的价格总指数。n分析:要计算三种商品的价格总指数,不能将它们报告期的价格之和与基期的价格之和相比求得,因这三种商品性质不同,计量单位也不同,它们的价格相加无实际意义。n销售量价格=销售额n三种商品的销售额可以相加,因此销售量在这里起着同度量因素的作用。n在考虑价格变动时,常常将销售

20、量这个同度量因素固定在某一时期(如基期或报告期)。固定在不同时期可得到不同的指数数值。在我国的统计实践中常常将销售量固定在报告期。于是我们可得到价格总指数公式如下: 通则2:在编制质量指标指数时,常将同度量因素固定在报告期。 1101ppqIpqn解:解:利用上述价格总指数公式n表明三种商品的价格总的来讲增长了17.9%。n这个差值表明,按照报告期销售量计算,由于三种商品的价格增长26.56%,而使销售额增加14500元。n通则:在编制质量指标指数时,常将同度量因素固定在报告期1101622502580012050095500117.9%602502080010050081000pp qIp

21、q1 101955008100014500pIp qp q编制综合指数的基本步骤n(1)根据经济关系式确定同度量因素n(2)固定同度量因素的时间n(3)据指数定义编写出综合指数公式 这种编制指数的方法常被称为加权综合法,由此求得的指数称为综合指数 (三)指数的其他几种编制方法1. 基期加权综合法基期加权综合法n同度量因素固定在基期水平拉氏指数公式 n拉氏物价指数公式n拉氏物量指数公式 000kpp qIp q000kqq pIq p2. 报告期加权综合法报告期加权综合法n同度量因素固定在报告期水平上帕氏公式 n帕氏物价指数公式:n帕氏物量指数公式: 0kkpkp qIp q0kkqkq pIq

22、 p3. 交叉加权综合法交叉加权综合法n由此得到的交叉加权指数公式称为马埃公式n物价指数公式:n物量指数公式: 011101 10100010()2()2pqqpp qp qIqqp qp qp01110110100010()2()2qppqq pq pIppq pq pqn4. 几何平均综合法(理想公式)几何平均综合法(理想公式)n对拉氏和帕氏两种指数公式求其几何平均值,则得到消除偏差的理想公式 n物价指数n物量指数 101 10001pp qp qIp qp q10110001qq pq pIq pq pn5. 固定加权综合法固定加权综合法n将同度量因素既不固定在基期又不固定在报告期,而是

23、固定在某一特定时期n固定加权指数公式又称为扬格公式n扬格物价指数公式n扬格物量指数公式10npnp qIp q10nqnq pIq p第三节第三节 平均数指数平均数指数n将综合指数公式稍作变形,就可以据个体指数求出总指数,于是我们可以得到平均指数总指数的另外两种表现形式加权算术平均数指数和加权调和平均数指数n一、加权算术平均数指数n例例表6-3是三种产品的基期产值与个体产量指数n试求解这三种产品的产量总指数产品名称计量单位基期产值(万元)个体产量指数 (%) ABC件米公斤20305012011010810/kqq00p qn解:由基本指数公式,有 (6-4)n将表6-3中的数据代入(6-4)

24、式有: n公式(6-4)右端类似加权算术平均数 简称算术平均数指数1000100000qq pkq pIqkqq pq p00001.2 20 1.1 30 1.08 50111111%203050100kq pq pXfXf二、调和平均数指数n例2 某企业三种产品的有关资料如表6-4所示 表6-4 三种产品的资料试求这三种产品的价格总指数产品名称计量单位基期产值p1q1 (万元)个体产量指数 k=p1/q0 (%)ABC台件米60401912010095n解:价格总指数 (6-5) (6-6)n于是有: 1 101pp qIp q1 11 1011 101/pp qp qIppkp qp q

25、k1 11 16040 19119108.2%6040191101.21.00.95pp qIp qkn公式(6-6)右端类似加权调和平均数n加权调和平均数形式的指数,简称调和平均数指数。它只是前面所讲物价综合指数公式的代数变形,没有独立存在的意义MHMX三、固定权数指数公式及其应用三、固定权数指数公式及其应用n在求其他指标的指数时,亦可用固定权数 对个体(或类)指数作平均。于是有:n加权算术指数 (6-7)n加权调和指数(6-8)kIIwk*四、指数数列四、指数数列n指数数列就是将各个时期的一系列指数按时间的先后顺序排列起来形成的一列数n指数数列按照采用的基期的不同可分为:定基指数数列:采用

26、同一固定时期为基期环比指数数列:各时期指数均以上一期为基期(一)定基指数数列n物价指数数列: (6-9)n物量指数数列: (6-10)1 122330102030,nnnp qp qp qp qp qp qp qp q1020300000000,nnnq pq pq pq pq pq pq pq p(二)环比指数数列n物价指数数列: (6-11)n物量指数数列: (6-12)1 122330112231,nnnnp qp qp qp qp qp qp qpq102132100112211,nnnnq pq pq pq pq pq pq pqp(一)应用价格指数测定通货膨胀率 通货膨胀率一般价格

27、水平的持续上涨,也就是指流通中的货币量超过商品和劳务在流通中所需要的货币量,从而引起货币贬值和价格水平上涨n1. 若价格指数是环比指数,则:n2. 若价格指数是定基指数,则:n若通货膨胀率的值大于0,表明存在通货膨胀n若通货膨胀率的值小于0,则表明出现了通货紧缩1通货膨胀率环比价格指数1报告期价格指数通货膨胀率上一期价格指数(二)应用价格指数消除价格变动的影响n价格紧缩指数法运用价格指数消除价格变动影响的方法n利用此法可以消除价值指标受价格变动的影响n货币购买力单位货币所能购买商品和服务的数量按现行价格计算的价值指标按固定价格计算的价值指标=价格紧缩指数1货币购买力指数居民生活费价格指数第四节

28、第四节 指数体系与因素分析指数体系与因素分析n指数体系将由一个等式联系起来的若干个指数组成的一个整体n销售价格销售量=销售额n单位成本产量=总成本1 1101 1010000p qq pp qp qq pp qpqpqIII1 1101 1010000z qq zz qz qq zz qzqzqIII指数体系的作用n首先,利用指数体系可以作因素分析n其次,利用指数体系可以作指数推算,即由指数体系的已知指数推算未知指数按影响因素的数量按所分析的经济变量的性质两因素分析总量指标因素分析三因素分析平均指标因素分析二、总量指标的因素分析二、总量指标的因素分析n(一)两因素分析 对销售额总量指标,有如下

29、指数体系: (6-15)1 1101 1010000p qq pp qp qq pp q在指数体系(6-15)中n价格指数 表明价格变动方向和程度及其对销售额的影响n分子与分母的差额 说明由于价格变化而使销售额变化的数额1101p qp q1 101p qp qn销售量指数 表明销售量变动方向和程度及其对销售额的影响n分子与分母的差额说明销售量变化而使销售额变化的数额1000q pq p1000q pq pn销售额指数表明商品销售额的变动方向和程度分子分母的差额说明销售额的变化情况1 100p qp q1 100p qp qn上面的指数体系是在相对数上相等,在影响的绝对数上也相等n公式(6-1

30、5)左边的影响差额之和等于公式右边的分子与分母之差:1 10110001 100()()p qp qq pq pp qp q(二)三因素分析n总量指标的多因素分析 当总量指标的变动受两个以上因素变动的影响时,利用指数体系可以从相对数和绝对数上分析各因素变动对总变动的影响多因素分析的注意事项第一,各影响因素应按指标之间的经济联系排列n数量指标在前,质量指标在后n所有相邻两因素的乘积必须有明确的经济意义第二,数量指标和质量指标的确定具有相对性原材料消耗总额的三因素分析原材料消耗总 额(qmp)=产品产量(q) 原材料单 耗(m)原材料单 价(p)111100110111000000100110q

31、m pq m pq m pq m pq m pq m pq m pq m p 原材料原材料原材料消耗产品产量总额指数指 数单耗指数单价指数111000100000110100111110()( )()q m pq m pq m pq m pq m pq m pq m pq m p三、平均指标的因素分析三、平均指标的因素分析()xffxxff受各组水平受各组水平x(当作质量指(当作质量指标)标) 影响影响各组结构各组结构(当作数量指(当作数量指标)标) ffn假定记为: 平均指标的变动也就是,又称为可变组成指数。记为:011nx fxf11111110000000()()x ffxffxIfx

32、fxxff可01101010()()ffxxxxff固定组成指数将各组结构固定在报告期(依据综合指数的编制原则),考虑各组水平变化对平均指标变化的影响得到的指数:n分子与分母的差额:表示由于各组结构变动而使平均指标变化的数额 1111101()()nfxfxIfxxf固0100010()()nffxxxxff结构影响指数将各组水平固定在基期(依据综合指数的编制原则),考虑各组结构变化对平均指标变化的影响得到的指数:n分子与分母的差额: 表示由于各组结构变动而使平均指标变化的数额1010000()()nfxfxIfxxf结0100010()()nffxxxxff平均指标指数/固定组成指数/结构影

33、响指数的数量关系 n相对数上:n绝对数上:即111110111010000100()()()()()()fffxxxffffffxxxfff011010()()ffxxff011110001110()() ()()ffffxxxxffff1010()()nnxxxxxxn由此可知: 可变组成指数 固定构成指数 指数体系 结构影响指数 称之为平均指标指数体系或可变组成指数体系 第七章第七章 概率论基础概率论基础第一节第一节 随机事件与概率随机事件与概率l随机现象发生与否,如何发生,事先完全 无法预知的一类现象l随机试验对随机现象进行的观察或实验l随机事件随机试验的每一个可能的结果, 简称事件随机

34、事件的分类随机事件的分类l按能否再作划分 l按发生的确定性与否分为是不能再作划分的事件是可以进一步划分的事件是一定条件下一定会发生的事件则是一定条件下不可能发生的事件,常记作l样本空间某一随机试验中,由所有基本事件组成的集合称为样本空间,记作l样本点每一个基本事件就称为一个样本点,记作二、事件间的关系与运算二、事件间的关系与运算l1. 事件的包含与相等 设有事件A与事件B,若A发生,必然导致事件B发 生,记作 l2. 事件的互斥(互不相容) 若事件A与事件B不能同时发生,则称A与B两事件互斥,或互不相容AB3. 事件的和(并)l由事件A所包含的所有基本事件与事件B所包含的所有基本事件共同组成的

35、随机事件,称为事件A与事件B的和(或并),记作A+B(或)4. 事件的积(交)l由事件A与事件B的全部公共基本事件所组成的随机事件,称为事件A与事件B的积(或交),记作AB(或)ABAB5. 事件的差l由包含在事件A中,但不包含在事件B中的所有基本事件所组的随机事件,称为事件A与事件B的差,记作A-B6. 逆事件(对立事件)l由样本空间中除去A包含的基本事件后,剩余的全部基本事件所组成的随机事件,称为事件A的逆事件,记作 ,有AAA 三、频率与概率三、频率与概率l频数在相同条件下进行n次试验,事件A发生的次数ml频率频数m与试验次数n的比值m/n称为在n次试验中事件A发生的频率,记作:l大数定

36、律表明,当n无限增大时,事件A发生的频率趋近它的概率( )mf An( )p A(二)古典概率(二)古典概率l古典模型成立的两个条件样本空间是有限的,即基本事件的个数有限每个基本事件发生的可能性均相等 在该模型下,事件A发生的概率称为古典概率,记作:()( )()m Ap An中所包含的基本事件数基本事件总数*(三)概率的现代数学定义(三)概率的现代数学定义 设E为一随机试验, 为其样本空间,对于E的每一个事件A赋予一个实数,记作 ,称为事件A的概率,要求集合函数 满足下列条件:l 对每一个事件A,有 ;l l 设 是两两互不相容的事件,即对于 ,有 ( ),则有l即 具备可列可加性( )p

37、A()p ( )0p A ( )1p 12,A A ijijA A, , 1,2,i j 123123()()()()p AAAp Ap Ap A()p 概率的基本性质概率的基本性质 l1.l2.l3.有限可加性:若 互不相容,则有: ( )0p( )1p A 12,nA AA1212()()()()nnp AAAp Ap Ap A四、概率中的几个常用定理四、概率中的几个常用定理(一)加法定理l设A、B为任意两个随机事件,则有:l该定理可以推广到几个事件和的情形:()( )( )()p ABp Ap Bp AB121()()()nniijiijp AAAp Ap A A112()( 1)()n

38、ijknij kp A A Ap A AA (二)条件概率(二)条件概率l事件A发生条件下,事件B发生的概率记作 或 ,可以证明:(|)p B A( )ApB()(|)( )p ABp B Ap A乘法公式乘法公式 (若 ) (若 )该公式可以推广到n个事件的积的情形 ()( )(|)p ABp Ap B A( )0p A ()( )(|)p ABp Bp A B( )0p B 12121312121()() (|) (|)(|)nnnp A AAp A p AA p AA Ap AA AA时间的独立性时间的独立性l若事件A发生与否不影响事件B发生的概率,并且事件B发生与否不影响事件A发生的概

39、率,则称事件A与事件B相互独立,即有:l , 且此时有(|)( )p B Ap B(|)( )p A Bp A()( )( )p ABp Ap B(三)全概率公式与贝叶斯公式(三)全概率公式与贝叶斯公式 互斥完备事件组:设随机试验E的样本空间是 , 为一组事件,若它们满足:l(1) ( )l(2)则称事件 为一互斥完备事件组12,nB BBijB Bij12nBBB 12,nB BB全概率公式:全概率公式:l设随机试验E的样本空间是 , 为一互斥完备事件组,且 ,( ),A为任一事件,则12,nB BB()0ip B1,2,in1( )()(|)niiip Ap Bp A B贝叶斯公式:贝叶斯

40、公式: l设随机试验的样本空间为 ,事件 为一互斥完备事件组,且 ,( ),A为任一事件, ,则在A发生的条件下,事件 出现的概率是:()(|)(|)()(|)iiiiip Bp A Bp BAp Bp A B12,nB BB()0ip B1,2,in( )0p A iB第二节第二节 随机变量及其概率分布随机变量及其概率分布一、随机变量一、随机变量 设E为随机试验,其样本空间为 ,假定:l(1)对每个样本点 都有唯一实数与之对应l(2)对任意实数x,“ ”是一个随机事件l则称定义域在样本空间上 的单值函数为随机变量 ,简记作X ( )Xx( )X随机变量的分类随机变量的分类按取值情况按取值情况

41、的取值能一一列举出来(有限或可列无穷个)的取值连续不断,不能一一列举二、随机变量的概率分布二、随机变量的概率分布随机变量所有可能取的值及其取这些值的概率来描述随机现象的变化规律设X是一随机变量,x为任意实数,则称 为随机变量X的分布函数。它表示X在( )上取值的概率。,x( )()F xp Xxl由事件的基本性质知:l即由分布函数可以求出随机变量X在任一区间( )上取值的概率 1221()()()p xXxp Xxp Xx21()()F xF x12,x x(一)一元离散型随机变量的概率分布(一)一元离散型随机变量的概率分布l设X为离散型随机变量,X的一切可能取值为 (有限或无限可列个),取每

42、个值xi的概率为pi,记为:l称上式为随机变量X的分布律或分布列,又称概率分布或概率函数12,x x (),(1,2,)iipp Xxi分布律满足:分布律满足:l , ;l0ip (1,2,)i 1ip l设X为离散型随机变量,其分布律是: ( )l则x的分布函数是:()iipp Xx1,2,i ( )()()kkxxF xp Xxp Xx(二)一元连续型随机变量的概率分布(二)一元连续型随机变量的概率分布l对随机变量X,如果存在非负函数 ,使X的为l函数 称为X的,或称为密度函数l可以证明,在 的连续点处,有:( )f x( )( )xF xf t dt( )f x( )f x( )( )f

43、 xF x概率密度函数的性质:概率密度函数的性质:l ,即非负性;l ,即 在全直线上的积分等于1, 也就是密度函数与x轴围成的面积等于1l l 即连续型随机变量在某一点取值的概率为零( )0f x ( )1f t dt( )f x()( )( )( )bap aXbf t dtF bF a()0p Xa概率值的几何图示概率值的几何图示 l连续型随机变量X在区间a, b内取值的概率 等于在该区间上概率密度函数下的曲线梯形面积()P aXb二项分布二项分布l如果随机变量X的分布律是: ( )l其中n为正整数, , 。则称X服从参数为n、p的二项分布,记作:()kkn knP XkC pq0,1,

44、kn01p1pq ( , )Xb n p独立试验模型独立试验模型如随机试验E满足:l 该试验只有两个可能的结果(则称为Bernaulli实验);l 在相同的条件下可重复n次;l 各次试验的结果互不影响;l 事件A在每次试验中出现的概率都相等,记为p。l据贝努利定理,在独立试验模型下,事件A在n次试验中出现k次的概率可用二项分布描述: ( )()kkn knP XkC pq0,1,kn正态分布l如果随机变量X的密度函数是: 其中 为任意实数, ,则X服从参数为 、 的正态分布。记作:XN( ) 22()21( )2xf xexR022, f (x) 正态分布概率密度图 标准正态分布标准正态分布

45、当 , 时,称X服从 标准正态分布,记为l 正态分布的图形是钟形曲线,当 时, 取最大值l 曲线以 为对称轴,且沿不同的水平方向单调。当 时,曲线以模轴为其渐近线l 决定图形的扁平度。 越大,曲线越平坦; 越小,曲线愈陡峭01(0,1)N(0,1)XNx( )f x12xx 非标准正态分布标准化定理非标准正态分布标准化定理 l若随机变量X服从均值为 、方差为 的正态分布,即l则 其中 ,22( ,)XN (0,1)XZN1212()()xxXp xXxp1221()()( )p zZzF zF z11xz22xz第三节第三节 随机变量的数字特征随机变量的数字特征l数学期望描述随机变量取值的一般

46、水平即平均水平的数字特征,又称为均值或期望值l离散型随机变量数学期望l连续型随机变量数学期望()( )E Xxf x dx()iiiE Xx p(三)数学期望的基本性质l 为常数l ,c为常数ll 若X与Y相互独立,且各自的数学期望均存在,则:( ),E cc c()()E cXcE X()()( )E XYE XE Y()()( )E XYE XE Y二、方差二、方差l方差描述随机变量的取值与其数学期望之间的平均偏离程度的数字特征l可说明数学期望的代表性高低:方差愈大,表明该随机变量的取值愈分散,它的数学期望的代表性愈低方差愈小,表明该随机变量的取值愈集中,它的数学期望的代表性愈高l对随机变

47、量X,若 的数学期望存在,则称 为X的方差,记作:l其算术平方根 称为标准差或均方差2()XE X2()E XE X2()()D XE XE X()D Xl离散型随机变量 ,且 则方差l若X为连续型随机变量,且密度函数是 则方差 ()iipp Xx2()()iiiD XxE Xp( )f x2()()( )D XxE Xf x dx方差的基本性质:方差的基本性质:l ,其中c为常数;l ,其中c为常数;l 当X,Y相互独立时,l ( )0D c 2()()D cXc D X()()( )D XYD XD Y22()() ()D XE XE X第四节第四节 大数定律与中心极限定理大数定律与中心极

48、限定理一、大数定律一、大数定律l大数定律是概率论中讨论随机变量序列的算术平均值向某处常数收敛的一类定律的总称大数定律大数定律1契贝雪夫定理契贝雪夫定理l设随机变量 相互独立,其数学期望与方差均存在,且方差一致有界,即存在一个常数k,使 ,( )l则对任意正数 ,都有12,nXXX()iD Xk1,2,i ()lim(|)1iinXE Xpnn契贝雪夫定理契贝雪夫定理l特别,当 时,有l定理表明,尽管 中每一个的取值都是随机的,但在满足定理条件下,只要n充分大,其算术平均值密集在这个平均值的数学期望附近()iE Xlim(|)1inXpn12,nXXX大数定律2贝努利大数定理 l设事件A在每次试

49、验中发生的概率都是p,m是n次独立试验中事件A发生的次数,则对任意正数 ,有:l该定理表明,只要重复独立试验中的次数n足够大,事件出现的频率与概率就十分接近 lim(|)1nmppn二、中心极限定理二、中心极限定理 同分布中心极限定理同分布中心极限定理 l设 独立同分布,且都有相同的数学期望与方差,即 , ,( )l令12,nXXX()iE X2()iD X1,2,i /inXnXYnn同分布中心极限定理同分布中心极限定理l则对任意实数x,都有:l即l也就是221lim()2tdtxnnP Yxe2( ,)XNn(0,1)/XZNn中心极限定理中心极限定理 德莫弗德莫弗-拉普拉斯定理拉普拉斯定

50、理 l设总体的成数(又称比率)是P,从总体中抽取容量为n的样本,样本成数(比率)是p,则对任意x,有:l即l从而221lim(1)/2tdtxnpPPxePPn(1)( ,)PPpN Pn(0,1)(1)pPZNPPn中心极限定理中心极限定理 拉普拉斯定理拉普拉斯定理 l设X服从 二项分布,则当n充分大时l(1)局部极限定理( , )b n p2()21()2k npnpqP Xken pq01()knpfnpqnpql(2)积分极限定理l当n较大时,在二项分布表中常找不到其概率值,此时只好用正态分布近似计算二项分布的值。n愈大,用正态分布求得的值愈接近二项分布的值 00()()()bnpan

51、pP aXbFFnpqnpq第八章第八章 抽样推断抽样推断第一节第一节 抽样推断的含义及其作用抽样推断的含义及其作用v抽样推断从总体中按随机原则抽选一部分单位(称之为样本),根据样本的数量特征对总体的相应数量特征加以推断的方法抽样推断的特点v第一,按随机原则抽选一部分总体单位组成样本v第二,抽样推断是根据部分来推断整体,而不是直接认识整体 v第三,抽样推断必然存在误差,但误差可以控制和计算抽样推断的作用抽样推断的作用v第一,应用于某些不可能作全面调查或很难或没有必要作全面调查的场合v第二,在可以使用全面调查的场合,抽样调查仍有其独特的作用:节省成本;校订误差等v第三,用于假设检验抽样推断的局限

52、性v首先,由抽样推断得出的关于总体的认识是近似的、非全面的v其次,由抽样推断得出的是关于总体的结论,而不能得出总体各部分的结论三、抽样推断中的若干基本概念v全及总体简称总体或母体,是指所要研究的人部对象所组成的一个整体v总体单位组成总体的个别事物v总体根据其所包含的总体单位数目多少可分为:有限总体是指总体内的单位个数只有有限个无限总体是指总体内的单位个数有无限多个v样本总体简称样本或子样,是指按随机原则从总体中抽取的一部分样本单位组成的一个小总体(二)总体指标与样本指标v总体指标是反映总体特征的数值 常用的总体指标如下:,表示总体体内各单位某一标志值的一般水平,记作 ;,反映总体各单位标志值的

53、离散程度,从而可以说明总体平均数的代表性大小,记作 ,称为总体标准差或均方差;,指具有某种性质的总体单位在总体中所占比重(如全部产品的合格率),记作P。X2是指根据样本中各单位的标志值计算的反映样本特征值的指标 常用的样本指标如下:,表示样本内各单位某一标志值的一般水平,记作 ;,反映样本中各单位标志值的离散程度,从而可说明样本平均数的代表性大小,记作 ,称S为样本标准差或均方差;,指具有某种性质的单位在样本中所占比重(如抽样产品的合格率),记作p;样本成数的方差是 。x2S(1)pp总体指标的公式v总体平均数:v总体方差:v总体成数:1NiixxN221()NiixN1NPN样本指标公式v样

54、本平均数:(8-1)v样本方差: (8-2)v样本成数:1niixxn221()1niixxSn1npn实际计算样本平均数的方差v对有加权的情形: 22222()()( )11x fxfnnSxxnffnxfxf22222()()( )11x fxfnnSxxnffn抽样方法的分类是抽取一个单位后,抽选下一个单位时仍把前一个已抽中的单位放回总体中再进行抽取,因此一个单位有重复抽中的可能,也叫做有放回的抽样或重置抽样则是将已抽中的单位不再放回总体,因而每个单位最多只能抽中一次,也叫做无放回抽样或非重置抽样从容量为N的总体中抽取容量为n的样本,则v不重复抽样下可抽取的样本个数是:v重复抽样下的样本

55、个数是:!()! !nNNMCNn n1nnNNnMDC 第二节第二节 抽样误差抽样误差v抽样误差随机抽样引起的偶然的代表v误差抽样误差愈大,样本指标对总体指标的代表性愈低;反之则愈高登记性误差(工作误差)(可消除)统计误差系统性偏差(可消除)代表性误差随机误差(抽样误差)(不可消除,可以控制)抽样实际误差与抽样平均误差是指在某一次抽样中,由随机因素引起的样本指标与总体指标之间的数量差异,常用R表示,是根据随机原则抽样时,所有可能出现的样本指标的标准差。它反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均误差程度,常用 表示 v样本平均数的平均误差 v样本成数的平均误差 21()Mi

56、ixXxM21()MiipPpM简单随机抽样下的平均误差公式 v在重复抽样下:2xn(1)pPPnv在不重复抽样下:2()1xNnnN(1)()1pPPNnnN总体方差、总体成数的替代处理:v第一,用过去的 、P代替,但此法只适用于总体情况变化不大的情形v第二,用某个样本的方差 、成数p代替v第三,对P而言,取P=0.5;若有多个P,则取最接近0.5的那个P值,原因在于,当时,成数P的方差 取最大值 22S(1)PP简单随机抽样又称为纯随机抽样,是按随机原则直接从总体中抽取若干单位,构造一个样本,然后据样本指标对总体的相应指标进行推断的方法v简单随机抽样中抽选样本的常用方法:第一种是直接抽样法

57、第二种是抽签摸球第二种是利用随机数字表类型抽样又称分类抽样或分层抽样,它是先将总体单位按某一标志分成若干类型,在各类型中按随机原则抽选样本单位,由各类中的样本组成一个总的样本,然后据样本特征推断总体特征v类型抽样的方法:是从各类型中按相同的比例抽选样本单位,这种抽样未考虑各类型中的标志值的变异程度是否存在差别在各类中按不完全相等的比例抽选样本单位,这样就可以在标志变异较大的类中多抽一些单位,而在标志变异较小的类中少抽一些单位等比例抽样下平均误差的计算 重复抽样v在等比例抽样中, ,样本平均数viinncNN11nkjiijixx nxnn2xn(1)pPPnv其中v式中 , 为各类的方差、成数

58、,它们往往未知,常用各类中样本的方差 、 样本成数代替221kiiinn1(1)(1)kiiiiPP nPPn2iiP2iSip等比例抽样下平均误差的计算 不重复抽样v在不重复抽样下:v当总体单位数N较大时常取: 2()(1)xNnn N(1)()1pPPNnnN11NnnNN 不等比例下平均误差的计算重复抽样 v在重复抽样下: 211kiixiNnN1(1)1kiiipiPP NnN不等比例下平均误差的计算不重复抽样v在不重复抽样下 211()1kiiiixiiNNnnNN1(1)1()1kiiiiipiiPP NNnnNN机械抽样v机械抽样又称等距抽样或系统抽样,它是先将总体各单位按某一标

59、志顺序排队,然后按固定的顺序和间隔在总体中抽取若干个单位构成样本 机械抽样的过程v1.排队v2.根据总体单位数与需要抽取的样本单位数计算抽选各样本单位的间隔距离K,取v3.确定抽样的起点,即第一个样本单位的位置 按无关标志排队,从第一个间隔内任意一个单位开始抽取 按有关标志排队,从第一间隔居中间的那个单位开始抽取 按无关标志排队按无关标志排队 按有关标志排队按有关标志排队NKn按无关标志排队进行等距抽样的平均误差公式21NnxnN(1)()1pppNnnN整群抽样整群抽样又称聚点抽样或群体抽样先将总体划分为若干群(R群)再从中任意抽取几群(r群)然后对抽中的群作全面调查并据此结论对总体加以推断

60、整群抽样具有如下特点:v尤其适用于存在自然群的场合,从而可以节省人力、物力和财力v整群抽样的误差较大v样本对总体的代表性会降低整群抽样下的平均误差公式:v其中 称为群间方差2()1RrxxrR2()1pRrxrR22,pxv取 1riixxr1riixpr222111()( )2()rrriiiiiixxxxxrrr2222111()()()rrriiiiiippppprrr抽样误差的影响因素v总体方差或标准差 :与误差成正比v样本容量 :反比v抽样方法 :不重复抽样误差更小v抽样调查的组织方式 :类型抽样的抽样误差较小,而整群抽样的抽样误差却较大 第三节第三节 抽样估计方法抽样估计方法v抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论