回归分析预测法_第1页
回归分析预测法_第2页
回归分析预测法_第3页
回归分析预测法_第4页
回归分析预测法_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 从本章起将讨论定量预测技术 第三章的基本思路来源于数学分析中数理统计的回归分析方法,将因素之间的规律(利用已知统计资料)设为按一定数学模型变化的运动轨迹,并假定: 未来的变化仍然是在已知的条件下进行,运动轨迹将不会发生畸变。 一.基本概念 1.回归分析的来由: 20世纪初,英统计学家 F.Golden 研究父子身高的遗传统计,高个子父母下一代比父亲更高的概率小于比他矮的概率,而矮个子父亲下一代比父亲高的概率大于比他矮的概率;且这两种高度父辈的后代,高度有向两种父辈平均身高靠拢的趋势,这种现象称为“回归”是一种自然界现象规律的提取。 2.回归分析 研究变量之间的互相关系,把其中一些因素作为控制

2、的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的分析,称为回归分析。 即假定 y 与 x 相关,应有 y = f ( x ) 若 x1,x2, xn个变量影响y,应有 y = f (x1,x2, xn) 显然,有一些问题必须解决 因素分析 现代社会中,任何一件事物与多个因素相关,如何选取主要因素,忽略次要因素,使建立的数学模型不因变量太多而复杂,又能较好的抓住主要矛盾。 解决方法是求相关系数R 运动轨迹的模型 主要利用已知统计数据在图上打点进行观察分析,寻求一条最佳线路。采用最小二乘法,即在满足该条线路的模拟值与真值总平方误差ei2为最小的条件

3、下,来求出模拟数学模型各参数。(为Gauss-Markov最佳线性与无偏估计量 ) 相关性检验 目的是鉴别所求出的模型是否可靠, 方法:利用相关性检验准则进行检验 精确度:即讨论在一定置信度条件下的置信区间 预测 :前面的问题已解决,数学模型已经建立且可靠, 精度问题也已解决,利用延续性原则代入需预测的数据,并求出结果。 二.方法分类 线性 线性 一元 多元 非线性 非线性 一.回归方程的建立 假定需预测的目标为 y,与之对应的因素 x,随机抽样,子样数为 n ,通过图上打点作粗略估计已知的一组对应数据,初步定为线性关系,同时再考虑到随机因素,应有: yi = a + b xi + ei i

4、= 1,2,n (1) 不考虑随机因素,应有: yi = a + b xi i = 1,2,n (2) 代(2)入(1),求得随机项 ei = yi yi = yi ( a + bxi ) (3) ei 称为残差 这表示,真值与模拟直线y = a + bx之间存在实际误差 ei,累积平方误差为 Q = ei 2,称残差平方和,又称剩余平方和。 反之,我们已知的是实际数据(xi,yi),从可能的无穷条模拟直线中选取某一条直线,使之模拟得最好,标准为Q = e2i最小。 由(3) Q(a,b)= ei2 = (yi a-bxi)2求极值点,应有:Q(a,b)a = 0 及 Q(a,b)b = 0

5、y 得出 (yiabxi)= 0 (yiabxi)xi = 0 求出a,b a =(1/n) yi - b = (xiyinxy)/(xi2nx2) 记 (xix)2= lxxx的离差平方和 (xix)(yi-y) = lxyx,y离差乘积和xbyxnbnii11xbyxnbnii11 则b可简记为 b = lxy/lxx , a = y (lxy/lxx) x a,b称回归系数 y = a + bx 称线性回归方程。 这种方法称为最小二乘法,又叫最小平方法OLS(Ordinary Least Square) 二. 一元线性回归方程的代表特性 1、 ei = 0 , 即残差和为0 2 、 回归

6、直线过点(x,y) y = a + bx 即过数据重心。 3 、 回归平均值等于离散平均值,即 = y i=1. ny y 三. 相关检验 相关检验解决两大问题: x与y是否线性相关及相关强弱如何? 它们之间相关显著性如何? 1、y的离差平方和 lyy = (yiy) 2 对于任意给定的xi,都有yi的波动,波动的大小可用yiy来评价,n次结果的总波动大小为lyy,数据分散程度。 2、回归平方和 U = ( y) 2 对于任意给定的xi,yi与xi是人为给定的线性变化而得到,它与实际的均值 必产生偏差,这种偏差是由回归而产生的,是回归偏差平方和U回归分散程度制定。 3.残差平方和 Q = (y

7、iy) 2 实际值与模拟值产生的误差,由于yi 随xi变化的随机特性引起,模拟的好则残差平方和应尽可能小 lyy = Q+Uiy iy iy y 这个公式中:离差平方和lyy是不可变更的客观存在,且残差平方和Q尽可能小,故有U lyy效果好,即yi与xi之间存在强的线性关系。 于是有定义:R2 =U/lyy (0R 1) 即 U = R2 lyy 由lyy = U+Q推出Q = (1R2) lyy 其中R称为相关系数。 当R=0为不相关,R +1为强正相关, R-1为强负相关 这样,通过研究相关系数R,可作出两个因素之间是否具有线性相关关系,且能判其相关程度。 相关程度的显著与不显著(即使相关

8、性强,但某因素对另一因素的影响不大,即不显著,那么这种因素也是不重要的)有一个具体界限,这是R检验。 由于抽样误差的影响,R达到的显著值与样本个数n有关,且取决于不同的显著性水平(或置信度),配成相关系数检验表,它们给出了在不同的n,a时,相关系数达到的最小值。 四、精度:即是在确定的置信度条件下,求出相应的置信区间:(n0) 当 a = 4.6% 时(yi 2s,yi+2s) a = 0.27% 时(yi 3s,yi+3s) 其中 S = Q/(n2),称为剩余标准差。 2004/10/11 五. 预测 利用公式 = a + bx 对于任意确定的时间(此时取y = a + bt)或数值(自变

9、量x),可以决定所给定时间或自变量条件的预测值y及预测范围.y 这是指所预测的变量与多个自变量线性相关的情形,这里谈一种较简单的分析方法。 非线性回归均可转化为线性回归,所以我们研究多元线性回归就有突出重要性。 设y 与 xj 线性相关,j = 1,2,3,m,即m元。那么有y 与 xj 构成的线性关系: y = bo + b1x1+ + bmxm +e 其中bo,b1,bm为常数,e为随机项, 则对应之回归方程应为(不考虑随机因素) y = bo + b1x1+ + bmxm 针对y与xj 的第k次观察数据,就有: yk = bo + b1xk1+ + bmxkm+ek yk = bo +

10、b1xk1+ + bmxkm k = 1,2,n, 即有n组数据取用。 由上两式,得, ek = yk yk = ykbob1xk1bmxkm 按照一元线性回归方法,利用最小二乘法,求各系数: Q(bo,b1bm) = (ykbob1xk1bmxkm)2 为最小,求各系数的偏导数. 则 Qb0 = -2 (ykbob1xk1bmxkm) = 0 : Qbj = -2 (ykbob1xk1bmxkm)xj=0 j = 1,2, ,m.k=1,2,n; 由此,共得m + 1个方程, 求bo: yknbob1 xk1 bm xkm=0 bo = (1/n) yk(b1 1/n xk1+ +bm 1/

11、n xkm) 令:y = (1/n) yk, xj = (1/n) ykj 有bo = y(b1 +b2 +bm ) 其余m个方程,可表示为矩阵解: l11 l12 l1j l1m b1 l1y l21 l22 l2j l2m b2 l2y li1 li2 lij lim bi liy lm1 lm2 lmj lmm bm lmy =y1x2xmx 其中: lij = (xki )(xkj ) liy = (xki )(yk ) i,j = 1,2, ,m; k=1,2n;ixjxixy 判断y与某一自变量xj的相关显著程度采用t检验. 构造统计量 tj = bj/S Cjj 其中 S = Q

12、/(nm1) l11 l12 l1m C11 C12 C1m C = : : : = : : : lm1 lm2 lmm Cm1 Cm2 Cmm Cii就是C中对角线元素. 如果 tj ta/2, (nm1) 则对应的 xj对y 的影响程度大,否则影响小,应予排除.-1 m维 线性相关显著性检验,采用F检验. 构造统计量 F = (U/m)/Q/(nm1) 当F Fa (m, nm1) 为显著, 其中: U = (yiy)2 Q = (yiyi)2 回归思维在期,股市中的运用-乖离率指标 由于任何性质的变动趋势,都有回归的性质,即向均值回归,在股市市场,股票的股价均有向均值靠近的性质。 一般地

13、,描述这样性质的技术指标称乖离率BIAS, 定义为:CM(n)/M(n) 100% C为当日股价或当日指数,M(n)为n日股价或n日指数的移动平均值, 1.若当日股价剧烈上升或下跌,将使BIAS的绝对值加大,回归愿望强烈。-应出货或补仓。(1)(1)(1) 2.若当日股价沿移动平均值前进,则BIAS在0值附近,股价运行轨道不变,-考虑继续持仓或减仓操作, 3.BIAS的数值表明了股价与市场平均成本的盈利或亏损的百分比,即大多数投资者所据有的盈利或亏损空间。 投资策略: -3 -5 为买入时机 +3 +5 为卖出时机 -15 -20 为最好时机 -10 -15 为较好时机 -5 -10 可买入

14、+15 +40 选点卖出短线BIAS(5)BIAS(10)支撑线压力线买入卖出卖出 买入买入 96.12,因政策和升幅过大下调至97.1月开始上升,至5.12日深成指从2792至6103,升幅过3311点,因技术要求及97发行额度影响,暴发性下跌,至5.14日收盘5505,跌598点,BIAS(5) = -4.66,BIAS(10) =-2.54,5.15日以5416开盘,探底5279引发反弹,收至5622点,5.16 (周五)以2163点开盘,收至5125点,比前日降497点,BIAS(5) = -8.98,BIAS(10) = -9.92,5.19,5.20略有反弹,5.21日因利空谣传再

15、次下跌,5.22日国务院证券委,中行等出台禁止国企和上市公司买卖股票的几点规定出台,导致股市暴跌, 沪:BIAS(5) = -6.87,BIAS(10) = -10.88 深:BIAS(5) = -7.02,BIAS(10) = -12.37 两个变量之间的关系并非全是线性关系,非线性关系也比较多。我们在作图上估计趋势时,可利用标准曲线与之比较,哪种曲线最合实际情况,若不是线性关系,通常有几种典型的常用模型。 一. 指数曲线 y = a bx ( b0) 取自然对数 y = a + x b 令 Y = y,A = a,B = b 则 Y = A + Bx 就构成一元线性方程。 利用原始数据 xi 及yi yi ,根据一元线性回归公式,可以得到回归系数A,B。 同时考虑到A = a,a = eA 及B = b, b = eB求出 故 a,b可定,预测方程 y = a bx 可定。 相关性:利用一元线性回归方程 Y = A + Bx 采用线性相关性判定,若x,y 线性相关,则y与x非线性相关,且有规则y = f(x) = a bx 二. 双曲线:单调减,水平渐进线 y = a. y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论