(应用数学专业论文)具有ar(1)误差的变系数模型的统计分析.pdf_第1页
(应用数学专业论文)具有ar(1)误差的变系数模型的统计分析.pdf_第2页
(应用数学专业论文)具有ar(1)误差的变系数模型的统计分析.pdf_第3页
(应用数学专业论文)具有ar(1)误差的变系数模型的统计分析.pdf_第4页
(应用数学专业论文)具有ar(1)误差的变系数模型的统计分析.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ab s t r a c t hire c e n t y 启 奴 5 , the 肚 c h ofv aj 下 , ng-c 叱 伍 ci ent m o d e l at 坛 鱿 tsco ns l d e r a b le曲e nt l - onan d be com esan助po比 知 t fieldinthe r e gr e ss fo n anal ys is . 姚 叮访 9 一e 伍 ci ent m ode l , us e fulin n . 口 y p r o b 】 e lns e s p e c i 目 ly for 伙 o d o ln e 州 c s , b i o m ed i c 访 七 幼 d 娜d e 面o 1 o gy, is an exce u ent g en e 阔政 沮 t l on加ml inearre gressionm ode l . t b l s p a per d 此 usse s the v az 扣 n g -c o e ffi ci ent m edel幼t h血st 一 r d era u t o re 脚ss ive 。 比 明, “ 户 沁 皿 ally for th e m e th odand 即 p li c 呱 onofthe di a gno st i c s . at五 r s 仁 we obl a il l the e 刘 的 已 i o n of丘 m ct i o 耐 co e ffi ci en ts , the d ev 1 at i o n and a ut o r e gr e s si oncoe ffi d e n ts . 从 飞 e n 俪 皿m b 二of case issu 伍 c l en t , we p r o v 目 吐 进 t the 丘 m ct i o 耐 coeffid e n ts , b 一 ine e st 汕at i 0 non th inkin gov era u t 0 re gres s i 0 nisbe tter t 1 1 an 0 而tt in gthe a u to r e 脚 551。 几 t b e n , we get th e di a gn o sti c e x p r e s s l 0 nsb as edonc ase de 1 比on, 已 右 山 l ish aneq山 vale d c e be七 丹 eenthe c a ed el etion mode l 阳dme a ns hi且o ud l er刃 。 o del . t b ed . w t e 就胡ds c o r etest are propos e dto仍 stthe aj 吐 o c o n 】 而on add h e t et o sc e ds 葫 c ity ofthe . 口 d o mo rr o r s in v 娜in g -coe ffi c i e n t m odel . at l 巴 式the di 越 笋 o st l c 引 团 i sti c for 1 e st 0 ul li ers and in n u e n 1 i al 因政is gi veil n 山 叮 e n cale x aj 的 p l esare g v entol l l u stra t e o urr es u l ts . k e ywo rds:a u t o r e gression, b 一 s p line , 姚 叮 恤9 一 c oe ffi ci ent, h e t 。 刀 , 笼 山 以 i city , c ase ds leti o n ,me a ns h i ft 声明 本学位论文是我在导师的指导下取得的研究成果, 尽我所知, 在 本学 位论文中, 除了 加以 标注和致谢的部分外, 不包含其他人已 经发 表或公布过的研究成果, 也不包含我为获得任何教育机构的 学位或学 历而使用过的材料。 与我一同 工作的同事对本学位论文做出的贡献均 已 在论文中作了明确的说明。 研 究 生 签 名 : 鱼鱼业- 为 7年2 月 日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电 子和纸质文档, 可以 借阅 或上网 公布本学位论文的全部或部分内 容, 可以向有关部门 或机构送 交 并授权其保存、 借阅或上网公布本学位论文的全部 或部分内 容。 对 于 保密论文,按保密的有关规定 和程序处理。 研 究 生 签 名 : 羡树林 ” 宁 年 2 月 日 硕士论文具有a r( 1 ) 误差的变系数模型的统计分析 第一章 绪论 回归分 析是数 理统计的 一个重 要分支, 它的理 论与方法 发展的非 常快, 在许多实际 问题中有着重要的应用. 随着回归分析理论的不断发展,变系数模型己成为当前重要的 研究课题, 1 . 1 变系 数模型及其研究 现状 回归 分析就是 探索随 机变 量y 与另一 变量x 之间的 依赖 关系, 在这一探索 过程中人 们往往 将x 与y 放到一 个具体模型中 , 我们 称这个模型为 统计模型一般来说, 统 计模型 只是客观 现实的一 个近似, 一个 好的 模型能 够比 较好的解释数 据, 预测未来.在上世纪 七、 八十 年代以 前, 研究的 重点在 于参数回归 模型. 即 假设y 与x 满足: 共 = f(xl;灼+ 称 其 中 乓 为 独 立的 随 机 变 量 , 满 足五 ( ) = 众 e( 对 ) = 矿.回 归 函 数f( x , 灼的 形 式己 知 , 夕 为 未 知 的 参 数, 共 成 二 1 为 观 察 数 据 .我 们 所 熟 知 的 线 性 回 归 和 非 线 性 回 归 模型 都 属 于 参 数 回归的 范畴. 参 数回归 具有计算量 小, 估计效率高, 需 求样本少的 特点, 但参 数模型对回 归结 构假设比 较严格, 当 假设不成 立时就 会产生很大的 模型偏差, 甚 至导致错 误的 结论. 为了 减少参数回归的 模型偏差, 统计学 家提出 一个假 设更宽 松更自 由的 模型一 非 参数 回归 模型即 假定回 归函数了 ( 习属于一 个广泛的函数 类, 如光 滑函 数.其模型为 yt= f (x,) + 乓 . 其 中 误 差 随 机 变 量 凡 凡 相 互 独 立, 满 足 e ei = 0 ,e 才= 护, 仅成:- , 为 观 察 数 据 . 非 参 数 回 归 分 析 的 基 本目 标 就 是 基 于 数 据 另 , x,几 1 估 计 非 参 数 回 归函 数f( x)并 研 究其统计推断问题非参数方法对模型的结构假设很少,因此非参数模型具有稳健 毋曲 洲) 的 优点,但相对于参数模型, 非参数模型需要的 样本 容量较大, 计算更复 杂. 在非 参数回归的估计过 程中, 当 回归 变量x 为一维时 可以 得到较 好的 估计.但当回 归 变量 x 为高 维时, 由 于x 的局 部邻域包含的 数据 较少, 因此 估计的效果 非常差.这样一种现象 称为“ 维数祸 根” (culseofd 如ensi on ) . 但是 在近代统计 学中, 我们 常常面临的是 高维数 据,因 此 在高维空间上 解决 “ 维数 祸根” 的问题 就成为 统计学家们近 年来所追求的目 标. 目 前, 统 计学中有两类方 法来解决高 维数据带来的 “ 维 数祸根” 困 难: 一类是降 维,包括 图回 归、 s ir回归 等另一类方法 就是函 数近似, 如可 加模型、 部 分线性模型、 变 系数模 型等. 关 于 “ 变 系 数 模 型 ” , 它由 c lev e land , g 阳 ” 和肋 ” ja 99 助 问 在 从 一 维 到 多 维 局 部 回 硕 士论 文具有a r ( n 误差的交系 数棋型的统 计分析 归技巧的 扩展中 介绍而来的 . h asti e 和ti bs h ir 田 面 l jj 在 1993 年的 专题论 文中详 细的 讨论 了 这 种模型.它一 般可以 写为 下面的 形式: y = 气 八 (t. )+ 凡 几(tr 卜产(l.1.1 ) 其 中 x= 伪,气 , xp 尹 , t 一 (tl , , 一 , t, ) r 为 回 归 变 量, 少 为 响 应 变 量 . 产 为 随 机 误 差 , e( 川= 0 , e 伽 , ) = 。 , , 忍 (t,)(i一 1 , ,p)为 未 知 的 函 数 , t, , , t , 通 过 诸 未 知 的 函 数 戊 (t, ) 来 改 变 x , , , x , 的 系 数, 乃 (t,)暗 含了 t, 与xl 的 一 种 特 殊的 交 互 关 系, t , 可 能 互 不 相 同 , 也 可 能 相同 , 也 可 能 是 某 个x , .此 模 型 将 另 一 变 量 ( 可以 是 年 龄 , 时 间 , 空 间 坐 标 或 其它 变量 ) 嵌入到回 归系数之中, 故 其既能 描述因 变量 和自 变量的 关系, 又能 反映 数据的其 他 变化特征, 在对 来自 地理, 经济, 环境, 地 质等领 域的 数据的 分析中 有 着广 泛的 应用, 变系数 模型 ( 1 . 1 . 1) 是一个 非常一 般的模 型, 许多模型都 可以 看作是 它的 特殊情形, 如: (a) 当药(t ) 二 戏是一 个常数时, 所 有的 系数 都是一 个常数, 模型(l . 1 . 1 ) 变成常 见的线性 模型; (b) 当 xl“ 1 , 第 1 项 为 戏 (t ) , 模 型 (l1.1) 所 对 应 的 模 型 为 可 加 模 型 1性 (c)当 剐t, 卜戏 , 1 = 1, , p 一 伪常 数 , x , “ 1, 凡(t , ) = f(o , 则 模 型 (l1.1) 为 少 = xt 刀 + f (t ) + e . 它是 部分线 性可加模型 . (d ) 当tl 是一 个相同 的 变量, 如果为时间t , 模型 变为 y 二 从 八 (t)+. 二今 凡(t)+ 乙(l.l 2) 这种模型又被称为“ 动态的广义线性模型” ,是研究最多的的一类变系数模型. 对于变系 数模型,19 93年h as t l e 和ti b s h ir 别 面 1, 1 给出了 未知函 数的光 滑样 条估计, 在几(.)(j=l , ,p)具 有 相 同 的 光 滑 度 时 , 文 献 【61 给 出 局 部 最 小 平 方 方 法 , 这是 一 种 简单 而 有用的 方 法, 所 得到 的 估计 量 是 最 优的 ( 在最 优收 敛 意义 下 ) 然而当 几() 仃= 1,. 二 , p)具 有 不同 的 光 滑 度 时 , f an和2 坛 切 尹指出 , 文 献16 中 某 些 估 计 量 将 不 再 达 到 最 优 收 敛 速 度 , 因 而 不 够 有 效 .为 了 克 服 这 种 不 灵 活 性 , 文 献 【7 提 出 了 两 步 估 计 法 . 当 观察 数据 为 纵向 数 据时, hoov er ,拓 沈和 wu5 得到 函 数系数的 光滑 估 计.此 外 c 肠 比 几 朋 9 凡ee和wul2 , f an和2 七 an g l3 提 出 局 部 多 项 式 和 光 滑 样 条 的 两 步 估 计 方 法, 使得光 滑参数的 选择可以因 函数 系数的 不同而 不同 . 由 于 两步估计需 要两次 极小 化 才 能 得 到, 故 计 算 量 较 大 . 唐 庆 国 , 王 金 德 151 提出 了 一 步 估 计 法 , 在这 一 方 法 中 用 不 同 阶的多 项式来逼 近不同 光 滑度的 未知函 数, 计算量较少 且能达到最 优收敛 速度, 是一 种较有 效的 估计而 且得到了 估计量的 一些 渐近 性质,如 渐近偏差, 渐近 方差以 及估计 量的 渐 近分 布, 这 些 在 统 计 推 断 中 将 起 到 重 要 作 用 .另 外 m eil g 给 出了 局 部 加 权 最 小 二 乘估计, 卢一强 11 0-1 1 运 用b 样条 技术得到了 模型的b 样 条估计, 给出了 估计的渐 近分 2 硕士论文具有人 r (l)误差的 变系数模型的 统计分 析 布, 并证明在一 定条件 下可以 达到最优收敛速 度. c ai.,f an 和 li i4) 给出了 一步局 部最 大似然估计, 并得到了 估计量的 渐近正态性. 在 变系数模 型的统 计推断 研究 上, 人 们也 做了 大 量 的 研 究 . 当 未 知 函 数几 (t)具 有 相 同 的 光 滑 度 时 , 文 献 9 讨 论了 用 变 系 数 模 型 拟合数据是否 在很大 程度上优于一 般线性模型, 并在一 定条件 下给出 了 这个假设 检验 的 检 验 统 计 量 文 献 l 和 91就药(t),仃 = 1 , 一 , p)是 否 会 随 着 : 的 不 同 而 不同 , 给 出 了 相 应的 假 设 检 验 统 计 量 , 而 在未 知 函 数 具 有 不同 光 滑 度 时 , 文 献 1 2 运 用 广 义 似 然比 检 验 方 法 对式 ( tj)是 否 会 随 着j 的 不 同 而 改 变 给出 了 广 义 似 然比 检 验 统 计 量, 并 在 一 定 条件下求出 了 检验统 计量的 渐近分布. 在以 上的 讨论 中 都是 假设戈= (xt 1.xt 2 , 称 丫 ( 1 = 1,. 二 , 。 ) 与 从 相互 独立 并且 八 满 足 iid 当 这 些 假 设 条 件 不 再 满 足 时 , ro bi ns on lls 讨 论 了 戈= ( xtl ,x, 2 ,、 ), , ( 1 = 1,.川满足 静 态a 混 合, 并且 误 差 项 八 满 足iid且 和戈独 立的 情 况, 运用 刀 山 勿 了 刃 心 一 肠tso访 法,给出了系数函数的估计, 并研究了该估 计的 渐近性质. 而后 rob inson在文 献 19 中 考 虑 一 个 更 加 一 般 的 模 型 , 把 误 差 项 从 也 放 宽 为 满 足 静 态 a 混 合. 最 近 2 泊 n g w l l 伪125)(2 0 07年) 运用局部线性方法, 获得了 当 误差 项满足“ 混合条 件时, 未知函 数系数的 估计, 研究了 估计的 渐近正 态性, 并 讨论了 估 计的 渐近 偏差. c ai 和t i 切 颐11 习 ,月 加 iln 分 别 在 研 究 了 回 归 模 型中 戈具 有自 回 归 的 情 况 , 并 讨 论 了 一 些 统计推断的问题. i j误差存在 自 相关性模型及其研究现状 在回 归 模 型中 我 们 通 常 假设 误 差 项八 , 1 = 1 , , n 满 足 下 面 的gauss 一 五 匆 r 肋 v 假 设 : e 俩) = 0 ,际帆) = 。 , ;co, 认, 巧 ) = 0 ,1 , j .( 1 .1 .2 .1) 但在实际中 遇到 的问 题往往比较复杂, 有时难于 满足(l . 1 . 2. 1) 的 假定. 比如 : (l) var 仇卜护( 等 方 差 性 ) 不 成 立, 即 误 差 项 具 有 不 等 方 差 , 统 计 上 称 作 异 方 差 性. (2) cov 执,巧 ) “ 。 ,1 笋 j 不 成 立, 即 误 差 项 存 在自 相 关 性 . 人们在实际问 题中 发现许多随机 误差出 现序列 相关 和方差不同的 现象, 因 此 对回 归模型的 随机误差的 独立性和方差齐性的 假设产生了 质疑, 从而 展开了 对回归 模型的 相关性和 异方差 性检 验的研究, 它是处 理回 归问题的 重要 步骤, 在理论和应 用上都 有 十分重要的意义. 韦 博 成 131 1 , 王 松 桂 等 1441对 具 有 异 方 差 误 差 和自 回 归 误 差 的 线 性 回 归 模 型 进 行了 详 细 的 讨 论.及 b 份 和叭 公 【201 系 统 地 介 绍了 具 有a r ( 司 误 差 序 列 的 非 线 性 回 归 模 型 , 用 “ 两 步 ” 法 研 究了 模 型 的 参 数 估计 .胡 舒 合 121 研究 了 误 差 为 线 性时 间 回 归 模 型 的 有 关 估 计 量的 相 合 性 和 渐 近 正 态 性 .林 金 官 和 韦 博成 脚 j134 研 究 了 非 线 性 随 机 效 应 模 型 和 具 有a r m 人 (0,1 ,0)误 差 非 线 性 模型 的 异 方 差 检 验 问 题 .c oo k 和 从 七 15 吮 rg 四, 基 于s co re 硕士论文 具有a r 1 误差的 变系数模型的统计分析 检验统计量对线 性回归 模型的异 方差性进行了 统计诊断. p u t e n 力 a n 网, hos s ai 力 1231对具 有自 相关的 线性模 型进行了 统计 诊断和影响分析. r i c h 毋 d , rob 和a l a ” 1 24给出了时间 序 列 回 归 模 型 的 残 差 诊 断 图 , 杨 爱 军 等 32 研 究 了 具 有a r ( 1 )误 差 的 非 线 性 随 机 效 应 模 型自 相 关 系 数 的 扰 动 诊 断 .另 外 , chi 和 remse ill 3 研 究了a r ( 1 ) 随 机 效 应 模 型 的 相 关 性 检 验 .正 如肠 科11 5 所 述 , 自 相 关 和 异 方 差 可 能 同 时 发 生 一腼( 19 8 司 25 首 次 讨 论 了 异 方 差 性 和 相 关 性同 时 检 验 的 问 题 . 胡 跃 清 和 韦 博 成 2n研 究 了 具 有a r ( 1 ) 误 差 非 线 性 回 归模型的异方差和相关性同时检验的问题,给出了 似然比统计量和s core检验统计量 及 他 们的 调 整 形 式 .刘 应 安 等 29讨 论了 具 有a r ( 1 ) 误 差 的 线 性 随 机 效 应 模型 的 异 方 差 性 和 相 关 性 检 验问 题 .更 一 般 地 , l in和, 尼 113 0,刘 应 安 等 135 】分 别 研 究 了 具 有ad 印 ) 印 阶 前 相 关 ) 误 差 和a r m a ( 1 ,1) 的 非 线 性 回 归 模 型的 异 方 差 和自 相 关 检 验问 题 , 得 到 了 多个检验统计量及它们的调整形式. 1 3统 计诊断 统计 诊断是上 世纪七、八 十年代中期发展起来的一门 统计 新分支. 它以 广泛的应 用背景、 新颖的 统计思 想、 广泛的 研究内 容和 丰富 地实际成 果 在广大 统计工作 者面前 展现出 一个与 应用结合的 崭新 领域 统计学的出发点是一个数据集, 该数据集往往是根据在实际工作中逐步积累起来 的 历史资料或围 绕某一 特定目 标收集起来的数据, 经初步 加工 整理而成一 为了 通过数 据集研究实际问 题,通常的 做 法是把它纳入某一有效的统 计模型中 进行研究一但是, 全体统计模型都只能是对客观过程的一种近似描述,它不可避免地包含某些假定, 甚 至模型本身也 是一种假定 . 人们自 然有理由 要问: 我们选择的 模型能 不能大体上 反映 所要研究地实际问 题? 它是否与 数据集中 绝大多数的 数据相一 致? 我们所得到的 数 据集中会不会有 个别 数据由 于收 集或整理过程中的疏 忽和其它 种种原因而出 现较大 的误差?另外, 数据集中各个数据点对我们进行统计推断的影响是否大体相仿, 会不 会有某些点的影响特别大?等等一 在使用统计方法解决具体问题的过程中,人们必须 慎重地回 答上述问 题, 才能做出 更加符 合实际的 结论. 这一 点, 在以 往的统 计分析中 常常被忽视, 从而有可能 得到与实际 情况严重不符和的分析结 果. 统 计诊断就是 针对 上述种种问 题而发 展起来的 一 种分析方法, 经过 近三、 四 十 年的发 展, 现已 有了 许多 使用方便的统计 软件包和 一些成熟的 理论.异常点的 识别和影响 分析 现己 发展成为 统 计诊断的主要内容. 对 于 线 性 回 归 的 诊 断 , cook和脸is b erg 阴, 韦 博 成 13) 】等 已 经 做 了 全 面 综 合 的 讨 论 . mcc ull agh 和n el de 户 均, 讨 论了 广 义 线 性 模型 统 计 诊 断 问 题 .weii3 刀 , 宗 序 平 13n 研 究了 指 数 族 非 线 性 模 型 的 统 计 诊断 问 题 .朱 仲 义 13 9) 对 半 参 数 非 线 性 模 型 做 了 统 计 诊 断 和影 响 分 析 一v 入 n g . 助 和fun 梦 401 对半 参数 混 合 模 型 做 了 影响 诊 断 和 异 常 点 检 验 4 硕士论文 具有ar 1 ) 误差的变系数模型的统计分析 的 研 究 一赵为 华 和 冯 予 141 1研究 了 指 数 族 半 参 数 非 线 性 模 型 的 统 计 诊断 和 影 响 分 析问 题 . l 4 本文的主 要工作 本文讨 论具有a 只 ( 1 ) 误差的变 系数模型, 重点在于统 计诊断 方面的 研究. 第二 章主要讨 论误差项具 有一阶自 回归的变 系数模型的 统计推断. 首先给出 具有a r ( 1 ) 误差的 变 系数模型的 定义, 然后得到了 该模型函数系 数的b 样条 估计、方差 估计以 及自 回归 系数的 估计. 在自 回归 系数已 知 且样本容量充分 大时 , 我 们证明了 这样 得到的函 数系数的b 样条估计 要优于不 考虑误差自 回 归的情况. 第三章主要 讨论具有a r ( 1 ) 误差的 变系数模 型的 统计 诊断, 首先介绍 常见的诊断 模型, 基于数据删除模型 给出 函数系 数的诊断公式, 并证明 了 数 据删除 模型与均值 漂移模型的等价性. 而后讨论对模型 误差项进行相关性和异方 差性 检验,分别 得到d 一 检验统 计量和5 介 检验 统计量. 最 后给出 识别 模型 异常点 和强影响 点的诊断 统计量, 得到了 似然比 统计量、 残差、 广义0 沁 k 距离等诊断 统计 量,并用实例验证这些方法的有效性, 硕士论文 具有a r (l ) 误差的 变系 数模型的 统计分析 第二章具有a r ( 1 ) 误差的变系数模型的统计推断 2. 1 引 言 本章 及后面的 讨 论都是以 模型( 1 . 1 . 2) 为基 础. 原则上, 模型中回归 变量t 都可以 是向 量, 但回归 变量为向 量时, 非 参数回归的估计是 十分困 难的一般地, 实际中回归 变量t 都 是标量. 假如我们对模型 ( 1 . 1 .2) 进行n 次观察, 则模型 ( 1 . 1 .2) 又可以写为下面的形式: 片 = xjl 八 (t,)+. 二 十 凡 几 (t,)十 料, 1 =l,2 , , n. ( 2 . 1 . 1 ) 其 中(y , ,t , , 气 2 , , 称)( 1 = 1 , 2, 一n)是 因 变 量y 和自 变 量xl , ,x , 的 , 组 观 测 值, ti 对 应 于 第 1 组 观 测 值( yi , ,气 2 , , 称 ) , ( 戏 (t, ),. ,几(t, )r, ( 1 = 1,. 二 , n)是 未 知 的 回 归 系 数向 量 , 其 中 各 元 素 是 光 滑 的函 数 .文 献 1 1 1 和 12 在随 机 误 差 项 从 , 巧 , , 八 为独立同 分布,且 均值为 零, 方差为口 2 时, 给出了 函 数系数的 b 样条 估计. 本章 在文献【 川和【 1 2 的 基础上, 给出 模型 (21 . 1) 方差的估计, 然后重点 研究误 差 项具有一 阶自 回归 ( a r ( 1 的 变系数模型的 有关统 计推断问 题. 作为 预备知识, 下面 先简要介 绍b 样条函 数及 其主要性 质, 详情可 参见( 4 2 , 砂 3 ) . 1 2 b 样条函数 设: = (zl, 。 一 , 乓 ) ,a 21 .二 zk b 为 区 间 a , b 上的 k 个 不同 的 点 , 称 这 些 点 为 样 条 函数的节点 ( 如以 5 ),m次的样条函数空间为: 5 ( m ,2 ) = s c c 一 , a ,b : 5 在 伙 , 21 , 1 上 是 m 次 多 项 式 ,( 2 .2 . 1) 在节点气 处具有 m 一 1 阶连续的 导函 数 其中c 肺 一a , b 为la , bj 上 具有m 1 阶有界连续 可导的函 数集. m 次 样 条函 数 由 节 点 2 唯 一 确定 , 所 有 节 点 为 : 的 m 次 样 条函 数 的 集 合 s( m , 2) 构 成一个线性空间 , 其基的维 数为 n = m + k 十 1 , k 为节点的 个数一个比 较常用而 优良 的 基 为b 样条函 数基. 定 妇 .l 设 。 式 “ 夕二 2:、 b 为 区 间 a , b 上 的 v 个 点 , 9 为 定 义 在a , bl 上 的 任 意 一 个函 数 , 则 9 在 这 v 个 点 上的 均 差 ( 由 v ided di ff er e n c e) 为 z: 9 = 9 ( 2: ) ; z:,. 一 2: g 一 丛 二 三三 ;全 互 二 二二二三;二业 ,2. 一21 粼 , 2:; 硕士论文具有a r 1 误差的 变系数模型的统计分析 、 , ,2: ,9 一 多9 (、 ),(一 1)!, 、 , ,2: 。 = 器9(z:) /(v 一 1)!, z; , ,2:1 。 = 拼g( 、 )/(v 一 1)1, 若 式 = 2: 。 (a ,b ) ; 若 月 = 2: = a; 若 式 = 2: = 玩 其中, 设 d+ 词d-, 刁 面 商 场不 r 表示9 在: 的 v 一 1 阶左右导 数. a 21 . 二 几 b 为 区 间 a , bl 上 的 节 点 , 称 21 = = 、 +l = a , +2= zj , , 2- 社 +l = zk , 凡褚 +2= = zz(。 +1k, = b. 为一组扩展的 节点 ( e xt e n d edkno ts ) 令 砂(t)= (- 1) , +l (z; + 。 +l 一 月 ) 城 , , 或 。 + , (t一 2) 竺 . ( 2 . 2 . 2 ) 其 中 (t 一 习 了 = (t 一 2) “ ,lt 川 ,zi, , 21+ . + ,(t一 2 广 为 函 数(t 一 z) r 的 均 差 ( 请作 变 量 ) . 由( 2. 2. 2 ) 定 义的 衅(t), 1 = 1 . , n ( =in+ k + 1 )线 性 无 关, 为 样 本 函 数空 间 5 (m, 2)的 一组基, 称为 m 次规 范化的b 样条函 数基( n o rma l 云 男 d b 一 spline b ase) . 下面将给出低次正规化b 样条函数基, 我们限于等距节点来推导二次和三次正规化b 样条函数基的表达式. 当m = 习 时 对 (t)= 气如 (t) 当川 牛 1 时 t一 2, t o1 : ; , : ; , 。 ); , 户 ( t ) = zt+l 一 z t 21+2一 t 21+2一 zt+l 0 t e : ;, , , : ;, : ); 其 它 . 当m =2时 硕士论文 具 有a r ( 1 ) 误差的变系 数模型的统计分 析 对 (t) 一 共 z h ( t 一 丹 ) , ,t 气 , 共 + ,) ; 儿 , + 2 几 (t 一 气 + ,) 一 2 (t 一 气 + , ) , ,t o t毛 + 1, 礼 + 2 ) ; ( 气 +3 一 t ), ,t 21 + 2 , 共 + 3 ) ; 0 ,t 任 ( 胡, 礼 ) u 毛 + , , 。 ) . 当f 3 时 对 (t) 一 奥 6 h j ( t 一 气 ), ,t 任 气 , zt+ : ) ; 人 , + 3 几 , ( t 一 气 , ,) + 3 儿 (t 一 21 + , ), 一 3 ( t 一 21 十 . ), ,t 。 2 ,、 , 2 ,十2 ); 人 , + 3 人 , ( 气 + 3 一 t ) + 3 h ( 气 二 一 t ), 一 3 ( 气 , , 一 t ) , , t 。 气 + 2 , 21 。 ) ; (礼 + ; 一 t) , ,t 。 21 , , , 毛 +。 ) ; l o , 事实 上由 规范化的b 样 条函 数 基的 递推公 式 t 以劝, 共 , ) u礼 。 , co). 砂( t ) = t 一气 气+ .一毛 广一 (t)+气 .+ l一t 气_ 。 +l一毛+l 丁 ,( t) . 可以 写出 其他任 意m 阶的 b 样条 基为了 方便起 见, 在不引 起混淆的情 况下忽略 (2.2. 2) 式 的 上 标 m , 记 m 次b 样 条基 向 量 为 :二 (t)= ( 凡 (t) , , (t) ) r , n = k 七 口 + 1 . 所 以 , 任 意 5 ( t) 。 5 ( m ,2 ) , 存 在a 天 n , 使 得 5 (t ) = 汀 ( t) a , 称 5 ( t) 为 m 次 的 b 样 条 函 数 . m 次 规范化的b 样条函数 基具有如 下主要 性质. ( 1 ) 0 气 ( t ) 1 , 若t 。 毛 润 . + , ;从 ( t) = 0 , 若 , 。 月 润 + 。 + , . (2)对 于 任 意 的 1 “ m , 1 j k + m +l一 1 , 气 (t) 驾 在区 间 zj , , 2+1+ , 线 性 独 立 . (3 ) 毛 气 (t) 乙 为 线 性 空 间 s( m , 2) 的 一 组 基 . (4 ) 对于任意的t 已 a , b 艺 凡 (t) = l ( 2 . 2 . 4 ) ( 5 ) f : (t )dt = 气 。 +1 一 气 m+1 种 节点 将 定 义 区 间 a , b 分 成 k +1个 小 区 间 , 若, 以城 , zj+ 。 + . , 由 上 述 性 质 ( 1 ) 知 , 当 1 = it 一 m , , it ,气 (t)护 0; 当 1 it , 气 (t)= 。 . 所以 , 在 每 一 个 小 区 间 上 只 有 m+l 布 、 n 次b 样 条函数基不 等于0 , 其余均为 0 ,由 此可以 看出,刀 样条函 数具 有局部性, 这种局 部性非 常吸引 人, 在非参 数回归中 得到 广泛的 应用. m 次的b 样条函 数由 节点 唯一确定, 最常见的一 种节点的取法为 均匀节点, 即 k 个节 点 将 定 义 区 间 k+l 等 分 .更 一 般 地 , 设a 气 . 二 乓 b 为 样 条 函 数 的内 部 节 点 20 = a,zt+ 一叭= 共 一 zj- :, h=忍 纽 班 ( 劫存 在 一 个 常 数 城, 使 得 硕士论文具有a 及 1 ) 误差的变系数模型的统计分析 h m 加( 人 ) 、 鱿 和 inax, +, 一 , = 口 (粤 ). k ( 2 .2 . 5 ) 成立, 称满足上述条 件的 节点为 拟均 匀节点( q uasi 刁 面 fo n 刀 如比) 由 (2.2. 5) 式易 知: ( k + 1 ) h ( k + 1 ) 从 nnn ( 八 ) 从 ( b 一 a ) ; ( k + 1 ) h 之 ( k + 1 ) 田 加 ( 的 : 竺1 脸互 竺 m,从 所以 竺竺 * (、 + 1 ) 私 ( 卜。 ) , * _ 0 ( 工 ) . 城一”-一 形 (2. 2. 6) 由 样条函数的定 义知,区间 la , b 上的m次b 样条函 数为具有m-1 阶有界 连续 导 函数的光滑函数. 反过来,任意的一个r 阶的光滑函数都可以由b 样条来逼近. 2 3 独立场合下变系数模型b样条估计 我们考虑变系数模型: 另= 不 1八 (t, ) 十 十 称 几(t, ) + 从 , =1 , 2 , , n. ( 2 3 . 1 ) 其 中以,t , ,为 , , xt z , ,x , ) , (i = 1, 2 , , ” ) 是 因 变 量 y 和自 变 量xl , , x , 的 n 组 观 测 值 , ti 对 应于第 1 组观测值以成 , ,、, , 称 ) ,所 , 八 , 二 、 汽为独立同分布的随机误差项, 助= 0 ,。明= , , 几 (t ) , , 几(t, )(i =l,2 , 川 是 未 知 的 回 归 系 数 向 量 , 其中 各 元 素 是光滑的函数 设 2 = (z, , , 几 ) ,a 气 . 二 乓 ” , 可 取 脚m 的 值 使 得 凡 ( t,) 所 以 我 们 有 忽e y 一 血成 立 从而有 忽e( 旬 = 了a) 一, 了 忽e( 均 = 丫a) 一 , 矛 aa一 a. 即d 为“ 的 渐进无偏 估计. 对 (2. 3. 7) 式两边求期望并取极限得: rssi = 忽e (y t 乌 均 = 恕(必t g ( e 均 + 介 (q cov( 珊 = ( 血) 丁 ( 几 一 月 ) 血+ tr ( 。 2 9 ) 一 。 2介 ( 9 ). 所以 护二 一 一 里 矍 址 一 . n 一 ( k + m+ 1 ) p 上式用到 ( 2 . 3 . 9 ) ( 2 . 3 . 1 0 ) (aa) t ( 几 一 月 ) ( 刁 a ) 二 ( 血) t 入 (血) 一 ( 月 a )t 君 (通 a = ( 注 a ) t 几 (注 a ) 一 ( 才 a ) r ( 血) =0 . 介 ( 9) = tr 认 一 月 ) = n 一 介 ( 君 ) = n 一 ( k + m + 1 ) 夕 2. 4自回归模型 变系数 模型在许多实际问 题中已得到了广 泛的应用, 通常随 机误差项 都假设满足 g 口 “ ” 一 人 白 刁 的 v 假 设, 但 这在 一 些 特 殊的 问 题中 会 显 得 不 合适 当 c ov 叭声 , ) 袭 0, 1 护 j 时,即误差项的不相关性不满足,我们称误差项存在 自 相关性. 处理这类问题的方法通 硕士论文 具 有a r ( 1) 误差的 变系数棋型的统 计分析 常 是 对 误 差 项 拟 合 一 个 宽 平 稳自 回 归 模 型 .比 如 一 阶自 回 归 ( a r ( 1 )模 型 . 从= 奴一 + 乓, 尹 l l(2 4. 1) 其 中 乓 , 1 = 1, ,n是 独 立同 分 布的 随 机 变 量 , 且 e(乓 ) = 0 , e( 扩) = a z 。 因 此 作 为 准 备 知 识,先扼要 地介绍宽 平稳自 回 归模 型的 建模.关于这 方面的 文 献,可 参见1 45 ,4 6 . 设毛 从, t = 1, 2 , 是 一个随 机变量 序列,如果 e (麟 ) = e ( 常 数 ) , c o v (it., 片 一 ) = 入 k= 0 , 1 , 2, 一 ( 2 .4 .2 ) 则 称 从 , t = 1, 2 , 是 一 个 宽 平 稳 序 列 , 或 称 为 宽 平 稳的 . rk 称 为 扭 : , t = 1 ,2 , 的 k 阶自 协 方 差 , y , 称 为 切 , t = 1, 2 , 的 自 协 方 差 函 数 . 八 = 八/ ro,k= 0, 1, 2, (2 .4. 3) 称 为 从 ,t = 1,2, 的 k 阶自 相 关 , 八 称为 从 ,t = 1,2,的自 相 关 函 数 . 显 然, 如 果随 机 序 列扭 , , t = 1,2,的 均 值 为 零 , 方 差 有 限 , 且 co 咖, ,产 , ) = 0 , 1 转 j, 则 从, t = 1, 2 , 是一 个宽平 稳序列. 如果 从, t = 1, 2 , 满足 如下的随 机差分 方程: 麟= 奴一 1 + et , 沪 ! 1( 2 . 4 . 4 其中e, t = 1 , 2,.:是独立同分布的随机序列,e ( 凡 ) = 0 , e( 凡 , ) = 口 , 0 ( 2. 4. 7 )式称为丫 u l e . 认 旬 k er方程. 当我 们获得a r ( 1 ) 模型的n 个样本 观测值肠, , 尸 , 后, 我们通常以 ( 2 .4 .6 ) ( 2 .4 .7 ) 入 =一 n 艺 尸 产 卜 , ,* = 0 ,; ,2 , , n 一 1 作为厂 , 的 估计, 而以 八= 凡/ 元 ,k = 1, 么 , n 一 l 作为八的 估计, 在 (2.4. 7) 式中, 用估计量 代替八得到 元= 从 由 此得到萝 的 估计 ; = 元 / 夕 。 一 艺 从 从 。 / 艺 热 , ( 2 .4 . 8 ) 1 一 2苦 一 1 我 们 称; 为 沪 的 矩 估 计 , 实 际 上 它 是沪 的 最 小 二 乘 估 计 . 令产 = ( 肠 , ,风) r , 则由声 , 的 平稳性, 并 注意 到自 协方差函 数的 对 称性, 即 y , = 八 , 我们有 石 嘴 ) 粼 、 cov俩= 从”纽、. 石 剧 耘 八五 尸 ” 八 私 竺 ” 一 石 切; ) ) 硕士论文 具有a r (1 ) 误差的变系数 棋型的统 计分析 入刁 片 2 ro.腼 片v引介,冷 ,护.丫乙 了了les.eses.吸、 尸尸.1 y0 1沪.广 r0 一一 当 样本数” 充分 大时. 由 ( 2 点 5) 式. 可 得 cov 伽) 二 a z 艺 . 其中 ( 2 .4 . 9 ) “:叫) ,= 二 去 沪 ”犷 一 一 卜 犷 丁 .,: , 一 钟” 一 尹一 :1少 则 “ ) 0一 了 ! 0u 八“n 0甲 ,.1甲 .-.毕。 艺 一 1 二 u111 甲呻.00 1甲00 设 00 00 00 一 沪 00二01 nn nn -.甲。 不难验证 艺 一 1 = f l f . 硕士论文具有a 只 1 ) 误差的 变系数模型的统计分析 2. 5 统计推断 1 5. 1模型的函数系数的估计 定 义 2. 1 如 果 模 型 (23 .1) 的 误 差 项 满 足 (2. 4 .1) 式 , 则 称模 型 为 具 有 一阶自 回 归 ( a r ( 1) ) 误差的 变系数模 型, 模型表示 为: 丁 y , x 一戏 “ , + 气 2几 “ 。 + 二 十 气 叼 全 + “ , l 产 , =州1-1十e ,江 =1, , , n ( 2 . 5 . 1 . 1 ) 其 中仁 , , 1 = 1 ,2 , , n 是 独 立 同 分 布 的 随 机 误 差 , e( e ,) = 。 , e (e 尹 ) = 矿 二 , 护 卜 1, 从= el , 其 它的 条 件 和 (2.3. 1 ) 式同 . 作一些简单的运算可将 (2.5 . 1 . 1) 式化为下式: yt 蹂 一 在7 祠 1八 (tl ) + 在 7石 遇 (tl ) + + 扛 7 凡 , 民 ( tl ) 司 仁 了 八 xtl 月 (t,)一 沪 凡 、 月 (t,-l卜十 凡 凡(t,)一 归 、几(t, 一 j + 乓 ( 2 . 5 . 1 . 2 ) 如果记 只 一 片 一 奴 一 : ,凡 = (x#, 神 xi-l户 , 可(tt)= ( 几 (t,), 几 (t, 一 x) 另 一 yl 沂 二 了 , 元 , = ( 不乙j, 0) , 可 (tl)= (那 t,), 0) 戈 = 鲡

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论