第八篇其他数据分析方法_第1页
第八篇其他数据分析方法_第2页
第八篇其他数据分析方法_第3页
第八篇其他数据分析方法_第4页
第八篇其他数据分析方法_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、864第八篇其他数据分析方法从实用的观点出发,本篇向读者提供一些新近发展起来的建模技术和方法。这些方法包括模糊数学方法、时间序列分析和灰色系统分析,供读者在研究工作中参考、选用。模糊数学方法是20 世纪 60 年代由 l. a. zadeh 首先提出来的。目前, 模糊集合论在各个领域的应用已经十分广泛。实践证明,模糊数学在农业中用于病虫测报、种植区划、品种选育等 方面,在 图像识别 、天气预 报、地质地震 、交通运输 、医疗诊断 、 信息控制 、人工 智能等其它 领域的应用,已初见成效 。目前 看 来, 该学科具有强大 的生命力 和渗透力 ,发展前 景 广阔。因此 ,dps 平台 模糊数学 部

2、分将向读者提供一些目前已被 广泛应用于 解决科 研生产 实际问题 的功能 模块 ,包括模糊 聚类 、模糊 识别 、综合 评判及综 合评判逆问题 的建模分析技术,作为预 报和控制 的有力 工具。灰色系统 理论是 邓聚龙 先生于 20 世纪 80 年代前 期提出的用于 控制 和 预测的新技术。灰色系统理论及其 方法目前已广泛应用于我国 农业、 社会 和经 济 领域,并已取得显著成就。灰色 关联 分析 同经典 的因素 分析方法 相比较 ,将研究 对象 作为一个发展 变化 的系统, 可 对事物 发展 态势进行量化比较 分析。 它目前在农业中应用 较广。灰色 预 测建模 常用 gm(1 ,1)单 序列一

3、 阶线性动态 模型,有 时 也可 建立 gm(2 , 1)模型。后者有两 个特征根 ,其 动态过程 能反映不 同的情况 , 即可 能是单调 的、 非单调 的或摆动 的(振荡 的 )情况 。灰色系统分析,作为 状态 分析模 型,作者 将 gm (1 ,h)模型介绍给 读者, 它可以反映h- 1 个变量 对于因变量 一 阶导 数的影响 。近年来 全球性 的神经 网络 研究 热潮 的 再度兴 起, 主要 的原因在于发展新 型计算机 和人工 智能 新途径 的迫切需要 。基于 神经科学研究 成果基础上 发展出来的 人工神经网络 模型,反映了 人 脑功能 的若干基 本特性 ,开拓了神 经网络 用于 计算机

4、的新 途径 。在这 众多神 经网络 模型中,应用 最广泛的是 多层感知机神经网络 。它的研究 始于 20 世纪 50 年代, 但一直进 展 不大。直到 1985 年, rumelhart 等人 提出了误差反 向传递 学习算 法 (即 bp 算),实 现了 minsky 的多层网络设想。最后 ,作者 介绍了 目前一些 常用的 对 多试 验、多指标 分析 进行 综合分析的方法, 如 meta 分析, topsis综合评价, 以及层次分析方法 (ahp) 等。上述新的分析技术均 可在 dps 平台 上实现。865第 38 章模糊数学方法在自然 科学或社会科 学研究中, 存在 着许 多定义 不很严格

5、或者说具有 模糊 性的概念 。这里所谓 的模糊 性,主要 是指客 观事物 的 差异在中间 过渡 中的 不分明 性,如某 一生态 条件 对某种害虫、 某种作 物的 存活 或适应性可以 评价为“有利 、比较有利、不那么 有利、不利” ;灾害 性霜冻 气候对农业 产 量的影响程度 为“ 较重、严重、很严重 ” ,等等 。这些 通 常是本来 就属于模糊的 概念 ,为处理分析这些 “模糊 ”概念 的数 据 ,便产生 了模糊集合论。根据集合论的 要求,一个 对象对 应于一个集合,要么属 于, 要么不属 于, 二者必居 其一, 且仅居 其一。这 样的集合论本 身并无法处理具 体的模糊 概念 。为处理这些模糊

6、 概念而 进行 的种种 努力,催生 了模糊数学。模糊数学的理论基础 是模糊集。模糊集的理论是 1965 年美 国自动控制 专家查德 (l. a. zadeh) 教授 首先提出来的,近10 多年来发展 很快 。模糊集合论的提出虽然 较晚,但目前在各个领域的应用十分广泛。实践证明,模糊数学在农业中主要 用于病虫测报、 种植区划、 品种选 育等 方面,在图像识别 、天气预 报、 地质地震 、交通运输 、医疗诊断 、信息控制 、人工智能等 诸多 领域的应用 也已初见成效 。从该学科 发展 趋势来看,它具有 极其强大 的生命力 和渗透力 。在侧重 于应用的模糊数学分析中,经常应用 到聚类 分析、模 式识

7、别 和 综合评判等 方法。 在 dps 系统中, 我们将模糊数学的分析方法与一般常规统计方法区 别开来,列 专章 介绍 其分析 原 理及 系统 设计 的有关功能 模块程序的 操作要领,供用户参考和 使 用。第 1 节模糊聚类分析1. 模糊集的概念对于一个 普通的集合a,空间中 任一元 素 x,要么 x a,要么 x? a, 二者必居其一。这一 特征可 用一个 函数1( )0 xaa xxa?=? ?,表示 。这 里 a(x)即为集合 a 的特征 函数。将 特征 函数推广到模糊集, 在普通集合中 只取 0、1 两值推 广到 模糊集中为0,1区间。定义 1设 x 为全域,若 a 为 x 上取值 0

8、,1的一个 函数,则称 a 为模糊集。866如给 5 个同学的 性格稳重 程度 打分, 按百 分制给 分, 再除以 100,这 样给定了一个从域x=x1,x2,x3, x4, x5 到0,1闭区间的 映 射。x1:85 分, 即 a(x1)=0.85 ,x2:75 分,a(x2)=0.75,x3:98 分,a(x3)=0.98,x4:30 分,a(x4)=0.30,x5:60 分,a(x5)=0.60,这样确 定出一个模糊 子集 a=(0.85,0.75,0.98,0.30,0.60)。定义 2若 a 为 x 上的任一模糊集, 对任意 0 1, 记 a =xx? x,a(x) ,称 a为 a

9、的 截集。a是普通集合 而不是模糊集。 由于模糊集的边界 是模糊的, 如果要 把 模糊 概念转化为数学 语言 ,需要 选 取不同的置信 水平 (0 1) 来确定其隶 属关系。截集就是将模糊集 转化为普 通集的方法。模糊集 a 是一个 具有 游移边界 的集合,它随 值 的变小而增大, 即当 12时, 有 a1a2。定义 3模糊集 运算定义 。若 a、b 为 x 上两 个模糊集, 它们的和集、 交集和 a 的余 集都是模糊集, 其隶属函 数分 别定义 为:(a b) (x)= max ( a(x),b(x) ) (a b) (x)= min ( a(x),b(x) ) ac (x)=1 a(x)

10、关于模糊集的和、交等运 算,可以 推 广到任意多个模糊集合中去。定义 4 若一个 矩阵 元素取 值为0,1区间 内,则称 该矩阵 为模糊 矩阵 。同普通矩阵 一样 ,有模糊 单位阵 ,记为 i;模糊 零矩阵 ,记为 0;元 素皆为 1 的矩阵用表示 。定义 5若 a 和 b 是 nm 和 ml 的模糊 矩阵 ,则它们的乘积 c=ab 为 nl 阵 ,其元素为 :()kjikmkijbac=1, i=1,2,n;j=1,2, ,l,符号 “ ”和“” 含意 的定义 为 ab=max(a,b),a b=min( a,b)。模糊矩阵乘 法性 质包括 :1) (ab)c=a (bc);2) ai=ia

11、=a;3) a0=0a=0;4) a=a;5) 若 a、b 为模糊 矩阵 且 aij bij (一切 i,j),则 ab,又若 ab,则 ac bc,cacb。8672模糊分类关系模糊 聚类 分析是在模糊分类关 系基础上进行 聚类 。由集合的 概念 ,可给 出如下定义 :定义 6n 个 样品的 全体所 组 成的集合 x 作 为全域,令 x y=(x,y)x x,y y , 则称 x y为 x 的全域乘积 空间。定义 7设 r 为 x y上的一个集合,并且满足:1) 反身性:(xi,yi) r,即集合中 每 个元素和它自己 同属一类;2) 对称性:若(x,y) r,则(y,x) r,即集合中 (

12、x,y)元 素同 属于类 r 时,则(y,x)也同属于 r;3) 传递性 :(x,y) r,(y,z)r,则 有(x,z) r。上述三 条性质称为等 价关系, 满足 这 三条性质的集合 r 为一分 类关 系。聚类 分析的 基本思想 是用 相似性尺度 来衡量事物 之间的 亲疏 程度 ,并 以此来实现分类,模糊 聚类 分析的实 质就 是根据 研究 对象 本身的属性来构造 模糊 矩阵 ,在此基础上根 据一定的隶属 度来确定其分 类关 系。定理 1 r为 x 上的一个分 类关 系的 充分 必要条件 是:1) rij=1;2) rij=yji;3) r? rr。这三个 结论等价于分 类关 系的 反身性

13、、对称性和传递性 。定理 2 r为 x 上的一个模糊分 类关 系的 充分必要条件 是 :对每一个 (01)都使 r 为普通的分 类关 系。这说明 当模糊分 类关 系 r 确定之后 ,对于给定的 0,1,便可相应 地得 到普通分类关 系 r,也就是说可以 决定一个 水平的分 类。例如给定下面一个模糊分类关 系:=141.047.047.047.041.0141.041.041.047.041.0148.062.047.041.048.0148.047.041.062.048.01r,根据不 同水平的 进行 分类:(1) 当 0.62 1 时,=1000001000001000001.000001

14、r,此时共 分为 5 类,即 x1 、 x2 、 x3 、 x4 、 x5 。868(2) 当 0.48 0.62 时,=1000001000001010001000101r,此时分 为 4 类,即x1,x3 、 x2 、 x4 、 x5 。(3) 当 0.47 0.62 时,=1000001000001110011100111r,此时分 为 3 类,即x1,x2,x3 、 x4 、 x5 。(4) 当 0 41-=baxbaxbaxxa01)(2。若有 n 种类型 m 个指标 的情形,则第 i 种 类型在第 j 种指标 上 的隶属函 数是 :+-=xbabaxabaxaxaaxbabaxba

15、xxaijijijijijijijijijijijijijijijijij)2()2()2(2)2()2()1() 1()1(2) 1()1(01110)(,其中)1(ija和)2(ija分别是第 i 类元素第 j 种指标 的最小值和最大 值,222ijijb=,而2ij是第 i 类元素 第 j 种指标 的方 差。(2) 若有 n 种类型(a1,a2,an),每 类都有 m 个指标 ,且均 为正态型 模糊变量 , 相 应的参数分 别为) 1(ija,)2(ija,ijb(i=1,2, ,n;j=1, 2, m)。其中,)min()1(ijijxa=,)max()2(ijijxa=,222iji

16、jb=,而2ij 是 xij的方 差。待判别对象b 的 m 个 指标 分别具有 参数 aj,bj (j=1,2,m),且 为正态型 模糊 变量 ,则 b与各个 类型 的贴近度为:()+-, 将ijr 变成jb ;若jijbr, 将ijr 变成空元 。从 而得到新的 rij,用 rij 表示 :=)()(jijjijjijbrbrbr(3) 求下确界 。 对 上铣后所得矩阵 的各 行求下确界 , 得向量 ur=(ur1, ur2, ,urn ),并定义空元 的下确界 为 1。(4) 平铣。 将上铣出来的 矩阵 称为平 铣矩阵 ,即对每一个 元素 j 分别用jb 平铣 r 的第 j 列 :若jij

17、br,将ijr 变成jb ;若jijbr,将ijr 变成空元 。这 样得到884新的 rij,以ijr表示 :=)()(jijjijjijbrbrbr,(5) 划元。 对平 铣后的矩阵 , 逐行划去 该行大于上界即第 i 行大于 uri的元素。(6) 判别 。 若原 方程有解 ,则上一步所得 矩阵 的每 一列 都有未 被划去 的非空白元素。(7) 求解。 从经 过划元后 所得的矩阵 中的 每一列,选 定 一个 非 空白、 且未被划元的元素 ,对这些 当选元 素逐行取上确界 ,并规定空 集 的上确界 为 0。这 样得到的一 组 解为 “拟极小解 ” 。当 被选元素不同时, 可得到多 个“ 拟极小

18、解” 。最后 得 到的解之所以 称为“拟极小解” ,因为它 们 不一定都是极小 解,它们相互之间还可 能存在重合或优 劣的模糊 关系, 需进 一步进行 筛选。实 际上, 当方程经判别有解 时, 第三步 所求 的上界就是方 程的最大解 。应用 dps 平台 求 解模糊 关系方 程 时,当模糊方 程 有解 时,系统 将给出 最大解和最小解, 如模糊方 程无解 时则提示没有解 。2dps 平台的操作示例在平台 上求解模糊 关 系方 程时, 其数 据编辑 格式 是:行为因素 集,列 为评 语集,每一行为因素 集 u 中某 一单因素 的评 价结果,最后 一行 存放整个因素 集 u 的综合评价结 果,然后

19、将数据定义 成数据块 。如对某单位的管理工作 进行 “ 民意测验” , 得综 合评价矩阵 和最终评价结果, 并 按系统 规定格式 编辑 整理数据和 定义 数据块,如图 38-7。很好较好一般差政治思想工作(x1) 0.04 0.30 0.40 0.26 精神文明建 设(x2) 0.24 0.28 0.28 0.20 行政及其 管理(x3) 0.10 0.34 0.40 0.16 职工组织纪律(x4) 0.02 0.26 0.40 0.32 人才培训 工作(x5) 0.13 0.28 0.42 0.17 学术科研工作 (x6) 0.14 0.27 0.30 0.29 后勤管理工作(x7) 0.0

20、3 0.14 0.42 0.41 整个因素 集 u 综合评价0.15 0.29 0.34 0.22 评价矩阵图 38-7 求解模糊 关系方 程的数 据编辑 、定义示 意图然后,在 菜单下选择 “模糊数学 模糊 关系方 程”功能 项,回车执 行后即 得到归一化之 后的分析 结果, 详见于后。注意: 本系统 最多可 处理 50 个因子的因子集。输出结果最小解xi最大解归一处理后结果0.2200 0.2200 0.1325 8850.1500 0.1500 0.0904 0.2900 0.2900 0.1747 0.0000 0.2200 0.1325 0.3400 0.3400 0.2048 0.

21、0000 0.2200 0.1325 0.0000 0.2200 0.1325 第 6 节综合评判逆问题1方法简介前面的模糊 综合评判 和模糊 关系求解 是综合评判 的正反两 个方 面。由于 权重分配 a 的 确定并无通用公 式,所以它的正 确与否往往 只能取决 于专家 的判断 或经验,而这些 又是很难用数学 公式表 达出来的。 与之相反,权重分配 b 可以 通过实践的 检验建 立起来。由r 和 b 反过 来求 a,有利于总结专家 的经 验,使它得 到量化。 同样道理, 由 a 和 r 而求 r 可以 帮助 我们检验 建立起来的数学模型是否合适。从这个 角度 来看,综合评判 的逆问题比其 正问

22、题 更有意义。上面介绍 的模糊 关系方 程求解,即求解综 合评判逆问题 时,其 方程可 能有解 ,也可 能无解 。有解 时, 解也可 能有 多个,这 需根 据实际情况 作出 恰当选择 。若无解,又应当 怎么办呢?dps 系统提供 根据贴近 原则解模糊 关系方 程的方法。首先选 择一些 备择解 的集合, 设它们 为 j= a1,a2,an,然后用 贴近度原则在备择 解集a1, a2, , an 中选 取一个 ai 作为模糊 关系方 程 xr=b 中的 x。将 ai与 r 进行 合成:=nnbrabrabraooo.2211求出 a 之后,再 用贴近度公式)1(,21),(bababaiii-+=

23、分别求出 b 与a1,a2, an的贴近度,选 最大者作 为 近似的 x*,将它 作为方 程的近 似解。2dps 平台操作示例根据给 定的评估数据(评判 矩阵 r、最终的评价结果 b 和备择权重 方案 a,给出与预定若干 个权重数分 配 方案的贴近程度 ,从 而确定出该类评 估近似的 权分配系数。这是一种近似求解模糊 关系方 程的方法, 也可 用来 评价某 一类量对 于某些标准定量的 贴近程度 。(1) 评估集合。 评价矩阵 的数 据编辑 和定义格式 是行为因素 集,列 为评 语集。每一行为因素 集 u 中某 一单因素 的评 价结果, 最后 一行存放 整个因素 集 u 的综合886评价结果,

24、再将数据定义 成 数据块。例如 ,对某品牌的自行车进行 评价,已 知因素集合 u= 外型,质量, 价格 ,评语集合 v= 很 好,较好,一 般 ,较差,其评价矩阵 数据 可按图 38-8 格式定义 。(2) 可能的 权分配方案集合 (a)的矩阵 数据编辑 和定义 。每一行为一个 权的分配方案,每 一列 为某一个 因素 的权重。数 据编辑 后将数据定义 成公式块。 如上例根据对顾客 的心理分析, 提出 了四种可能的权 分配方案,其数 据按图 38-9 方式编辑和定义 。 注意,此处的数 据块定义 时, 须在按下 ctrl 的 同时拖动鼠标 。因素 评语很好较好一般差外型0.2 0.7 0.1 0

25、.0 质量0.0 0.4 0.5 0.1 价格0.2 0.3 0.4 0.1 最终评价值0.0 0.8 0.2 0.0 图 38-8 贴近度解模糊 关系方 程评语集及评 价结果数据编辑 定义 图外型质量价格第一种 权分配方案:0.2 0.50 0.30 第二种权分配方案:0.5 0.30 0.20 第三 种权分配方案:0.2 0.30 0.50 第四种权分配方案:0.7 0.25 0.05 图 38-9 贴近度解模糊 关系方 程权重备择方案数据编辑 定义 图完成评 估数据(评判 矩阵 r)、 最终的评价结 果 b 以及备 择权重分配 a 的数 据的编辑 、定义 之后,再进 入菜 单操作,在 菜

26、单方式下选择“模糊数学 综 合评判逆问题 ”分析 功能 项,回车 后便可得到归 一化之后的分析 结果。分析结果.贴近度分析结果第 1组的贴近度=0.6500 第 2组的贴近度=0.7000 第 3组的贴近度=0.6000 第 4组的贴近度=0.8000 .近似的权重方案第 1 个因素的权数=0.7000 第 2 个因素的权数=0.2500 第 3 个因素的权数=0.0500 从上述 分析 结果可以 看出,在 权重备 择集中应选a4作为近似的 x*,即x* = (0.7,0.25,0.05) 采用此 方法, 如果备 择权分配方案太 少,计算 结果会不太理想。因此 在实 际应用时, 为取得较 满意

27、 的结 果,应 当尽可 能多地建立一些 权重分配方案。887参考文献高素恬1981模糊相似优先比在农业 气候相似分析中的应用 气象j,第 7 期葛苏林1985模糊子集模糊关系模糊映射m 北京:北京师范大学出版社贺仲雄1983模糊数学 及其 应用m 天津:天津科技出 版社汪培庄 1983模糊集合论 及其应用 m 上海:上海科学技术出 版社吴万铎 ,吴万钊 1988模糊数学 与计算机 应用m 北京:电子工业出 版社肖位枢1992模糊数学 基础 及其应用m 北京:航空工业出版社杨崇瑞 ,耿济国1991农业病虫模糊分析 预报m 合肥:安徽教育出版社888第 39 章灰色系统分析现代科 学技术在 高度

28、分化的基础上 高 度综合的 大趋势,导致了具有 方法论 意义的横断学 科群的出 现。横 断学科揭示了事物 之间更为深刻 、更具本质性 的内在联系, 大大 促进了 科学技术的 整体化进程 ;许 多科学领域中 长期难以解决 的复杂问题 随着新 兴横断学科的出 现迎刃 而解; 人们对自然 界和客观事物 演化规 律的认识也由于 横 断学科的出 现而 逐步深化。我国 学者 邓聚龙 教授 于 20 世纪 80 年代前期提出的用于 控制 和预测的新 理论、新技术的灰色系统理论和方法,目前已广泛地应用于农业和社会 经济等 领域, 并取得 了显著成就 。与研究 “随机不 确 定性”的概率统计 和研究 “认知不

29、确定性”的模糊数学 不同,灰色系统 理论的研究 对象是“部分信息 已知,部分信息 未知”的“ 小样本” 、 “贫信息 ”不确定性系统。 它通过对“部 分”已知信息 的 生成 、开发去 了解、认识现实世 界,实 现对系统 运行行为和演化 规律的正确把 握 和描述。灰色系统模 型对试验观测数 据及其 分 布没有什么特殊的 要求和限制,作 为一种十分 简 便、易学易用的新 理论,灰色系统理论具有 十分 宽 广的应用领域,并深受各领域研究 人员和实 际工作者的 喜爱 。本 章向用户提供一些 常用灰色系统的分析处理技术 及其功能 模块,供用 户参考 使 用。第 1 节关联度分析客观世 界中存在着的 大大

30、 小小 的各 类 系统, 都是由 许多因素 组成的。这些系统及系统 因素 之间, 相互关 系非常 复杂 。 特别是表面现象变化 的随机性 容易 混淆人们的直觉 ,掩盖 事物 的本 质,使人们在 认识、分析、 预测和 决策时得不到 充分全面的信息 ,不容易 形成明 确的概念 。因此 ,不仅不同系统 之间的 关系是灰的,同系统中 不 同因素 之间的 关 系也是灰的。 人们一时 会分不清哪些因素关 系 密切,哪些因素关 系不密切,也就 是说难以找到主要 矛盾 ,抓住 主要特征 与主要 关系。为此 ,灰色系统 理论提出 了 关联 度分析的 概念 ,其目的 就是通过一定的方法 理清系统中各 因素 间的

31、主要 关系, 找出影响最 大的因素 ,把握矛盾 的主要 方面 。如各类产 业中 哪 个项目的 收入 影响 产值最明显 ,这种 影响程度 表明有关生产 和 销售 系统之间或系统 内部各因素 之 间的 关联 性。对两个系统 或两 个因素 之间关联 性大 小的量度 ,称为关联 度。它描述 系统发展过程 中因素 间相对 变化 的 情况 ,也就是变化 大小、方向 及速度等 指标 的相对 性。如果两 者在系统发展过程 中 相对 变化基 本一 致,则认为两者关联 度大;反 之,两者关联 度就 小。可见,灰色 关联 度分析是 对于一个系统发展变化态势 的定 量描述889和比较 。只 有弄清楚 系统 或 因素

32、间的这种 关联关 系, 才能对 系统 有比较透 彻的认识,分清哪些是 主导 因素 ,哪 些是 潜在因素 ,哪 些是 优势而哪些 又是劣势。所以 ,对于一个灰色系统进行 分析研究时,首先要解决 如何从随机的时间序列中找到关联性,计算 关联 度,以便为因素判别 、优 势分析和 预测精度检验等提供 依 据,为系统 决策打 好基础 。因此 说,灰色 因素 间的 关联 度分析,实质上是灰色系统分析、预测、 决策 的基础 。灰色系统 理论的 关联 度分析 与数理统 计学的 相关 分析是 不同的, 两者的区 别在于 :第 一, 它们的理论基础不 同。关联 度分析 基于灰色系统的灰色过程 ,而相关分析 则基

33、于概率论的 随机过程 ;第二,分析方法 不同。关联 分析是 进行 因素 间时间序列的 比较 ,而相关 分析是 因素 间数 组的比较 ;第三 ,数 据量要 求不 同。关联分析 不要 求数据太多,而相关 分析 则需有足 够的数 据量;第 四,研究 重点不同 。关联 度分析 主要 研究 动态过程 ,而相关 分析 则 以静态研究 为 主。 因此 ,关联 度分析适应性更 广,在用于 社会 经济系统中的应用更有其 独到之处。目前, 关联 度分析应用十分广泛,几 乎渗透 到社会 和自然 科学各个领域,如农业、 教育 、卫生、政法、环 保、军事、地理 、地质 、石油 、水文、气象 、生物,等等 。尤其 在社会

34、 经济领域, 如预测宏观经 济的发展 态势 、国民经济各部 门投 资效益、区域经 济优势分析、技术经济的方 案评价、产业结构 的调整方向 以 及微观经济的因素 分析 等方面,都 取得 了较好的应用 效果。1原理与方法简介关联 度 分析一 般包括 下列计算 和步骤: 原始 数 据变换; 计算 关联 系数 ; 求关联 度; 排关联 序; 列关联 矩阵 。在应用中是 否进行 所有步骤 ,可视具体情况 而定 。设有 m 个时间序列 :)()(2)(1)2()2(2)2(1)1 ()()1 (2)(2)1 (1)(121mnmmnntnttxxxxxxxxxxxxntlllllllll亦即,)(,),(

35、,)(0)m(0)2(0)1txtxtxl,t=1, 2,n ,n 为各序列的 长度即 数 据个数,这m 个序列代 表 m 个因素 (变量 )。另 设定时间序列 : x0(0)(t) ,t=1, 2, ,n ,该时间序列 称为母序列, 而上述 m 个时间序列 称为 子序列。 关联 度是 两个序890列关联 性大 小的度量 。根据 这一观点, 可给 关联 度一个 量化 模型,其计算 方法 与步骤 具体叙 述如 下:(1) 原始 数 据变换由于系统中各因素 的 量纲(或单 位 )不一定相同 ,如劳动力为人 ,产值为万元 ,产量为吨等 ,且有时数 值的数 量级相差悬殊 ,如人均收入 为几百 元,粮食

36、 每公顷产量为几千 公斤,费用为几十万元,有些产业产 值达百亿元,有些 产业才几万元,等等 ,这 样 的数 据很 难直接 进行 比较 ,且 它们的几何 曲线比例也不 同。因此 ,对原始 数据需要 消除量纲(或单 位),转换 为可比较 的数 据序列。目前,原始 数据的变换有以下几 种常用方法 :均值 化变 换。先分 别求 出各个序列的平均值 ,再用 平 均值 去除 对 应序列中的各个 原始 数据,所得到 新的数 据列, 即为均值 化序列。 其特点是 量纲 为一,其值大于 0, 并且大部 分近于 1,数列 曲线互相相交 。初值 化变 换。分别用同 一序列的 第一个数 据去除 后 面 的各个 原始

37、数据,得到新的 倍 数数列, 即为初 值化数列。 量 纲为一,各 值均 大于 0,且数列 有共同的起点。 标准化变 换 。先分 别求出各个序列的平均值 和 标准差,然后将各个 原始 数据减去 平均值 后再 除以标准 差,这 样得到 的新数 据序列 即为标准化序列。 量纲为一, 其均值 为 0,方 差为 1。一般情况 下,对于较 稳定 的社会 经济 系统数列作 动态 序列的 关联 度分析时,多采用初值 化变 换,因为 这 样的数列 多数是 增长的趋势。若对原始 数列 只 作数 值间的 关联比较 ,可用均值 化变 换,譬如进行 产业结构 变化 的关联 分析, 自然 因素周期性变化 的关联 分析 等

38、。(2) 计算 关联 系数经数 据 变换的母数列 记为x0 (t) , 子数列 记为 xi (t) ,则在时 刻 t=k 时母序列 x0 (k) 与子序列 xi (k) 的关联 系数 l0i (k)可由下 式计算 :max0maxmin0)()(?+?+?=kklii,式中?0i (k)表示k 时刻两比较 序列的 绝对差,即 ?0i (k)= x0 (k)- xi (k) (1i m);?max和?min分别表示所 有比较 序列各个时 刻绝对差中的 最大值与 最 小值。因为比较 序列 相交 ,故一般 取?min=0; 称 为分辨系数, 其意义是削弱 最大 绝对差数值太大引 起的 失真,提 高关

39、联 系数 之间的 差异显著 性, (0,1),一 般 情况 下可取 0.10.5。关联 系数 反映两 个被比较 序列在 某一时 刻的紧密(靠近)程度 。如在?min时刻,l =1;而 在?max时刻则关联 系数 为最小值。因此 ,关联 系数的 范围为 0r0b,r0b r0c, 则 r0a r0c。(4) 排关联 序将 m 个子序列 对同 一母序列的 关联 度按大小顺序 排列起来, 便组 成关联 序,记为 x 。 它直接反映 各个 子序列 对于 母序列的“优劣” 关系。若 r0a r0b,则称 xa 对于相同 母 序列 x0有优于 xb 的特点, 记为|00xxxxbaf;若 r0a lmm则

40、称 母 序列 yi 相对 于其他母序列 为最 优, 或者 说从 yi 对于子序列 xj (j=1,2, ,m)的关联 度来看,序列 yi 是系统 最优序列, 并记为: ijyyf,j=1, 2, n;ji,若有:1111nnkikjkkrrnn=?,j=1,2,n;ji,则称 母 序列 yi 相对 于其余母序列, 或相对 于子序列 xi (i=1,2, ,m)的关联 度是 准最优的, 并记 为:jiyy f,j 1 ,2,n,ji。若关联 矩阵 r 为下三角矩阵 ,即:893nmnnnrrrrrrrrrr321333231222111mmmm则称 y1相对 于yi (i2,3,n) 是最优势

41、的。2dps 平台的操作步骤在 dps 平台 上, 数据编辑 方式一般是前 面 p 列为子序列,后面 q 列为母序列,每一行为一个 样本(或 某一时 刻)的数 据。若无指定 的母序列数 据,对有 q 个因子序列、 n 个时 刻的资料 输入顺 序为:因子序列x11x12x13x1q时x21x22x23x2q刻xn1xn2xn3xnq这时系统 会自动依次 将各组作为母序列, 其余为子序列, 试计算 关联 矩阵 并对因 子进行 排序。若有 p 个子 序列、 q 个母序列、 n 个时 刻的时间序列 资料 ,其数据输入、编辑 、定义 数据块 的顺序为子序列在 左,母序列在 右,方 式为:子序列母序列x1

42、1x12x13x1py11y12y13y1q时x21x22x23x2py21y22y23y2q刻xn1xn2xn3xnpyn1yn2yn3ynq数据输 入并编辑 好之 后定义 数据块, 然后进 入主菜单,选 择“其他方法 灰色系统 关联 分析 ”功能 项 。按回车执 行 时,系统 还需用户根据分析 要求 作出一些选 择(对每项选择系统 都有默认值, 即每次按回车 也可 得到分析 结 果):(1) 在系统提 示下输入母 序列的个数 后回车 。如果不 指定 母序列数目, 按回车键即可 。(2) 在系统提 示下选择数据 转换 方式。一 般 为均值 化。(3) 选择数 据转换 方式之 后,系统提 示用

43、 户输入分辨系数,这时 如直 接回车则取分辨系数的系统 默认值 (0.1)。(4) 最后 ,系统 询问是否将 分析参数 ?min取值 为 0。如直接回车 或键入“y”后再 回车 则 将参数 ?min取值 为 0;如 键入“ n” 后再 回车 ,则参数 ?min的取 值由各个数 据序列各个时 刻绝对差 值的比较 来确 定。894最后 系统 输出分析 结 果,包括数 据转换结 果、母序列 与其他因子序列的 绝对差值、最大 差值?max、 关联 系数 及其关联 序等等 。3应用示例(1) 无母序列 情形。设有下 述 4 组时间序列, 若依次将各组作为母序列, 其余为子序列, 试计算 关联 矩阵 并对

44、因 子进行 排序。在 dps 平台 的编辑 状态 下,按图 39-2 方式编辑 定义 待分析数 据块。图 39-2 关联 分析的数 据编辑 、定义示 意图然后在 菜单下执行灰色 关联 分析选 项 功能 ,在分析 过程 中对数据 进行 均值 化变 换 ,分 辨系数 取 0.1,参数 ?min取值为 0,不输出绝对 差值矩阵 ,输出 结果如下:均值 化变 换结 果(略) 最大差值 max=0.26298 x1 和其它因 子的关联序 :no. 因子关联 系数x3 x3 0.4815 x2 x2 0.3159 x4 x4 0.1283 最大差值 max=0.16994 x2 和其它因 子的关联序 :n

45、o. 因子关联 系数895x3 x3 0.2564 x1 x1 0.2384 x4 x4 0.1470 最大差值 max=0.22529 x3 和其它因 子的关联序 :no. 因子关联 系数x1 x1 0.4465 x2 x2 0.3132 x4 x4 0.1270 最大差值 max=0.26298 x4 和其它因 子的关联序 :no. 因子关联 系数x2 x2 0.2086 x3 x3 0.1450 x1 x1 0.1283 关联 矩阵x1 x2 x3 x4 x1 1.0000 0.3159 0.4815 0.1283 x2 0.2384 1.0000 0.2564 0.1470 x3 0.

46、4465 0.3132 1.0000 0.1270 x4 0.1283 0.2086 0.1450 1.0000 (2) 有母序列 情形。当指定某 一组或多 组 数据为母序列时,这时母序列数 据必须放在数 据矩阵 右边。 例如,王淑荣 (1995)应用灰色 关联 分析 大豆主要 数量性状的选 择, 通过田间调查株 高、主茎节数、 单株荚 数、 单株粒 数及室内考种测 得百粒重等诸 项指标 。现以 这些 因素 作为子因素 , 以 大豆产量作为母 因素 进行 分析。先将试验观 察数据在 dps 平台 上按规定格式 编辑 和定义 ,如图 39-3 所示 。图 39-3 灰色 关联 分析的数 据编辑

47、与定义 (子序列在 左,母序列在 右) 按图 39-3 方式编辑 定义 数据之后 ,在菜单下选择“其 他方法 灰色系统 关联分析 ”功能 项。执行灰色 关联 分析时, 按系统提 示输入母序列个数1之 后再 回车,数据转换 方式选择标准 化,分辨系数 取 0.1,参数 ?min的取值从各个数 据序列896各个时 刻的 绝对差值的比较 来确定。分析 结束时系统 输出如下结 果:均值化变 换结果:株高主茎节数 单株荚数 单株粒数百粒重产量1.0733 1.0975 0.9966 0.9858 0.9609 1.0801 0.8240 1.0284 1.1690 1.1848 0.9121 0.923

48、8 1.0120 1.0514 0.9138 0.9344 0.9609 0.9775 0.9439 1.0975 1.2000 1.1017 1.0803 0.9830 1.0488 0.9670 0.9621 0.9937 1.0858 0.9828 1.0420 0.9517 0.7414 0.7288 0.9826 0.9991 0.9194 0.8442 0.8552 0.9225 1.1021 0.9386 1.0719 0.9363 1.0552 1.0727 0.9935 1.0896 1.0365 1.0207 1.3103 1.2480 0.9989 1.0108 1.02

49、83 1.0054 0.7966 0.8276 0.9229 1.0147 产量 与其它因 子的绝对差值:x1 株高0.0068 0.0998 0.0345 0.0391 0.0659 0.0428 0.0192 0.0177 0.0257 0.0136 x2 主茎节数0.0174 0.1046 0.0740 0.1145 0.0158 0.0475 0.0944 0.1533 0.0099 0.0094 x3 单株荚数0.0835 0.2452 0.0637 0.2170 0.0208 0.2578 0.0834 0.0345 0.2996 0.2182 x4 单株粒数0.0943 0.26

50、10 0.0431 0.1188 0.0108 0.2703 0.0161 0.0169 0.2372 0.1871 x5 百粒重0.1191 0.0117 0.0166 0.0974 0.1030 0.0165 0.1634 0.0961 0.0119 0.0918 最大差值 max=0.29956 产量 和其它因 子的关联序 :no. 因子关联 系数x1 株高0.5132 x2 主茎节数0.4309 x5 百粒重0.4024 x4 单株粒数0.3330 x3 单株荚数0.2450 关联矩阵株高主茎节数 单株荚数 单株粒数 百粒重产量0.5132 0.4309 0.2450 0.3330 0

51、.4024 从分析 结果来看,大 豆主要 数量性状 与产量之间的 关联 度第一位是株 高,其次是主茎节 数, 再其次分别 是百粒重、单 株粒 数和 单株荚 数。第 2 节灰色动态 (gm)建模基本原理预测,实 际上是建 立 模型的一种 过程 ,即根 据过去和现在已 有的信息 建立一个从 过去引 伸到未来的模 型 ,灰色系统的gm 模型就具有 这种作用。 但作 为预 测模型,主要 指标必 须具有 足 够的精度。为此 ,应首先 弄清楚 灰色 动态 gm 模型的建模 原理与 方法。1灰色动态建模原理灰色 预 测建模是 以灰色模 块概念 为基础 的。灰色系统 理论认为一切随 机量 都是在一 定范 围内

52、、一 定时段 上变化 的灰色 量及灰色 过程 。对于灰色 量的处 理,不是去寻求它 的统 计规律和概 率分布,而是从 无规 律的原始 数据中找出规律 ,即对数据通过一 定方式处 理后, 使其成为较有 规律的时间序列数 据,再建立模 型。因897为无论客观系统 怎样复杂 , 它总是有关联 、有整体功能 、 因而有序的。 因此 ,作为表现系统 行为特征 的数 据 ,总是蕴含着某 种规律。经 过一定方式处 理而 生成 的序列数 据,称 为“模块” 。它 的几何意 义是 指生成 序列数 据在时间和数 据二 维平面上所给的连续 曲线与其底部(即横坐 标)的总称 。由已 知数据列构成的模 块 ,称为白色模

53、 块, 而由白色模 块外 推到未来的模 块,即由预测值构成的模 块,称 为灰色模块。一般情况 下,对于给 定的原始 数据列 :,.,)()0()3()0()2()0()1()0()0(nxxxxx=,不能直接用于建模, 因为 这些数 据多为随 机的、 无规 律的。 若将原始 数据 列经 过一次累加生成 ,可获得新数 据列:,)()1()3()1 ()2() 1()1()1() 1(nxxxxxl=,其中=ikiixx1)()0()() 1 (。新生成 的数 据列为一 单调 增长的曲线 ,显然它增强了原始 数列的 规律 性,而随机性 被弱 化了 。对于非负 的数 据列, 累 加的次数越多,随机性

54、 弱化就越 明显且规律性越增 强,因而比较 容易 用指数函数 去逼近。 可见,这 样的数 据处 理能 够达到两 个目的 :(1) 弱化了原始 数据列的 随 机性 而找到了 其 变化 的规律性 。(2) 为建立动态 模型提供 了 中间 信息 。对于生 物学、 社会 经 济学等系统,应用 微分方 程便于描述其内部物理 或化 学过程动态特征。灰色 理论之 所以能够用来建 立微分方 程模型,是 基于下述概念 、观点、方法和途径 。? 灰色 理论将随机量 当 作是在一 定范 围内变化 的灰色 量,将随机过程 当作是在一 定幅区和一 定时区 变化 的灰色 过程 。? 灰色 理论将无规 律的 原始 数据生成

55、 后,会先使其成为较有 规律的生成 数列再建模。 所 以,灰色 gm 建模实 际上是生成 数据模型,而一般建模 所用的是 原始数据模型。? 通过 gm 模型得到 的数 据,必须经 过逆生成 还原后 才能有 用。? 灰色 理论是 针对符合 光滑 离散函数 条件 的一 类数列建模,一般原始 数据作累加生成 后可以 得到这样的 光滑 离散函数。? 灰色 理论认为微分方 程是背景与各 阶导 数(灰 导数)的某 种组合(线性或非线性的)。? 灰色 理论通过灰数的 不同生成 ,数 据的不同取 舍,不同级的残差模 型的补充,来 调整 、修正、提 高模 型的精度。? 对于 高阶系统, 可由一 阶的 gm 模

56、型群建立状态 方程解决 。8982常见的线性微分拟合模型gm ( n,h )模型为 n 阶 h 个变量 的微分方 程,不同 n 与 h 的 gm 模型 有不同的意义和用 途,要求有不同 的数 据处 理。 大体可归为以下三 类:(1) 作为预 测模 型,常用 gm (n,1)模型 。即只有一个 变量 的 gm 模 型,对数据列要求 是“综合效果” 的时间序列。由于n 越大,计算 越复杂 ,但精 度未必就高,因此 一般取 n 在 3 阶以 下。最常 用的 n=1 阶 模型,计算 简单 ,适用性广,记为 gm (1 ,1),称为单序列一 阶线性动态 模 型。gm (1 ,1)模 型的微分方 程为:u

57、axtx=+) 1()1(dd,系数向 量:a ?=a,t。因 n=1,h=1,故矩阵 a=0,累加矩阵 b 为:+-+-+-=111)()1(21)3()2(21)2() 1(21)1() 1()1() 1()1 () 1(mmnxnxxxxxb,常数项 向量:yn = ( x(0)(2),x(0)(3), ,x(0)(n)t,用最小 二乘法求解 a ?:nttyabbb1)(?-=,并代入 微分方 程的解 ,得到时间 函数 :aueauxtxat+-=+-)0() 1(?) 1()1 (,令 x(1)(0)=x(0)(1),则:aueauxtxat+-=+-) 1() 1(?)0()1 (

58、,求导还 原后可 得到:ateauxatx-=+) 1()1(?)0()0(。上两 个方 程即 为 gm (1 ,1)模型灰色 预测的 基本计算 公 式。gm (1 ,1)模型只 有一个 指数分 量,故变化 是单调 的。gm (2 ,1)为二阶模型 ,有两个特征根 ,其动态过程 能反映单调 的、非单调 的或摆动 (振荡 的)等不同情况 ,gm (2 ,1)模型的 微分方 程为:899uxatxatx=+)1(2)1(12)1(2dddd,其系数向 量 :tuaaa),(?21=用最小二乘 法求解:nttyxxxuaaa),(),(),(?121bababa-=,式中,-=),()3,()2,(

59、)1()1()1 () 1() 1()1(nxxxma,-+-+-+-=111)1()(21)2()3(21)1()2(21)1() 1 () 1()1 () 1()1(mmnxnxxxxxb,yn=(2)(x(1),2),(2)(x(1),3 ),(2)(x(1),n)t。其时间 响应函数为:221) 1(21)(auecectxtt+=,式中 1、2为 两个特征根 ,按 以下不同情况可 分析系统的 主要动态特征: 若1=2,则动态过程 是单调 的。 若12,且为实数, 则动态过程可 能 是非单调 的。 若1、2为 共轭复根,则动态过程 是周期摆动 的。上面介绍 的 gm (1,1)和 gm

60、 (2, 1)多用于 预测, 而作为状态 分析模 型,常用 gm (1 , h)模型, 它可以反映h- 1 个变量 对于因变量 一 阶导 数的 影响 。 由于 h1,故称为 h 个序列的一 阶线性动态 模型。其 建模 步骤 如下:设有 h 个变量 x1, x2,xh组成原始 数列 :xi(0)= xi(0)(1),xi(0)(2), xi(0)(n) ( i=1,2,h) 对 xi (0)分别 作一 次累加生成 ,得到新的数列 :xi(1)= xi(1)(1),xi(1)(2), ,xi(1)(n) ,i=1,2,h,900建立微分方 程:) 1(1)1(32)1(21)1 (1)1 (1dd

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论