




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模型类型及建模方法1、 模型的分类1、优化模型主要用于解决人们在工程技术、经济管理和科学研究中遇到的要求最优解的问 题,如求利润最高、运费最低等问题。优化模型有四要素:决策变量、目标函数、约束条件、求解方法(主要应用lingo,matlab,excel来求解) 优化模型又可以分为: 线性规划模型(目标函数和约束条件都是线性函数的优化问题) 非线性规划模型(目标函数或者约束条件是非线性的函数) 整数规划(决策变量是整数值的规划问题) 多目标规划(具有多个目标函数的规划问题) 目标规划(具有不同优先级的目标和偏差的规划问题) 动态规划(求解多阶段决策问题的最优化方法)2、微分方程和差分模型主要用于解决描述实际对象的某些特性随时间(或空间)而演变的过程、分析它的变化规律、预测它的未来形态、研究它的控制手段。在建模的过程中首先要根据建模的目的和对问题的具体分析做出简化假设,然后按照对象内在的或可以类比的其他对象的规律列出微分方程。常用的为logistic模型,它有两个基本假设1、假设人口数量x(t)是时间t的连续可微函数,且。2、人口数量的增长速度于现有人口数量成正比,比例系数为r。3、统计回归模型主要用于解决人们无法用机理分析方法建立模型时,通常的办法就搜集大量的数据,基于对数据的统计分析去建立模型,常为统计回归模型。 统计回归模型又包括线性回归、一元二项式回归、多元二项式回归、非线性回归。 统计回归模型解决时的主要步骤为: 1、根据所给的或搜集的数据画出散图,再配曲线类型 2、根据曲线类型得出变量之间的关系式 3、最后对模型进行求解4、概率模型主要用于解决随机因素对研究对象的影响必须考虑时,就应该建立随机模型中比较简单的概率模型。5、图论模型主要用于解决邮递员、交通刑警等在执行任务时在最短时间内完成任务的问题。6、马氏链模型主要用于解决已知现在,将来与历史无关,具有无后效性的,时间、状态均为离散的随机转移过程。无后效性为:系统在每个时期所处的状态是随机的, 从一时期到下时期的状态按一定概率转移,下时期状态只取决于本时期状态和转移概率。7、层次分析模型主要用于解决人们在处理一些决策问题的时候要考虑的因素有多有少,有大有小,但是都有一个共同的特点是它们都涉及经济、社会、人文等方面的因素。在作比较、判断、评价、决策时这些因素的重要性、影响力或者优先程度往往难以量化,人的主观意识会起很大作用。具体作法为:先写出正互反矩阵,根据正互反矩阵求出矩阵A的最大特征值X B=eig(A) %求A的特征值和特征向量w=-0.4658/sum(X(:,1) -0.8409 /sum(X(:,1) -0.0951 /sum(X(:,1) -0.1733/sum(X(:,1) -0.1920/sum(X(:,1) %把特征向量归一CI一致性指标为:(最大特征值-n)/(n-1)CR一致性比率为:CI/RI RI查表可得若CR0.1则特征向量可作为权向量最后算组合权向量8、时间序列模型主要用于解决按时间顺序排列的、随时间变化且相互关联的数据序列。 二、建模常用的方法1、插值与拟合 给定一批数据点,需确定满足特定要求的曲线或曲面时要用插值和拟合的方法来做,而插值问题是要求所求曲线(面)通过所给所有数据点;拟合问题是若不要求曲线(面)通过所有数据点,而是要求它反映对象整体的变化趋势。1.1、插值1.11、一维插值 方法为:拉格朗日插值、分段线性插值、三次样条插值常用三次样条插值具体如下:yi=interp1(x,y,xi,method) %yi是xi处插值的结果,xi为被插值点,x,y插值节点,method为插值的方法(nearest最邻近插值,linear线性插值,spline三次样条插值,cubic立方插值,缺省时为线性插值),需要注意的是所有的插值方法都要求x为单调的,xi的值不超过x的取值范围。1.12、二维插值 方法有网格节点插值法和散点数据插值法具体方法如下: 网格节点的数据插值:z=interp2(x0,y0,z0,x,y,method) %z为被插值点的函数值,x,y为被插值点,x0,y0,z0为插值节点,method为插值的方法(nearest最邻近插值,linear双线性插值,cubic双三次插值,缺省时双线性插值),需要注意的是要求x0,y0单调,x,y可取为矩阵,或x取行向量,y取为列向量,x,y的值分别不能超出x0,y0的范围。 散点数据插值: cz =griddata(x,y,z,cx,cy,method) %cz为被插值点的函数值,x,y,z为插值节点,cx,cy为被插值点,method为插值的方法(nearest最邻近插值,linear双线性插值,cubic双三次插值,v4- MATLAB提供的插值方法,缺省时, 双线性插值),需要注意的是要求cx取行向量,cy取为列向量。1.2、拟合1.21、excel拟合法具体做法如下: 先做出散点图,再右击其中的一个点,选择添加趋势图,选择相应的图形即可。1.22、一元多项式拟合具体做法如下: polyfit(x,y,m) %x,y为一直的数据点,m为拟合的次数1.23、最小二乘法做拟合具体做法如下: 例:用下面一组数据拟合中的参数a,b,k10020030040050060070080090010004.544.995.355.655.906.106.266.396.506.59 1)编写M文件 curvefun1.m function f=curvefun1(x,tdata) f=x(1)+x(2)*exp(-0.02*x(3)*tdata) %其中 x(1)=a; x(2)=b;x(3)=k; 2)输入命令 tdata=100:100:1000 cdata=1e-03*4.54,4.99,5.35,5.65,5.90,6.10,6.26,6.39,6.50,6.59; x0=0.2,0.05,0.05; x=lsqcurvefit (curvefun1,x0,tdata,cdata) 2、优化方法优化方法主要有四要素决策变量、目标函数(尽量简单、光滑)、约束条件(建模的关键)、求解方法 (matlab,lingo) 3、统计方法 3.1、回归分析 回归分析:对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法 (线性回归、一元线性二项式回归、多元二项式回归、非线性回归)。它主要研究的问题是:建立因变量与自变量之间的回归模型(即经验公式)、对回归模型的可信度进行检验、判断每个自变量对因变量的影响是否显著、判断回归模型是否适合这组数据、利用回归模型进行预报或控制。具体的matlab编程为:1、线性回归主要作法如下:b, bint,r,rint,stats=regress(Y,X,alpha) %b回归系数的区间估计 Bint 为b的置信区间 r为残差向量 rint为r的置信区间 stats为回归模型的检验统计量有四个值第一个为相关系数,第二个为F统计量,第三个为与F统计量相对应的概率,第三个为剩余方差2、一元二项式回归的主要作法如下:p,S=polyfit(x,y,m)%确定多项式的系数,m为多项式的次数,p为多项式的系数,S是一个矩阵用于做预测用Y=polyval(p,x) %用来做预测Y,DELTA=polyconf(p,x,S,alpha)%polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y DELTA3、多元二项式回归的主要做法如下:rstool(x,y,model, alpha) model是指linear(线性)、 purequadratic(纯二次)、interaction(交叉)、quadratic(完全二次)4、非线性回归的主要作法如下:beta,r,J=nlinfit(x,y,model,beta0) %确定回归系数,beta估计出的回归系数,r为残差,model为事先建立的M文件,betao为回归系数初值nlintool(x,y,model, beta0,alpha)%非线性回归命令Y,DELTA=nlpredci(model, x,beta,r,J)%用来做预测nlinfit 所得的回归函数在x处的预测值Y及预测值的显著性水平为1-alpha的置信区间Y DELTA。3.2、逐步回归分析 逐步回归分析是从一个自变量开始,视自变量作用的显著程度,从大(主要是指F值的大)到地依次逐个引入回归方程,当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉,引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步,对于每一步都要进行值检验,以确保每次引入新的显著性变量前回归方程中只包含对作用显著的变量,这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。 运用matlab实现的过程具体如下: stepwise(x,y,inmodel,alpha) %x为自变量数据,阶矩阵,y为因变量数据,阶矩阵,inmodel为矩阵的列数的指标,给出初始模型中包括的子集(缺省时设定为全部自变量),alpha显著性水平(缺省时为0.05)。 运行stepwise命令时产生三个图形窗口:Stepwise Plot,Stepwise Table,Stepwise History。 在Stepwise Plot窗口,显示出各项的回归系数及其置信区间。Stepwise Table窗口中列出了一个统计表,包括回归系数及其置信区间,以及模型的统计量剩余标准差 (RMSE)、相关系数(R-square)、F值、与F对应的概率P。3.3、聚类分析 聚类分析是所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些 能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。常用的是系统聚类分析。 系统聚类法的基本原理:首先将一定数量的样品(或指标)各自看成一类,然后根据样品(或指标)的亲疏程度,将亲疏程度最高的两类合并,如此重复进行,直到所有的样品都合成一类(即,将一个样品看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类)。衡量亲疏程度的指标有两类:距离、相似系数。主要作法如下:计算距离y1=pdist(x); %计算样本点间的欧式距离y2=pdist(x,seuclid); %计算样本点间的标准化欧式距离y3=pdist(x,mahal); %计算样本点间的马式距离y4=pdist(x,cityblock); %计算样本点间的布洛克距离(海明距离)计算系统聚类树以及相关信息z1=linkage(y1);z2=linkage(y2);z3=linkage(y3);z4=linkage(y4);利用cophenet函数计算聚类树信息与原始数据的距离之间的相关性,这个值越大越好a1=cophenet(z1,y1)a2=cophenet(z2,y2)a3=cophenet(z3,y3)a4=cophenet(z4,y4)选择具有最大的cophenet值得距离进行分类b1=cluster(z,0.5) %0.5为其分界值h1=dendrogram(z1) %画出聚类图3.4、判别分析 判别分析是利用原有的分类信息,得到判别函数(判别函数是这种分类函数关系式,一般是与分类相关的若干个指标的线性关系式),然后利用该函数去判断未知样品属于哪一类。判别分析法最常用的方法为:距离判别法、费歇尔判别法、贝叶斯判别法、逐步判别法等。3.41、距离判别法 距离判别法的基本思想:首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i类的重心距离最近,就认为它来自第i类。具体做法及步骤为:(1) 先分别计算两个总体的平均值(2) 然后计算协方差矩阵之和(3)计算判别函数(4)对已知类别的样品判别分类(5)对判别效果进行检验3.42、Fisher判别法 Fisher判别法是利用已知类别个体的指标构造判别式(同类差别较小、不同类差别较大),按照判别式的值判断新个体的类别。 具体做法及步骤如下: (1)建立判别函数 同上面的距离判别法 (2)计算临界值 (3)判别准则: 判别准则为 (4)对已知样品进行分类 (5)进行假设性检验3.43、Bayes判别法 Bayes判别法是计算新给样品属于各总体的条件概率,比较概率的大小,然后将新样品判归为来自概率最大的总体。3.44、逐步判别法 逐步判别法与逐步回归法的基本思想类似,都是采用“有进有出”的算法,即逐步引入变量,每引入一个“最重要”的变量进入判别式,同时也考虑较早引入判别式的某些变量,如果其判别能力随新引入变量而变为不显著了(例如其作用被后引入的某几个变量的组合所代替),应及时从判别式中把它剔除去,直到判别式中没有不重要的变量需要剔除,而剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。这个筛选过程实质就是作假设检验,通过检验找出显著性变量,剔除不显著变量。3.5、因子分析法(较少信息反映大部分信息) 主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。具体步骤为:A、计算相关系数矩阵(在计算之前一定要先进行标准化处理)B、计算特征值和特征向量C、计算主成分贡献率和累计贡献率 %一般取累计贡献率在85%-95% 之间的特征值所对应的成分D、计算主成分载荷和得分3.6、参数估计 无论总体X的分布函数F(x;)的类型已知或未知,我们总是需要去估计某些未知参数或数字特征,这就是参数估计问题。分为点估计和区间估计。3.61、点估计 点估计是构造(X1,X2,Xn)的函数X1,X2,Xn)作为参数的点估计量,称统计量为总体X参数的点估计量。点估计又可分为矩估计法和极大似然估计法。矩估计法:假设总体分布中共含有k个参数,他们往往是一些原点矩或一些原点矩的函数,例如,数学期望是一阶原点矩,方差是二阶原点矩与一阶原点矩平方之差等.因此,要想估计总体的某些参数(i=1,2,k),由于k个参数一定可以表为不超过k阶原点矩的函数,很自然就会想到用样本的r阶原点矩去估计总体的r阶原点矩,用样本的一些原点矩的函数去估计总体的相应的一些原点矩的函数,再将k个参数反解出来,从而求出各个参数的估计值.这就是矩估计法,它是最简单的一种参数估计法。极大似然估计法:先构造极大似然函数,再对似然函数取对数称对数似然函数,再对对数似然函数对所要进行的估计量求导,进而进行求极值,最后对求出的极值进行检验。3.62、区间估计 设总体X的分布中含有未知参数,若对于给定的概率(),存在两个统计量(X1,X2,Xn)和 (X1,X2,Xn),使得则称随机区间为参数的置信水平为的置信区间,称为置信下限,称为置信上限。对于点估计和区间估计在matlab中的命令为: muhat,sigmahat,muci,sigmaci=normfit(X,alpha) % 此命令在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计。3.7、假设检验 假设检验是对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设。有参数检验和非参数检验。具体步骤为:1、根据实际问题提出原假设H0与备择假设H1,即说明需要检验的假设的具体内容;2、选择适当的统计量,并在原假设H0成立的条件下确定该统计量的分布;3、按问题的具体要求,选取适当的显著性水平,并根据统计量的分布查表,对应于的临界值.一般取0.05,0.01或0.10;4、根据样本观测值计算统计量的观测值,并与临界值进行比较,从而在检验水平下对拒绝或接受原假设H0作出判断.对于假设检验在matlab中的具体命令为:A、总体方差 已知时,总体均值的检验使用 z检验h,sig,ci = ztest(x,m,sigma,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差, alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05。返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间。B、总体方差未知时,总体均值的检验使用t 检验h,sig,ci = ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05。返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间。C、两总体均值的假设检验使用 t 检验 h,sig,ci = ttest2(x,y,alpha,tail)检验数据 x ,y 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 y 的均值 ”tail = 1,检验假设“x 的均值大于 y 的均值 ”tail =-1,检验假设“x 的均值小于 y 的均值 ”tail的缺省值为 0, alpha的缺省值为 0.05。返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为与x与y均值差的的 1-alpha 置信区间。针对非参数的检验的具体步骤为:1、数据录入2、做频数直方图(hist(x,n)从而可以看出符合那种分布3、分布行的检验有正态性检验h = normplot(x)、韦布尔检验h = wblplot(x)4、参数估计(muhat,sigmahat,muci,sigmaci=normfit(x))4、 微分方程 一阶微分方程的平衡点和稳定性:设有微分方程 (1)方程右端不显含自変量t,称为自治方程。代数方程的实根称为方程(1)的平衡点,它也是方程(1)的解。如果存在某个邻域,使方程(1)的解x(t)从这个邻域内的某个x(0)出发,满足,则称平衡点是稳定点;否则,称其为不稳定点。有直接法判别平衡点是稳定点的情况:将在点作Taylor展开,只取一次项,方程(1)近似为 (2)称为(1)的近似方程,也是方程(2)的平衡点。关于点稳定性有如下:若,则对于方程(2)和(1)都是稳定的;否则是不稳定的。 二阶微分方程的平衡点和稳定性:二阶微分方程可用两个一阶微分方程表示,求平衡点和稳定点时同一阶微分方程。5、 差分方程 差分方程的平衡点及其稳定性:先求出差分方程的平衡点即令,求出的x即为平衡点,再求出差分方程的特征方程即令,从而解出特征根,若,则平衡点即为稳定点;否则不是稳定点。6、模糊数学 模糊数学方法有:模糊聚类分析、模糊模型识别、模糊综合判别法。6.1、模糊聚类分析 对所研究的事物按一定的标准进行分类的数学方法是聚类分析,但是有时有许多事物之间并无清晰的划分,边界具有模糊行,它们之间的关系更多的是模糊关系,对这类事物的分类,就应该用模糊数学方法,用模糊数学的方法进行聚类分析成为模糊聚类分析。 模糊聚类分析的一般步骤为:1、进行数据标准化2、建立模糊矩阵3、求动态聚类图6.2、模糊模型识别 模糊模型识别的两个本质特征为一是事先已知若干标准模型(称为标准模型库),二是有待识别的对象。模糊识别是指或者是标准模型库中的模型是模糊的,或者有待识别的对现是模糊的。有最大隶属原则和择近原则6.21、最大隶属原则1:设论域U=上有m个模糊子集(即m个模型),构成了一个标准模型库,若对任一,有,使得,则认为相对于隶属于。做得过程中注意隶属函数的取法:常用的有S型函数:从0到1单调增长、型函数:中间高两边低的函数。 最大隶属原则2:设论域U上有一个标准模型A,待识别的对象有n个;如果有某个满足,则应优先录取。6.22、择近原则:设论域上有m个模糊子集 (即m个模型),构成了一个标准模型库,被识别的对象B也是U上的一个模糊集,它与标准库中的哪一个模型更贴近,此时我们用表示两个模糊集之间的贴近程度,若有,使得,则称B与最贴近,或者把B归于类。计算贴近度的方法有:1、 2、 3、 6.3模糊综合判别法 模糊综合判别法的步骤为:1、首先要求出模糊评价矩阵P,其中P表示方案X在第i个目标处于第j级评语的隶属度,当对多个目标进行综合评价时,还要对各个目标分别加权,设第i个目标权系数为W,则可得权系数向量:A(W1,W2,W)2、利用矩阵的模糊乘法得到综合模糊评价向量B,BAP(其中为模糊乘法),根据运算的不同定义,可得到不同的模型模型1 : M(,V)主因素决定型模型2: M(,V)主因素突出型模型3: M()加权平均型 3、最后对得出的权向量进行归一化处理7、灰色系统 灰色系统理论的主要任务是根据具体灰色系统的行为特征数据,充分开发并利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。7.1、灰色系统理论提出了一种新的分析方法关联度分析方法,即根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程度。先对数据进行标准化处理,在进行关联度分析7.2、优势分析 当参考数列不止一个,被比较的因素也不止一个时,则需进行优势分析。8、时间序列 时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。有确定性时间序列分析方法、移动平均法、指数平滑法等方法8.1、确定性时间序列分析方法是通过对预测目标自身时间序列的处理,来研究其变化趋势(长期趋势变动、季节变动、循环变动、不规则变动)。8.2、移动平均法 移动平均法是根据时间序列资料逐渐推移,依次计算包含一定项数的时序平均数,以反映长期趋势的方法。当时间序列的数值由于受周期变动和不规则变动的影响,起伏较大,不易显示出发展趋势时,可用移动平均法,消除这些因素的影响,分析、预测序列的长期趋势。移动平均法有简单移动平均法,加权移动平均法,趋势移动平均法等。8.21、简单平均移动法 简单平均移动法是当时间序列的数值由于受周期变动和不规则变动的影响,起伏较大,不易显示出发展趋势时,可用移动平均法,消除这些因素的影响,分析、预测序列的长期趋势。 简单移动平均法只适合做近期预测,而且是预测目标的发展趋势变化不大的情况。如果目标的发展趋势存在其它的变化,采用简单移动平均法就会产生较大的预测偏差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论