![新编-【大学课件】统计方法建模_第1页](http://file4.renrendoc.com/view/f67ec2edcef7f4bf3872ee9fe332eeb1/f67ec2edcef7f4bf3872ee9fe332eeb11.gif)
![新编-【大学课件】统计方法建模_第2页](http://file4.renrendoc.com/view/f67ec2edcef7f4bf3872ee9fe332eeb1/f67ec2edcef7f4bf3872ee9fe332eeb12.gif)
![新编-【大学课件】统计方法建模_第3页](http://file4.renrendoc.com/view/f67ec2edcef7f4bf3872ee9fe332eeb1/f67ec2edcef7f4bf3872ee9fe332eeb13.gif)
![新编-【大学课件】统计方法建模_第4页](http://file4.renrendoc.com/view/f67ec2edcef7f4bf3872ee9fe332eeb1/f67ec2edcef7f4bf3872ee9fe332eeb14.gif)
![新编-【大学课件】统计方法建模_第5页](http://file4.renrendoc.com/view/f67ec2edcef7f4bf3872ee9fe332eeb1/f67ec2edcef7f4bf3872ee9fe332eeb15.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计方法建模docin/sundae_meng统计方法建模docin/sundae_meng13.1多元回归与最优逐步回归3.2主成份分析与相关分析3.3判别分析3.4聚类分析3.5模糊聚类分析3.6马尔可夫链及其应用3.7存贮论3.1多元回归与最优逐步回归2
§3.1多元回归与最优逐步回归
一、数学模型二、模型的分析与检验三、回归方程系数的显著性检验四、回归方程进行预测预报和控制五、最优逐步回归分析
§3.1多元回归与最优逐步回归
一、数学模型3一、数学模型设可控或不可控的自变量;目标函数,已测得的n组数据为:
(1.1)其中是系统的测试数据,相当于如下模型:设多目标系统为:
系统一、数学模型设可控或不可控的自变量4为简化问题,不妨设该系统为单目标系统,且由函数关系,可以设:
(1.2)
可得如下线性模型
(1.3)
为测量误差,相互独立,。
令
为简化问题,不妨设该系统为单目标系统,且由函数关系5
可得
(1.4)
(1.4)称为线性回归方程的数学模型。
利用最小二乘估计或极大似然估计,令
使,由方程组
(1.5)
可得系数的估计。
令方阵可逆,由模型可得:
即有 (1.6)
可以证明(1.6)与(1.5)是同解方程组的解,它是最优线性无偏估量,满足很多良好的性质,另文补讲。
可得
6二、模型的分析与检验
设目标函数的平均值,则由公式可计算得总偏差平方和,回归和剩余平方和:二、模型的分析与检验
设目标函数7假设检验:
至少有一个不为零
结论是:当
当被拒绝以后,说明方程(2)中系数不全为零,方程
配得合理。否则在被接受以后,说明方程配得不合适,即变量对目标函数都没有影响,则要从另外因素去考虑该系统。假设检验:
8三、回归方程系数的显著性检验
假设备选假设可以证得:
(1.8)或者
的对角线元素。三、回归方程系数的显著性检验
假设9.当时,显著不为零,方程(1.2)中第j个变量作用显著。若有某一个系数假设被接受,则应从方程中剔除。然后从头开始进行一次回归分析工作。.当10四、回归方程进行预测预报和控制
经过回归分析得到经验回归方程为
(1.9)
设要在某已知点上进行预测,可得点估计:
(1.10)
下面对预测预极值进行区间估计,可以证得
其中
四、回归方程进行预测预报和控制
经过回归分析得到经验回11
得的预测区间:得的预测区间:12五、最优逐步回归分析
在线性回归分析中,当经过检验,方程(1.2)作用显著,但为显著,说明不起作用,要从方程中剔除出去,一切都要从头算起,很麻烦。这里介绍的方法是光对因子逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐次引入变量到方程,并及时进行检验,去掉作用不显著的因子,依次循环,到最后无因子可以进入方程,亦无因子被从方程中剔除,这个方法称为最优逐步回归法。从方程(1.2)中,为方便计,设变量个数,记可得
(1.12)五、最优逐步回归分析
在线性回归分析中,当经过检验,方程(13此时仍可得
是回归估计值回归方程为
(1.13)
分别是的系数估计。为了减少误差积累与放大,进行数据中心化标准化处理:此时仍可得14
(1.14)可得数学模型为:
(1.15)经推导可得:,,,
15
称为系数相关矩阵
由此可得经验回归方程:
(1.16)然后以变换关系式代入可得
称为系数相关矩阵16将(17)式与(13)式进行比较,可得:
(1.18)只要算得(16)式的即可。注意到
其中是对于因子的偏回归平方和,可以证明线性方程中对变量的多元线性回归方程中的偏回归平方和为(是原方程中的偏回归平方和):
将(17)式与(13)式进行比较,可得:17把系数矩阵R变成加边矩阵,记为
比较,设,则相应变量作用最大,但是否显著大,要进行显著性检验,可以证得
把系数矩阵R变成加边矩阵,记为18当时,可将变量引入方程中去。现将这个循环步骤介绍如下:第一步:挑选第一个因子对计算的偏回归和找出决定
F检验
当时引入,一般总可以引入的。当时,可将变量19
第二步:挑选第二个因子首先变换加边矩阵
则,因子的偏回归平方和
记决定可否引入第二步:挑选第二个因子20
步骤: 1.对,计算的偏回归平方和。
2.找出中最大的一个,记为。
3.对作显著性检验:
当时,要
引入。步骤: 1.对,计算21
第三步:当引入时,是否要剔除呢?即已有方程:
检验的偏回归平方和:
第三步:当引入时,是否22
当时因子不剔除。同样的方法以
时因子不剔除。第四步:重复进行第二步到第三步。一直到没有可引入的新因子,也没有可剔除的因子。最后方程为:
(1.19)
并把(1.19)式换算成类似的(1.13)式。当23§3.2主成份分析与相关分析一、数学模型二、主成份分析三、主成份的贡献率§3.2主成份分析与相关分析一、数学模型二、主成份分析三24这是一个将多个指标化为几个少数指标进行统计分析的问题,设有维总体有个随机指标构成一个维随机向量,它的一个实现为;而且这个指标之间往往相互有影响,是否可以将它们综合成少数几个指标,使它们尽可能充分反映原来的个指标。例如加工上衣,有袖长、身长、胸围、肩宽、领围、袖口、袖深,……等指标,是否可以找出主要几个指标,加工出来就可以了呢?例如主要以衣长、胸宽、型号(肥瘦)这样三个特征。一、数学模型一、数学模型25设为维随机向量,为期望向量,为协方差矩阵,其中
设将综合成很少几个综合性指标,如,不妨设
设26
则有
要使尽可能反映原来的指标的作用,则要使尽可能大,可以利用乘子法:要对a加以限制否则加大,增大无意义。令
设并使则有27可得方程组(2.1)的解为
(2.2)以左乘(2.2)之两边,得即由(2.2)式可得
(2.3)要使满足(2.3)的a非零,应有
可得方程组(2.1)的解为28
即入是的特征根,设是的个特征根,只要取,再由,求出V的属于的特征向量,在条件是唯一的维特征向量。于是得
(2.4)
即入是的特征根,设29二、主成份分析
一般协方差方阵为非负定,对角线上各阶主子式都大于等于零,即特征值有:
设前m个都大于零,依次为,相应的特征向量为,则,,,即为第一,第二,…,第个主成份,由线性代数知识可知,不同的特征根对应的不同的特征向量线性无关,由于V是实对称阵,则,变换后的各主成份相互无关。即对进行了一次正交变换。二、主成份分析
一般协方差方阵为非负定,对角线上各阶主子式30
在实际应用中,V阵往往是未知的,需要用V的估计值来代替,设有组观测值
则取(2.5)
(2.6)
其中是的子样方差,的子样协方差。需要求出的特征值。在实际应用中,V阵往往是未知的,需要用V的估计31
由于不同的度量会产生量纲问题,一般建议作如下变换:
用标准变量代替以前的,即可以运算。此时的协方差矩阵即相关矩阵
从R出发,可求主成份。由于不同的度量会产生量纲问题,一般建议作如下变换:32三、主成份的贡献率
为了尽可能以少数几个主成份来代替P个指标,那么要决定取多少个主成份才够呢由于则可得是的方差,可得
亦是V的全部特征值之和:
三、主成份的贡献率
为了尽可能以少数几个主成份33
由于,
则令
表明方差在全部方差中所占的比重,称是第i个主成份的贡献率,显然有,不妨取一个阈值为d(0<d<1),当时,即舍去,此时可取为主成份。以贡献率来决定它的个数。由于34一、数学模型二、关于计算中应注意的问题三、关于误判率及多个总体的判别§3.3判别分析
一、数学模型二、关于计算中应注意的问题三、关于误判率及多个总35一、数学模型
根据所研究的个体的观察指标来推断个体所属于何种类型的一种统计分析方法,称为判别分析。例如某精神病院有精神病患者256名,诊断结果将它们分成六类(相当于6个总体)设服从三维联合正态分布i=1,2,…,6,其中,为协方差矩阵,一般这六种类型可分为焦虑状、癔病、精神病、强迫观念型、变态人格、正常,若有如下子样:子样子样
…
…
…
…
…
…
子样一、数学模型36注意到每个子样都是三维向量。现有一个新的精神病患者前来就医,测得三个指标:
试判断该患者病情属于哪一类。(一)两点的距离设维空间中有两点,则其欧氏距离为
:(3.1)
注意到每个子样都是三维向量。现有一个新的精神37
由于数据的量纲不同,不采用欧氏距离,用马氏距离有:定义1:设X,Y是从总体G中抽取的样品,G服从P维正态分布,,定义X,Y两点间的距离为马氏距离:(3.2)定义2:X与总体G的距离为D(X,G)为
(3.3)由于数据的量纲不同,不采用欧氏距离,用马氏距离有:38(二)距离判别法设有两个协方差相同的正态总体,且对于一个新的样品,要判定它来自哪一个总体,有一个很直观的方法:计算
若
(三)线性判别函数由
令
(二)距离判别法对于一个新的样品,要判定它来自哪一个总体,有39记
则有:当时,否则
当为已知时,令
,可得:
(3.4)称为线性判别函数,a为判别系数,因为
,即
,解线性方程组可得解此时的判别规则为:X是新的一个点,将其代入即可判别。(3.5)
记则有:当时,否则40二、关于计算中应注意的问题
实际上均未知,要用样本值的估计公式来计算出。其方法如下:
设子样来自总体,子样来自,可由(在本节的开头的例子中P=3)二、关于计算中应注意的问题实际上均未知,要用样本值的估计公41得到
(3.6)(3.7)
判别函数为(3.8)判别系数为得到(3.6)(3.7)判别函数为(3.8)判别系数42三、关于误判率及多个总体的判别这里提及一个回报的误判率问题。在构造判别函数W(X)时,是依据样本
,现在已知均属于
,从道理上来说,
经过判别公式(3.8),可得出
,但也可能出来某几个不属于
,这便是误判。若有存在,使得
,说明这就产生了一个误判。所谓误判率,即是出现误判的百分数,我们应该有所控制。当两个总体的协方差不相等时,可用如下方法:
(3.9)(3.10)三、关于误判率及多个总体的判别这里提及一个回报的误判率问题。43当
当
未知时,用下列估计代替:
在个总体时,均值为协方差阵为(维)
设
都已知时,X为样品
计算
选择一个最小的值例如
则
设未知,但独立,可以分别以估计值来计算。当上述未知,但亦可以用上述类似方法。上述解决方法中,可以扩展到非正态分布。
时,当当未知时,用下列估计代替:在个总体时,均值为协方差阵44§3.4聚类分析
物以类聚,人以群分,社会发展和科技的进步都要求对于某些物体进行分类。由于早期的定性分类已不能满足需要,于是数值分类学便应运而生。
一、数学模型二、应用类例§3.4聚类分析物以类聚,人以群分,社会发45一、数学模型某种物品有n个:
指标,如何将其分成若干类,基本的思路是把距离较近的点归成一类。这里的距离可分为如下三类:它有m个数值量化1.距离
的距离,
本文中的距离常用欧氏或马氏距离,公式在前几节中已述,还有一种用绝对距离:应该提及马氏距离可以克服数据相关性的困难
。一、数学模型某种物品有n个:指标,如何将其分成若干类,基本462.数据正规化处理
当的分量中大,要经过正规化标准化处理,令
个指标量纲不一致时,相差很(4.1)
其中
(4.2)(4.3)将经过(1)式处理的数据重新视作(为记号上的方便)2.数据正规化处理当的分量中大,要经过正规化标准化处理,令473.相似系数法的相关系数(4.4)可以将相关愈密切的归成一类。3.相似系数法的相关系数(4.4)可以将相关愈密切的归484.最短距离聚类法(系统聚类法,
逐步并类法)
先将n个样本各自为一类,计算它们之间的距离,选择距离小的二个样本归为一个新类,再计算这个新类与其它样本的距离,选择距离小的二个样本(或二个新类)归为一个新类,每次合并缩小一个以上的类,直到所有样本都划为一个类为止。这里规定两点间距离为:两类间的距离,即
的距离为:
4.最短距离聚类法(系统聚类法,
49步骤如下:
1.数据正规化处理要视各指标的量纲是否一致,相差是否太大,并选择一种距离计算法,为了方便计,一般都选择欧氏距离法。
2.计算各样本间的两两距离,并记在分类距离对称表中,并记为D(0),第0步分类,此时
(每一个样本点为一个类)3.选择表D(0)中的最短距离,设为
,则将
合并成一个新类,记为
(4.5)4.计算新类与其它类之间的距离,定义
步骤如下:(每一个样本点为一个类)3.选择表D(0)中的最短50(4.6)
表示新类与类之间的距离。
5.作D(1)表,将D(0)中的第p,q行和p,q列删去,加上第r行,第r列。第r行,第r列与其它类的距离按(4.6)式判断后记上,这样得到一个新的分类距离对称表,并记为D(1),D(1)表示经过一次聚类后的距离表,要注意的是Dr类是由哪两类聚类得到应在D(1)表下给以说明。
6.对D(1)按3,4,5重复类似D(0)的聚类工作,得D(2)。
7.一直重复,直到最后只剩下两类为止,并作聚类图。(4.6)表示新类与类之间的距离。5.作51二、应用类例
现有8个样品,每个样品有2个指标(m=2,2维变量),它们的量纲相同,(否则要经过正规化处理)
编号123456782244-4-2-3-15343322-3试用系统聚类方法对这8个样品进行聚类。
解:采用欧氏距离
(1)最短距离法,首先用表格形式列出D(0)二、应用类例现有8个样品,每个样品有2个指52D(0)G1G2G3G4G5G6G7G8G10G22.00G32.22.20G42.32.01.00G56.36.08.18.00G65.04.16.36.12.20G75.85.17.27.11.41.00G88.56.78.67.86.75.15.40表示第i个样品,i=1,2,…,8
在D(0)中,最小值是1.0,相应的距离是D(3.4),与D(6,7)。则合并为新类,把合并成。D(0)G1G2G3G4G5G6G7G8G10G22.00G53(2)把D(0)中去掉
并计算得下表,后两行重算,其余照D(0)照抄。
D(1)G1G2G5G8G9G11G10G22.00G56.36.00G88.56.76.70G92.22.08.07.80G105.04.11.45.18.10(2)把D(0)中去掉并计算得下表,后两行重算,其余照D(54视D(1)中,最小值为1.4,相应的是D(5,10)将合并成新类。视D(1)中,最小值为1.4,相应的是D(5,10)将合并553)同法构造D(2)表D(2)G1G2G8G9G10G10G22.00G88.56.70G92.22.07.80G115.04.15.16.10其中最小值D(1,2)=D(2,9)=2.0,则把
,在D(2)中,3)同法构造D(2)表D(2)G1G2G8G9G10G10G56D(3)G8G11G12G80G115.10G126.74.10
其中D(3)中,最小值D(11,12)=4.1,因此把,在D(4)G8G13G80G135.10(见D(0)第8行)D(3)G8G11G12G80G115.10G126.74.573.把上述聚类过程用聚类图表示:
011.42T345
说明:聚类到一定程度即可结束3.把上述聚类过程用聚类图表示:
058一般可以选取一个阈值T,到D(K)中的所有非零元素都大于T<V,即结束(表中的值>T值)设T=2.5:则到D(3)时结束,此时的共聚为三类:
如下图:×8×5×7×6×1×3×2×4一般可以选取一个阈值T,到D(K)中的所有非零元素都大于T<59§3.5模糊聚类分析二、数学模型一、问题的提出三、一个实例§3.5模糊聚类分析二、数学模型一、问题的提出三、一个实60一、问题的提出客观事物分成确定性和不确定性两类,处理不确定性的方法为随机数学方法。在进行随机现象的研究时,所表现的现象是不确定的,但对象事物本身是确定的。例如投一个分币,出现哪一面是随机的,但分币本身是确定的。如果所研究的事物本身是不确定的,这就是模糊数学所研究的范畴。例如,一个人年龄大了,称年老,年小,或年青,但到底什么算年老,什么算年青呢?
又如儿子象父亲,什么是象?象多少?
再说儿子象父亲,儿子又象母亲(部分象),难道父亲象母亲?1965年由I.A.Zadeh提出模糊数学,它可以广泛地应于图象识别,聚类分析,计算机应用和社会科学。一、问题的提出客观事物分成确定性和不确定性两类,处理不确定性61例如洗衣机和空调器已用上模糊控制,本节将把模糊数学的一套方法引入聚类分析中来,称为模糊聚类分析。docin/sundae_meng例如洗衣机和空调器已用上模糊控制,本节将把模糊数学的一套方法62二、数学模型设E为分明集(集合)1.定义:
称为隶属度函数(分得很清楚)要末是,要末不是对A为不分明集,
可以取0到1之间的任意一个实数值.当愈接近于1.则的程度愈大.愈接近于0.则的程度愈小.二、数学模型设E为分明集(集合)632.模糊数学的运算法则如A和B为不分明集,则有:①并,记为,
②交,记,③补,记为,2.模糊数学的运算法则643.模糊聚类模糊聚类同于一般聚类法(相似系数法或最小距离法)
以相似系数(相关系数)法为例:
思路:①先算相似系数矩阵(相似矩阵)②将相似矩阵改造成模糊矩阵:即将原相似矩阵的元素压缩到0,1之间③改造成模糊等价矩阵,取不同的标准,可以得到不同的聚类标准.3.模糊聚类65计算步骤:
第一步:计算相似的系数①先将数据标准化令得到标准化的数据为
显然(标准化数据的平均值一定为0)
得标准化后比数据的相关系数为
②
计算步骤:②66
③相似矩阵
第二步:将相似系数压缩到0,1之间令建立模糊矩阵
③相似矩阵67
第三步:建立模糊等价矩阵由于上述模糊矩阵不具有传递性:即
要通过褶积将模糊矩阵改造成模糊等价矩阵:
矩阵的褶积与矩阵乘法类似,只是将数的加.乘运算改成并和交:
则褶积为:
68
于是有:
于是有:一直到为止此时即满足模糊等价矩阵,具有传递性此时记它为:CR第四步:进行聚类:
将矩阵CR的元素依大小次序排列,从1开始,沿着自大到小依次取值,定义:
可以得到若干个0,1元素构成的CR矩阵,其中之1的表示这二个样本划为一类于是有:69三、一个实例
=----上海4月平均气温;----北京3月雨量
----5月地磁指数;----5月500毫巴W型环流型日数予报对象:
华北五站(北京、天津、营口、太原、石家庄)7-8月降水量,仅用61-67年7年的资料(略)第一步:计算相似系数经过标准化计算相似系数矩阵R三、一个实例70第二步:建立模糊矩阵将相似系数压缩到0,1之间得
第三步:建立模糊等价矩阵按上式计算:例如
第二步:建立模糊矩阵71得到,发现,当取0.92时:
将,当取0.65时有:
得到,发现,当72又将合并成一类,当取0.64时,有
此时将1,3,再与4,6并为一类,可分成三类再取=0.63时
这次再将,只有二类:,又将合并成一类,当取0.64时,有73
聚类图:说明:(1)当=0.65时,共分成四类:(2)当=0.64时,共分成三类:(3)当=0.63时,共分成二类:
这是以按年份为基本类的分类图
0.640.650.920.990.63聚类图:说明:0.640.650.920.990.674§3.6马尔可夫链及其应用一、随机过程二、马尔可夫方程和步转移矩阵三、遍历性与平稳分布四、马氏链的应用§3.6马尔可夫链及其应用一、随机过程二、马尔可夫方程和75一、随机过程
描述一种随机现象的变量,一般称为随机变量,记为,而随着时间参数t或其它参数变化而变化的随机变量,称为随机过程。定义1在给定的概率空间(,F,P)及实数集T,其中为样本空间,F为分布函数,P为概率,对于每一个,有定义在(,F,P)上的随机变量与之对应,则称为随机过程,一般简化为。新编-【大学课件】统计方法建模76
定义2(马尔可夫过程)设随机过程,如果在已知时间t系统处于状态x的条件下,在时刻(>t)系统所处状态和时刻t以前所处的状态无关,则称为马尔可夫过程。从定义2可知马氏过程只与t时刻有关,与t时刻以前无关。定义3(马尔可夫链)设随机过程只能取可列个值把称为在时刻系统处于状态若在已知时刻系统处于状态的条件下,在时刻()系统所处的状态情况与t时刻以前所处状态无关,则称为时间连续,状态离散的马氏过程。而状态的转移只能在发生的马氏过程称为马尔可夫链。从定义3可知,马氏链是状态离散,时间离散的马尔可夫过程。定义2(马尔可夫过程)设随机过程,如果在77
定义4(转移概率)设系统的离散状态为设表示第次转移到状态表示系统开始处于状态。则称 (6.1)为系统在k-1次转移到状态,而第k次转移到状态的转移概率由定义可知
(6.2)
定义5若(2)式中有:(6.3)则称为均匀马氏链(与第几次转移无关)
即定义4(转移概率)设系统的离散状态为78
定义6转移概率与转移矩阵令转移概率为矩阵的第行,第j列元素则有
(6.4)
称为马氏链的转移矩阵,其中
定义6转移概率与转移矩阵79例:一个分子在两个附着壁之间的随机游动,如图1所示
(1)这个分子在x轴上1,2,…,S的位置上任意一点,且只能在这S个位置上.(2)当分子在1与S两端点时,分子被吸收,不再游动(吸收壁)(3)分子每转移一次,只移动一步,且必须移动若时刻时,分子在i处(),在一个单位时间后它转移到i+1点处的概率为P(向右移动),它转移到i-1点处的概率为向左移动)。问:在初始位置于i处,经过5次转移它落在j处的概率是多少?123i-1i…Sx轴满足以下条件:例:一个分子在两个附着壁之间的随机游动,如图1所示1280
分析:该系统的转移概率为:
这个均匀马氏链系统的转移矩阵为
分析:该系统的转移概率为:81二、马尔可夫方程和n步转移矩阵设表示一个均匀马氏链经过n步转移由状态转移到状态的转移概率,当时讨论(二步转移)令事件B=“系统经由二次转移,由转移到”
=“系统由转移到,再由转移到”
k=1,2,…,因此,
两两互不相容事件
(只与状态时的时刻有关)类似可证: (6.5)二、马尔可夫方程和n步转移矩阵82(5)式称切普曼一柯尔莫哥洛夫方程由代数知识:A=
可见(5)式称切普曼一柯尔莫哥洛夫方程83于是
(6.6)
类似可证得 (6.7)上例要求:只要例这个元素的值即可.
于是84三、遍历性与平稳分布定义7设为均匀马氏链(与第n次转移无关),对一切状态i及j(或称,存在不依赖于i的常数,使得
(6.8)
则称均匀马氏链有遍历性遍历意义:遍历性说明不论系统自那一个状态出发,当转移次数n充分大时,转移到状态的概率近似于某个常数。
三、遍历性与平稳分布85
定理1:对有限个状态的均匀马氏链,若存在一正整数,使对一切有
(6.9)则此马氏链是遍历的且(8)中的是如下方程组
(6.10)在条件下的唯一解
证略定理1:对有限个状态的均匀马氏链,若存在一正整86
定义8(平稳性):设为有限s个状态的均匀马氏链,若初始概率满足全概率公式:
则称为平稳的,称为的一个平稳分布表示第k次转移到状态的绝对概率为初始状态概率可以证明:
结论:当马氏链是平稳时,初始概率等于绝对概率平稳均匀马氏链在任一时刻处于状态的概率都相等,说明平稳。定义8(平稳性):设为有限s个状态的均匀马氏87123
设
二次转移矩阵为
则对任意说明是遍历的。由定理1可知:马氏链是平稳的即有:例2:例1一样:没有附着壁的随机游动其余同例1123设例2:例1一样:88由:
得
当时,游动时前进一步与后退一步是等可能的,说明系统处于任一状态的概率明显相等由:89四、马氏链的应用应用题1:机器生产零件时,机器处于两种可能状态的:=“可调整状态”----称良好状态
=“不可调整状态”---称不良状态机器使用一天,它的转移概率为
①问:在n天以后机器处于不良状态,良好状态的概率为多少?②若有100台机器:问配备多少个机修工人才能使机器待修的可能性至多为10%?(一天工人可以修理2台机器)四、马氏链的应用90解:
即该系统是均匀马氏链,且为遍历:
可设由定理3.1:知
解方程组解:91答:不管各台机器处于什么状态,到n天以后,机器处于①良好状态为,处于不良状态为②由于机器处于不良状态的概率为,设n天后,100台机器中有台处于不良状态
并设配备m个维修工人,即一天可修理台机器:
利用泊松分布,得,可以泊松分布表,决定答:不管各台机器处于什么状态,到n天以后,机器处于92
应用题2:《是否要进行咔啡推销广告》的决策为增加咔啡的推销,打算进行一次广告宣传,需要支付全部广告费用600万元,假设国内喝咔啡总人数为5000万,增加一个饮用本公司的咔啡的顾客,本公司可获利2元,通过广泛的社会调查(调查费用包括在广告费用中),知登广告之前顾客改变牌子概率为:
到从
我厂牌子
别厂牌子我厂牌子0.80.2别厂牌子0.20.8在登了广告之后顾客改变牌子的概率为
到从
我厂牌子
别厂牌子我厂牌子0.80.2别厂牌子0.30.7问:从经济效益的角度决定要否做这个广告?应用题2:《是否要进行咔啡推销广告》的决策为增加咔啡93解:易知上述系统可以看成随机游动,且是遍历的,因而是平稳马氏链,存在着
利用
即较长时间以后,采用我公司牌子概率为0.5同法可得:
, 做了广告以后,采用我厂的牌子的概率为0.6N=5000万N0.6-N0.5=500万×0.1=500万答:在做了广告以后,平均可增加顾告500万获利500万×2元=1000万元广告费600万元纯利润1000万-600万=400万决策:可以进行该项广告。解:易知上述系统可以看成随机游动,且是遍历的,94参考文献:[1]复旦大学数学系概率论与数理统计高教出版社1985[2]中山大学概率统计系概率论与数理统计高教出版社1984[3]范大茵,陈永华概率论与数理统计浙江大学出版社2019[4]陈希孺概率论与数理统计中国科技大学出版社1993[5]沈凤麟,钱玉姜信号统计分析基础中国科技大学出版社1989[6]概率统计与随机过程武汉大学出版社[7]中国现场统计研究会三次设计组,全国总工会电教中心正交法和三次设计科学出版社1985[8]陈兆能等试验分析与设计上海交通大学出版社1991[9]韩之俊,章谓基质量工程学科学出版社1991
参考文献:953.7存贮论
在日常的生产和生活中存在着大量存贮现象。例如企业要有一定数量的原料存在仓库中,以便生产的进行,商店要有一定量的商品存在仓库中,以便销售,不致于经常缺货,等等。库存量的多少直接影响到企业的效益,库存过少则使生产或销售发生中断,减少了利润;库存量过大,又会造成积压,增加成本。因此,合理的存贮策略具有重要的经济意义。
存贮论是研究存贮问题的理论和方法的一门学科。它用定量的方法描述存贮状态,补充和需求,描述存贮状态与费用间关系,并确定合理的补充策略。
建立存贮模型的三个环节是补充策略,费用函数和经济批量算式。3.7存贮论在日常的生产和生活中存在着大96存贮系统包含三个主要内容即补充、存贮状态和需求,如图示:补充
存贮状态需求
一般地需求是外在的,不受人的控制,存贮状态由需求和补充决定。因此人们的决策对象只有补充。如何根据需求和仓库容量、费用等约束条件,确定补充策略使费用目标最小,这是存贮论研究的主要问题。
补充策略通常有三种:即T循环策略,T,S补充策略和T,S,S补充策略。T循环策略是指当需求速度不变,补充时间为零的情况下,每隔时间T补充一次,每次补充批量Q。存贮系统包含三个主要内容即补充、存贮状态和需求,如图示:补97T,S补充策略是指在需求速度变化,补充时间为0的情况下,每隔T时间盘点一次,并及时补充,每次补充到存贮水平S。因此每次补充量是变量,,是盘点时的存量。
T,S,S策略是指每隔T时间盘点一次,规定一个存贮保险量S,当存量不小于S时不补充,当存量小于S时才补充,补充到定额水平()。
研究存贮问题的目的是为了选用最优的存贮策略(何时补充?补充多少?)使得存贮费用最小。一般要考虑的费用包括存贮费(仓库管理费用,存贮设备费用,保险费,利率等),订货量(货物价格,运费和订购费),生产费,当货物由自己生产时就没有了订货费,而代之以生产费,包括生产的固定费用和可变费用。缺货损失费,因存贮不足所产生的费用,如收益的损失,停工损失,延误交货罚款等,费用函数由上述费用构成。
T,S补充策略是指在需求速度变化,补充时间为098
在补充策略和费用函数确定后,就要求出使费用最小的订货批量Q,一般称经济批量,经济批量算式是最佳批量Q的数学表达式。
下面我们来讨论各种情况下的存贮模型
:一、连续盘点,均匀需求的确定性存贮模型二、定期盘点,需求变化的情况三、单周期随机存贮模型四、多周期随机存贮模型在补充策略和费用函数确定后,就要求出使费用99一、连续盘点,均匀需求的确定性存贮模型
我们假定需求速度不变,补充采取T循环策略的问题模型1经典的批量模型我们假定(i)不允许缺货
(ii)需求速度为d
(iii)补充时间为0(iv)订购费或生产的固定费用为a,单位货物单位时间的存贮费为h
考虑在一个周期T内的费用(我们不考虑货物本身费用,因为不影响我们的计算)令时刻的存贮量,T=Q/d费用=订购费+存贮费(8.1)
一、连续盘点,均匀需求的确定性存贮模型我们假定需求速度不100在一个单位时间内的费用是一个周期内费用与周期数的积
,
得:
(8.2)
这是最优批量,而两次补充的最佳周期为
单位时间的极小费用为
如考虑货物本身成本,则
为单位货物成本。在一个单位时间内的费用是一个周期内费用与周期数的积,得101模型2
连续补充的经济批量模型如果物品是厂内生产,而不是外购的,则出现连续补充的情况,即补充是以速度
进行的,这里。设初始存贮状态,在内补充以速度进行,,则最大存贮量为
在以后我们停止补充,直到存贮量降到0,这作为一个周期。以后再重复上述补充办法,周期T为
模型2连续补充的经济批量模型在以后我们停止102在一个周期内费用为
因此单位时间的费用为
令,解得经济批量
最佳周期
最小费用
最佳生产时间
在一个周期内费用为因此单位时间的费用为令,解得经济批量最佳103模型3允许缺货的经济批量模型与模型1比较,我们去掉了模型1中的条件(i),其余条件不变。设初始存贮量y(0)=S,经过时间S/d,下降为0,但还不补充,出现缺货现象,直到时间T时补充一个批量Q,单位货物单位时间的缺货损失为b。
这里T=Q/d在[s/d,T]中存贮量为0,但我们假设在这段时间内,我们仍把货物卖掉,但尚未发出,而在补充了批量Q后,把货物发出,这样存贮量恢复到S,而Q-S则是欠货部分。
模型3允许缺货的经济批量模型104由于缺货,因此须支付损失费,以补偿对方的损失,一个周期内的费用为
单位时间内的费用为
现有两个变量,一是批量Q,二是S。令
得由于缺货,因此须支付损失费,以补偿对方的损失,一个周期内的费105
解得方程组
最大缺货量
106模型4有批发折扣的经济批量模型现在我们考虑有批发折扣的问题,其余条件同模型1设货物的单位成本与订货量有如下关系
货物的单位成本是。代表价格折扣的分界点,一般有当不考虑货物本身的成本时,单位时间费用为
(见模型1)模型4有批发折扣的经济批量模型107
现考虑货物本身的成本,则
在不考虑批发折扣的因素时,最佳批量为在考虑批发折扣的因素时,。因为,则不变或更大,即使不变,由模型1知费用也会增加,因此必使费用增加。当时,若不变也会使费用增加,若变小,则有增加,但变小,因此只能取这样我们就能确定最佳批量,
现考虑货物本身的成本,则108
先求出,并确定,使此时的总费用为
再求出
比较,找到使总费用最小的批量这时的Q就是最佳订货批量。二、定期盘点,需求变化的情况前面所述的各个模型都有一个要求,即需求速度不变,现在如果需求速度变化,则情况怎样呢?先求出,并确定,使109设在计划期内,分成n个相等的阶段,每个阶段的需求速度不同,分别为,两阶段的间隔时间为T,不允许缺货。现按两种不同的补充策略来讨论。
1.
T,
S补充策略按时间间隔T定期盘点,并及时补充,每次的补充量将存贮量恢复到定额水平S,则在计划期间的总费用为为了保证不缺货,则设在计划期内,分成n个相等的阶段,每个阶段的需求速度不同,110所以令各个阶段的订货量分别为
2.T,
S,
S策略在这里我们通过一个例子来说明解此类问题的方法例:某鞋店出售橡胶雪靴。过去的经验表明销售旺季只有6个月,从10月1日到3月31日,商店对明年的需求预测如下:月份101112123需求402030403020所以月份1011121111雪靴进价每双4元,但供应者只依整批供应,每批10,
20,
30,
40,
50或60双,每批定货提供批发折扣批量102030405060折扣%5510202530
每次订货费10元,每双雪靴每月存贮费0.2元,且热销季节前后存贮都为0,假定每月需求是常数,存贮费按月存贮量计算,求使总费用最小的订货方案。[解]本题中无存贮限制,每月补充量可以只满足本月需求,也可以满足以后几个月的需求,以后可以补充,也可以不补充,这样由于情况复杂,用前面的方法求解有困难,但我们可以用动态规划的方法来求解。雪靴进价每双4元,但供应者只依整批供应,每批10,20,112
则状态转移方程为
阶段效益函数为
这里月的订货费用,包括订购费和货物成本
113订货数折
扣
%10548205863010118402013850251606030178动态规划基本方程
订货数折扣%105482058630101184114根据动态规划基本方程
我们经计算可得如下结果
所以
根据动态规划基本方程我们经计算可得如下结果115新编-【大学课件】统计方法建模116新编-【大学课件】统计方法建模117
这样就得最优补充策略最小总费用=
118三、单周期随机存贮模型
前面我们考虑的是需求是确定的情形,但在很多情况下需求实际上是随机的。现在我们来考虑需求随机的问题,这里我们考虑的是在需求过程中只进一次货的情况,这种情况适用于季节性强,更新快,不易保存的商品如报纸就是一个典型例子。这时的问题是如何确定适当的订货量Q,因为订货太多,销售不完就必须处理掉,造成损失;而订货太少又会造成缺货损失。--表示每单位商品的成本
S--表示每单位商品的售价
v--表示当销售不掉时,每单位商品的处理价,且v可正可负--订货量
a--订购费用
h--单位商品缺货损失
P--单位商品缺货损失
三、单周期随机存贮模型119
需求量,是一个随机变量
需求量X的概率下面我们建立利润函数,这里销售期为,销售速度均匀因此期望利润需求量,是一个随机变量因此期望利润120现在要求出,使极大,由于是离散的,不能用求导数的方法,但我们可以仿照进行。
令
令
则得
(8.3)上式是和离散的时候的结果,若和是连续的,设的密度函数为,则得现在要求出,使极大,由于是离散的,不能121
令得
(8.4)解(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 6 我们神圣的国土 第三课时 (说课稿)-部编版道德与法治五年级上册
- 7-1《短歌行》说课稿 2024-2025学年统编版高中语文必修上册
- 2025年企业招标承包经营合同
- 《7 剪纸艺术》(说课稿)-2023-2024学年四年级下册综合实践活动粤教版
- Module 8 Unit 1 Were going to visit Hainan.(说课稿)-2024-2025学年外研版(三起)英语四年级上册
- Unit 2 My week Period 4 Get ready for the new school year(说课稿)-2024-2025学年人教PEP版英语五年级上册
- 19海滨小城 (说课稿)-2024-2025学年三年级上册语文统编版
- 2025农副产品买卖合同书模板(合同版本)
- 2023八年级语文上册 第五单元 口语交际 复述与转述配套说课稿 新人教版
- 2024年春八年级历史下册 第10课 社会主义民主与法制的加强说课稿1(pdf) 川教版
- 伤残抚恤管理办法实施细则
- 提升模组良率-六西格玛
- DL-T+5196-2016火力发电厂石灰石-石膏湿法烟气脱硫系统设计规程
- 2024-2030年中国产教融合行业市场运营态势及发展前景研判报告
- 2024年微生物检测试剂行业商业计划书
- 河南开封介绍课件
- 通信设备售后服务方案
- 高中英语选择性必修一单词表
- 初中生物校本课程纲要
- 物业公司介绍
- 卖花生混声合唱简谱
评论
0/150
提交评论