一、遗传算法在遥感中的应用_第1页
一、遗传算法在遥感中的应用_第2页
一、遗传算法在遥感中的应用_第3页
一、遗传算法在遥感中的应用_第4页
一、遗传算法在遥感中的应用_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、遗传算法在遥感中的应用遗传算法简介:按照达尔文(C.Darwin)的生物进化论,生物界的进化遵循“物竞天择,适者生存”的法则。按照孟德尔(G.Mendel)和摩根(T.Morgan)的遗传学理论,遗传物质以基因的形式排列在染色体上,不同位置的基因控制着生物的不同特性,不同的基因组合产生的个体对环境的适应性不同,通过基因杂交和突变能够产生对环境适应性强的后代个体。总之,在一定的环境影响下,生物物种通过自然选择、基因交换和变异等过程进行繁殖演化,构成了整个生物进化过程。遗传算法的思想来自上述生物进化过程,其基本原理的研究也是从研究生物进化的基本规律开始的。研究发现,生物进化是一个不断循环的过程

2、。在这一过程中,生物群体不断完善和发展。所以生物进化过程本质上是一种优化过程,种认识启发着遗传算法的研究者将其应用到优化计算领域,创立新的优化计算方法,并将这些方法应用到复杂的工程计算领域之中。遗传算法的基本过程遗传算法维持一个种群,每一个体均代表问题的一个潜在的解,每一个体都被按预定的评价函数评价优劣并得到其适应值。算法开始时先随机地产生初始种群,计算每个个体适应度值,根据适应度值对某些个体进行交叉、变异等遗传操作,形成新的个体,即子代,子代继续被评价。从父代种群和子代种群中选择比较优秀的个体就形成了新的种群。由于新种群个体是上一代种群的优秀者,继承了上一代的优良性态,可能收敛于最优解。遗传

3、算法就这样反复迭代,向着更优解的方向进化,直至满足某种预定的条件。在若干代以后,算法收敛到一个最优的个体,该个体很可能就是代表问题的最优或次优解。遗传算法利用生物进化和遗传的思想实现优化过程,区别于传统的优化算法,其基本特征主要表现在以下几个方面。1智能性遗传算法的智能性包括自适应、自组织和自学习性等。应用遗传算法求解问题时,在确定了编码方式、适用度函数及遗传算子以后,算法将利用遗传算法中获得的信息自行组织搜索。由于基于自然选择的规则,即适者生存、劣者淘汰,所以适应值大的个体具有较高的生存概率。通常适应值大的个体具有与环境更适应的基因结构,再通过交叉和基因突变等遗传操作就可能产生与环境更适应的

4、后代。遗传算法的这种自组织、自适应特征现时也赋予了它具有能根据环境的变化自动发现环境的特性和规律的能力。应用遗传算法使得我们在算法设计的过程中无需事先知道问题的全部特点,这尤其适合于那些结构尚不清楚的复杂问题。2并行性遗传算法的并行性表现在两方面:一是遗传算法的内在并行性,即遗传算法本身非常适合大规模并行操作。其最简单的并行方式是让几百甚至上千台计算机各自进行独立种群的进化计算,运行过程中可不进行任何通信,等到运算结束时才通信比较,选取最佳个体,这种并行处理方式对并行系统结构也没有什么限制和要求。二是遗传算法的隐式并行性。由于遗传算法不是在一个单点上进行寻优搜索,它可以同时搜索解空间中的多个区

5、域,并相互交流信息,这种搜索方式使得它虽然每次只执行与种群规模 N 成比例的计算,而实质上已进行了大约 O ( N3)次有效搜索,这使得遗传算法能以较少的计算获得较大的收益。3稳健性遗传算法只利用适应度函数信息,基本上不用搜索空间的知识或其它辅助信息,而仅用适应度函数值来评估个体,在此基础上进行遗传操作。适应度函数不受连续性、单峰等假设的限制,且其定义域可以任意设定。这一特点使得遗传算法的具有很强的鲁棒性。4全局优化传统的优化方法,一般采用的是梯度下降的爬山策略,当遇到多峰函数的情形往往容易陷入局部最优。而遗传算法能在解空间的多个区域内同时进行搜索,并且能以较大的概率跳出局部最优,以找出全局的

6、最优解。5多解性遗传算法是采用种群方式组织搜索。它从多个解出发,通过这些点内部结构的调整和重组来形成新的解。因而,每次都将提供多个近似解,这对多目标搜索或者需要多个近似解作为参照的情况下是非常有用的。6不确定性遗传算法的不确定性是伴随其选择的随机性而来的。遗传操作算子主要利用概率转换规则,而非确定性规则,这使得在算法的进化过程中,事件的发生与否带有较大的不确定性。有人已经证明,在任意初始化、任意交叉算子以及任意适应度函数下,遗传算法都不能收敛到全局最优。遗传算法在遥感中的应用遗传算法可以用在遥感数据的处理,遥感影像匹配,遥感影像增强,混合像元的快速分解和分类,遥感多光谱影像的分类和遥感图像的压

7、缩等方面。(1)遗传算法在数据处理中的应用遥感数据的遗传超平面分类方法遥感数据是一种特殊的图像数据形式,它既具有自己的特殊性和复杂性,也有图像数据的一般性。由于其特殊性和复杂性,因而将遗传算法引入遥感数据的处理还是近几年的事。如美国AlamoS空间与遥感科学国家实验室StevenP.Brumby等人利用遗传算法的优化搜索性能,在众多的方法中寻找适合特定研究目的的最优分类方法。印度Pal等人则致力于遥感分类参数的遗传优化问题。国内庄家礼等人则使用遗传算法对遥感反演参数进行优化,取得了不错的效果。分类是找出描述并区分数据类别或者概念的模型以便能使用模型预测类标记未知的数据的过程(Han2001),

8、或者是智能系统面对纷繁复杂的传感器数据时,为从中提取出有意义信息所采取的一个关键的处理步骤(Richard2003)。对遥感数据的分类是一个根据遥感图像辨识地表覆盖类型的过程。由于遥感图像具有多波段以及数据量大的特点,所以遗传算法比较难于直接针对数据进行处理,一般是建立一个可以使用遗传算法进化的模型。在遥感数据分类处理领域,以L等(2001)提出使用遗传算法来确定超平面的空间组合位置,从而使得遗传算法得以开始应用于遥感图像分类中。在使用遗传一超平面算法进行分类的过程中,除了要考虑遗传算法本身的特点以外,建立一个适合遗传进化的超平面组合模型具有非常重要的意义。通过遗传算法进行超平面分类也是一个遗

9、传算法应用于模式识别/分类的问题,在给定超平面集合的条件下,通过对训练点集合中训练点进行模式描述、模式匹配然后利用遗传算法的优异搜索性能,通过进化的方式对各种不同的模式分类方案进行比较、选择,得到最好的模式分类方案。最后扩展到整幅图像达到模式分类的目的。在遗传算法优化的超平面分类模型中,由超平面方程的参数经过特殊编码而成的二进制串集合形成了遗传算法的搜索空间。这是因为特定位数的二进制串可以代表特定空间的所有超平面方程。遗传算法通过选择、变异、交叉等遗传操作在此搜索空间内搜索最优的解,中间通过解码过程将二进制串还原为超平面的参数以计算每条染色体的适应度(目标函数)。目标函数过分类训练的精确程度来

10、实现,本质上来讲,这是一个自适应的迭代过程。训练过程中,训练点数与分类错误的点数之差作为一系列(套)超平面的适应度。最佳的染色体对应最优的分类方案,也就是最合适的超平面集合。通过这一系列超平面在多维空间中的区域划分得到的多维空间模式分类结果被认为是精度最高的图像分类方案。基于遗传算法的影像匹配遗传算法(Genetic Agorithms简称GA)是二十世纪七十年代开始兴起的以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与群体内部染色体的随机信息交换机制相结合的搜索算法。进人二十世纪九十年代以后,遗传算法已经成为一种实用快速、稳定性好的优化技术。将遗传算法用到影像匹配相对于其它的方法,

11、遗传算法对求解问题只要求是可计算的,无可微性及其他要求,且较易获得全局最优解。应用遗传算法的求解一般包括以下几个步骤:(1)编码GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合便构成了不同的点。(2)初始群体的生成在问题的候选解范围内随机产生N个初始串结构数据,每个串结构数据称为一个个体,N个个体构成一个群体,GA以这N个串结构数据作为初始点开始迭代。(3)适应度函数的确定适应性函数表明个体或解的优劣性。不同的问题,适应性函数的定义方式也不同。(4)选择选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代为下一代繁殖子孙。遗传算法通过选

12、择过程体现这一思想,进行选择的原则是适应性强的个体为下一代贡献一个或多个后代的概率大。选择实现了达尔文的适者生存原则。(5)交叉交换操作是遗传算法中最主要的遗传操作。通过交换操作可以得到新一代个体,新个体组合了其父辈个体的特性。交换体现了信息交换的思想。(6)变异变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率随机地改变串结构数据中某个串的值。同生物界一样,GA中变异发生的概率很低,通常取值在0.0010.01之间。变异为新个体的产生提供了机会。这里我们用VLL 法(基于物方的影像匹配),设为描述两像片匹配程度的测度,p 为所要求的模型参数(遗传算法中称为个体)则目标函数为:f(p

13、)= (1)个体 p 可根据如下方法取得。设影像匹配窗口大小为:Zkx,Zky设 x10,y10为左片窗口近似中心点的坐标,考虑几何形变与误差,左片窗口实际取得的像素坐标为:x1 = a10 + x1 + x10 x1 - kx,kxy1 = b10 + y1 + y10 y1 - ky,ky右片窗口中实际取得的像素坐标为:x2 = a20 + a21 x2 + a22 y2 + x20 x2 - kx,kxy2 = b20 + b21 x2 + b22 y2 + y20 y2 - ky,ky其中:x20,y20为右片窗口近似中心坐标。考虑右像点相对于左像点的线性灰度畸变可得:g(x1,y1)

14、= h0 + h1 g(x2,y2)其中,g 为左像窗口像素值;g为右像窗口像素值由上可知,个体可表示为:p = a10,b10,a20,b20,a21,b21,a22,b22,h0,h1,z实际应用中,p 中参数 z 是影像匹配 VLL 算法中的物方坐标高程。以上所求优化问题可表示为:maxf(p)s.t. a10min=a10=a10maxzmin=z=zmax遗传算法终止后提取的最好的个体中的 z 值即为VLL 中物方 A 点的高程。遗传算法中的个体评价函数即个体适应度函数就是优化问题的目标函数 . 根据实际情况适应函度数可采用相关系数(矢量夹角)测度或差平方和(差矢量模),其测度公式为

15、:差平方和适应度为:遗传算法初始群体的生成、选择算子、交叉算子、变异算子方面都作了改进,使之更适合影像匹配的具体问题。实验结果表明,该方法大大减小了误匹配率,提高了匹配精度,运算复杂度也小于传统的影像匹配,是一种较为理想的匹配方法。(3)遗传算法在图像增强中的应用航空(遥感)影像是通过空间传感器获得的有关地表的图像,它包含了十分丰富的地理信息,是人们获取地面信息重要来源之一。但是,由于受到传感器精度,光照度等内在和外在的多种因素影响,影像不可避免存在反差较低,地物边界轮廓不清等现象,给直接判读和量测带来了一定的困难。影像增强就是解决这一类问题的一个重要手段,其主要目的就是通过一定的变换把影像转

16、换成更适合人眼观察判断或机器视觉分析处理的另一种形式,其实质是有选择地强调影像中某些信息而抑制其余信息,以增强影像的效用。遗传算法在影像增强中的应用的一般步骤:(1)非线性变换函数的构造 输入的图像从视觉效果来看,一般的图像有偏暗、偏亮、或灰度集中在某一区域三类情况。针对这几类不同类型的退化图像,我们需要不同的非线性变换。设这种非线性变换的函数为,原图像像素灰度为,变换后的像素灰度为。首先,对作归一化处理得到,=,分别为原图像灰度的最大和最小值,显然的取值范围在(0,1)之间。对于非线性变换函数作规定,和u取值范围也在(0,1)之间。在考虑对原图像不超过,的范围拉伸的对比度:(2)编码现在求解

17、从输入图像至输出图像的灰度对应关系,也就转化成求解 T (u)的 5 个参数问题,这可视为遗传算法的表现型。从表现型到基因型的转换,我们采用实数编码,以一个一维五元数组表示一条染色体,即 p 1 ,p2,p3,p4,p5,每个参数对应一个基因位。问题就转化为求目标规划下的这五元素的组合。通过对 T1 (u)、 T2 (u)的数学实验,为使曲线自由延展且满足一定精度,函数的参数范围设定如表 Pl p2 p3 p4 ps 最小值 1 0 1 0 0 最大值 15 1 25 1 1 采样间隔0.1 0.010.1 0.010.01从表中可以看出五个元素的组合有140x100x240x100x100=

18、3.36这样大。在这样大空间进行搜索,遗传算法将发挥其优势。由于T (u)是由不是由的组合构成,这就极可能使使表现型空间的某一变换曲线对应基因型空间的多条基因。(3)适度函数遗传算法中个体进化的动力就是所要构建的适应度函数。在对一幅影像增强过程中,适应度函数设计就是要兼顾图像的整体与局部,大的结构和小的细节平衡体现。因此,考虑的因素有:图像的信息嫡E、能量、紧致度C、信噪改变量。适应度函数如下: 表明增强影像的灰度层次损失越少,保留的灰度层次越多,且阀值Th的设定还可以防止影像过度增强。(4)选择策略和遗传算子1、选择策略。采用最优个体保存法。设种群规模为 N,交叉算子产生比例为 r,每代选择

19、 N + int r*(N-2)个父个体。复制保存的最优个体数为 2,其余父个体采用期望值选择法中的无回放余数随机选择方式选择所需数,2 * intr *(N-2)个用于交叉,N - 2 -intr*(N-2)个用于变异。2、 交叉算子。针对十进制实数编码,这里采用一种局部寻优的交叉算子,以使子个体总是向着更优的方向搜索,这其实是仿射交叉的一个特例。对于求极小值问题,局部寻优算子定义为: X= 式中 x1 ,x 2为父个体,x 为交叉后的子个体, 为0.6,1.3间的机数,这样设是为了使交叉子代在最好值附近;f(x)表示 x 的适应值。若 x 的取值超出了取值范围,则重新生成一个随机数,直至满

20、足要求。3、变异算子。大多数变异算子是随机的,这里引入的变异算子正比于个体与父代最优个体的差异,有:式中 x 为原个体,为父代中适应度最大的个体, 为0,1间的随机数。(5)控制参数GA 控制参数种群规模取 30,最大迭代次数 100,最小迭代次数50,停机最优个体适应度变化值小于 0.001 时停机,适应值无变化持续 200 秒时停机。交叉概率和变异概率采用自适应法。这是遗传算法在遥感图像增强中的应用,通过遗传算法可以很好的达到遥感图像增强的目的。总结:从上面可以看出,遗传算法在遥感中的应用非常广泛,我们可以运用遗传算法进行图像增强,遥感数据的处理,遥感影像匹配,混合像元的快速分解和分类,遥

21、感多光谱影像的分类和遥感图像的压缩等方面。二、利用GA算法编程实现f(x)=x*sin(10*x)+1.0最大值的求解问题,要求提交伪代码算法说明及实验步骤和结果说明。遗传算法(Genetic Algorithms简称GA)是二十世纪七十年代开始兴起的以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与群体内部染色体的随机信息交换机制相结合的搜索算法。进人二十世纪九十年代以后,遗传算法已经成为一种实用快速、稳定性好的优化技术,在模式识别、神经网络,控制系统优化等方面都得到了广泛的应用。遗传算法原理简介在遗传算法的执行过程中,模拟了达尔文的生物进化理论中的适者生存原理,通过适应度函数值的大

22、小来决定个体在下一代中的生存机会。适应度函数是与所提问题目标紧密相联的一个量,对于实际问题,构造合理的适应度函数是遗传算法的一个极为关键的问题。遗传算法包括三种主要操作方法,三个基本要素的确定。三种基本操作方法是(1)选择(又称复制):选择或复制是从当前群体中选择优良的个体产生下一代的过程,其选择的依据是以个体适应函数值的大小来进行选择的,个体适应函数值越高,其被选择的机会就越多,那么其繁殖的子孙在下一代中产生的个数就越多,否则就少,甚至被淘汰。(2)交叉:交叉操作是遗传算法中最主要的遗传操作.简单的交叉可分两步进行,首先对种群中个体进行随机配对;其次在配对个体中随机设定交叉处,使配对个体彼此

23、交换信息。 (3)变异:变异操作是为了增加遗传算法找到最优解的能力,它以很小的概率随机地改变字符串中某个位置的值.这个操作与前面两个操作结合在一起可仿止解的过早收敛。三个基本要素的确定: (1)参数编码:由于遗传算法不能直接处理解空间的解数据,因此,必须通过编码将它们表示成遗传空间的基因型串结构数据。(2)初始群体的生成:由于遗传算法的群体型操作需要,必须为遗传操作准备一个由若干个初始解组成的初始群体.初始群体的每个个体都是通过随机方法产生的。 (3)适应度的评估与检测:遗传算法在搜索进化过程中一般不需要其它外部信息,仅用适应度值来评估个体或解的优劣,并以此作为遗传算法的依据。具体到本题目中,

24、我选择使用C+来编写这个程序,这个程序的关键点和难点就是交叉,变异。下面具体介绍下本程序。开始GEN=0产生初始的种群是否满足停机准则指定结果是结束计算每个个体的适应值i=0i=M?以概率选择遗传操作否是交叉变异将两个后代插入到新的种群GENi=GEN+1上面是本程序的流程图,(1)随机产生一个由确定长度的特征字符串组成的初始种群。(2)对该字符串种群迭代地执行步骤和步骤,直到满足停止准则为止:计算种群中每个个体字符串的适应值;应用交叉和变异等遗传算子产生下一代种群。(3)把在后代中出现的最好的个体字符串指定为遗传算法的执行结果,这个结果可以表示问题的一个解。其中GEN是当前代数。 首先,定义

25、程序中所要用到的变量/ const const double DOUBLE_MAX = 999999999999;const double DOUBLE_MIN = -DOUBLE_MAX;const size_t MAXGENERATION = 100000;const size_t MAXUNCHANGE = 1000;/ 当最优值持续MAXUNCHANGE代不发生变化,停止const double MINDIFF = 0.0001;/ 所能分辨的适应值函数的最小差值const size_t POPULATION = 50;/ 样本的大小const size_t SAMPLELENGTH

26、= 22;/ 每一个样本的长度/ for x belong to -1, 2const double LOWBOUNARY = -1;const double ZOOMSCALE = 3;typedef char MyBit;typedef MyBit BinBitsSAMPLELENGTH;/ action to do in next stepenum ActionSTAY, MUTATE , CROSSOVER, DONE;然后定义一个样本类class MySampleprivate:/ initialize samplesvoid Init();BinBits _bits;/ binar

27、y string double _fitvalue;double _prop;/ probability to stayAction _action; / what to do in next steppublic:MySample()Init();MySample(const MySample& rhs);MySample& operator = (const MySample& rhs);double Fitness();/ get probability to STAY/ double Probability() const; inline Action NextAction() con

28、streturn _action;/ calulate probability of current samplevoid CalcuPro(double sumfit);void CrossOver(MySample& rhs);void Mutate();这个类中包含了初始化函数Init(),对样本进行初始化。初始化的具体过程如下:void MySample:Init()/ initialize binary stringfor (size_t i = 0; i SAMPLELENGTH; +i)if (rand()%2) = 1)_bitsi = 1;else_bitsi = 0;/ i

29、nitialize action_action = DONE;计算适度函数void CalcuPro(double sumfit),void MySample:CalcuPro(double sumfit)_prop = _fitvalue / sumfit;/ decide what to do in next stepif ( static_cast(rand() / static_cast(RAND_MAX) _prop )_action = STAY;else_action = CROSSOVER;交叉函数void CrossOver(MySample& rhs);void MySam

30、ple:CrossOver(MySample& rhs)size_t pos = rand() % SAMPLELENGTH;/ cross over at posMyBit tmp;for (size_t i = 0; i = 0; -i)if (bitsi = 1)numer += denumer;denumer += denumer;return static_cast(numer) / static_cast(denumer);在计算二进制数的时候我们从后往前计算,并且只用到了加法,没有用乘法这样可以提高运算的效率。程序的最后结果集中在2.82到2.83,是一个比较理想的结果。这个程序

31、不能够实现一部分交叉,一部分变异,所以使得最后的结果不是足够的精确。三、任选一种数据挖掘软件进行操作使用,并进行分析和总结。数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务

32、是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。在技术上可以根据它的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。数据的抽取数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面的处理。在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数

33、据源的变化,使系统更便于管理和维护。数据的存储和管理数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据的表现形式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而快速累积。在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将普通关系数据库改造成适合担当数据仓库的服务器。数据的展现在数据展现方面主要的方式有:查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;可视

34、化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术表现复杂数据及其相互关系;统计:进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式的知识。1) 数据挖掘能做以下六种不同事情(分析方法): 分类 (Classification) 估值(Estimation) 预言(Prediction) 相关性分组或关联规则(Affinity grouping or association rules) 聚集(Clustering) 描述和可视化(Des cription and Visualizatio

35、n) 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)2)数据挖掘分类 以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘 直接数据挖掘 目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。 间接数据挖掘 目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。 分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘3)各种分析方法的简介 分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没

36、有分类的数据进行分类。例子: a. 信用卡申请者,分类为低、中、高风险 b. 分配客户到预先定义的客户分片注意: 类的个数是确定的,预先定义好的估值(Estimation) 估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类的类别是确定数目的,估值的量是不确定的。例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 01)。然后,根据阈值,将贷款级别分类。 预言(Prediction) 通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。 相关性分组或关联规则(Affinity grouping or association rules) 决定哪些事情将一起发生。例子: a. 超市中客户在购买A的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论