版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
毕业设计(论文)文献综述专业信息与计算科学班级学生姓名学号题目机器学习之线性回归模型建模策略指导教师摘要机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和智能计算的核心研究课题之一。现有的计算机系统和人工智能系统没有什么学习能力,至多也只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。对机器学习的讨论和机器学习研究的进展,必将促使人工智能和整个科学技术的进一步发展。本课题研究机器学习中比较基础的线性回归模型,以及误差分析,并将这些算法在某些领域中进行应用。AbstractMachinelearningisanotherimportantresearchfieldofartificialintelligenceapplicationafterexpertsystem,anditisalsooneofthecoreresearchtopicsofartificialintelligenceandintelligentcomputing.Existingcomputersystemsandartificialintelligencesystemsdonothavetheabilitytolearn,atmost,onlyverylimitedlearningability,andthuscannotmeetthenewrequirementsoftechnologyandproduction.Thediscussionofmachinelearningandtheprogressofmachinelearningresearchwillsurelypromotethefurtherdevelopmentofartificialintelligenceandthewholescienceandtechnology.Thispaperstudiesthelinearregressionmodelinmachinelearning,andtheerroranalysis,andappliesthesealgorithmsinsomefields.第一章引言机器学习是关于理解与研究学习的内在机制、建立能够通过学习自动提高自身水平的计算机程序的理论方法的学科。近年来机器学习理论在诸多应用领域得到成功的应用与发展,已成为计算机科学的基础及热点之一。机器学习已经有了十分广泛的应用例如搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
第二章基本概念2.1机器学习的概念什么叫做机器学习(machinelearning)?至今,还没有统一的“机器学习”定义,而且也很难给出一个公认的和准确的定义。为了便于进行讨论和估计学科的进展,有必要对机器学习给出定义,即使这种定义是不完全的和不充分的。顾名思义,机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。这里所说的“机器”,指的就是计算机;现在是电子计算机,以后还可能是中子计算机、光子计算机或神经计算机等等。2.2线性回归的概念线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。在统计学中,线性回归(LinearRegression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。(这反过来又应当由多个相关的因变量预测的多元线性回归区别,而不是一个单一的标量变量。)回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。2.3线性回归的建模在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况,线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。像所有形式的回归分析一样,线性回归也把焦点放在给定X值的y的条件概率分布,而不是X和y的联合概率分布(多元分析领域)。线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。2.4线性回归的用途线性回归有很多实际用途。分为以下两大类:如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。给定一个变量y和一些变量X1,...,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在桥回归中最小化最小二乘损失函数的惩罚.相反,最小二乘逼近可以用来拟合那些非线性的模型.因此,尽管“最小二乘法”和“线性模型”是紧密相连的,但他们是不能划等号的。第三章研究背景及意义3.1研究背景及意义全球生态系统种类丰富,干旱地区是其中不可或缺的种类,也是当今全世界各国开发相对较晚的区域。因此,为了解决干旱区当前面临的重要环境问题,以及防范于未然的科学决策,积极开展干旱区的生态学理论与实践研究势在必行,并且具有极其重要的现实意义。西北干旱区是我们国家三大自然区域之一,其具有规模大、高强度开发历史短的特点,因此,与其他的自然区域相比较而言,西北干旱区境内蕴藏了庞大的尚未开发的自然资源,使其成为我国未来经济建设中必须得重视的一个环节,同时也具有着时代赋予的重大历史使命[1]。所以,我们要尽可能多的去开展干旱地区的生态研究,深化课题深度与广度,在拉动经济发展的同时,也要注重当地的生态环境保护工作的开展。荒漠地区具备典型的温带荒漠特点,同时也属于相对脆弱的干旱生态系统,条件恶劣,生态环境差,啮齿动物凭借其种类多、繁衍快、个头小等多方面优势,成为荒漠生态系统中不可或缺的一部分,是食物链中必不可少的消费者这一环节,对于荒漠地区的保护和利用来说,具有不可代替的作用。干扰可以改变生态系统中各类资源的自主分配以及导致重组生态结构,很多生态物种的繁衍与人们的干扰有关,人为的干扰越大,可能引起的破坏性就越大[2],导致环境异质化。因此,本文主要就是分析西北干旱地区,在过牧和轮牧干扰下,啮齿动物生物量与植物因子之间的线性关系,通过给定的植物因子数据来预测啮齿动物的生物量。机器学习是学习和理解内在机制的重要机制,为计算机程序建立理论方法,可以通过自主学习提高计算水平。近年来,机器学习理论在许多应用中得到了成功应用和开发,逐渐成为计算机科学的基础之一[3]。机器学习有广泛的应用,如医学诊断,搜索引擎,语音和手写识别,信用卡欺诈检测,DNA测序,证券市场分析,机器人和战略游戏使用。荒漠区植物因子与动物生物量这些数据庞大,人工不方便去处理如此繁杂的数据,而机器学习在处理大数据方面占据着绝对的优势。所以依据提供的数据,通过机器学习来建立数学模型,剖析荒漠区不同干扰下植物地上生物量同啮齿动物生物量的线性关系[2],并揭示不同干扰下植物生物量与啮齿动物生物量之间的变化趋势,通过这些趋势进行合理的环境保护。3.2国内外研究现状3.2.1国外研究现状二十世纪时生态学已经进入了发展阶段,1903年美国年轻学者达文波特首先开展了对动物群落生态学的研究,但在其后直到五、六十年代,动物群落生态学仍把种群之间的数量变动问题作为研究重心,可是科学界对动物群落的研究力度不够[4]。20世纪70年代和80年代,外国动物社区的生态学取得了一些进展[5],特别是在20世纪90年代初,美国生态学会提出了一个持续的生物圈计划,并在其周围进行了大量的动物生态研究[6]。例如:Brown(1977),Rosen-zweig(1969)研究了北美和美国西北部沙漠地区啮齿动物群落多样性与植物多样性与降水之间的关系。Hallett(1982)应用多种分析方法研究沙漠地区小型哺乳动物的物种竞争和栖息地利用,并认为这些问题在啮齿动物物种的分布中起重要作用。Bowles(1982)采用统计学方法来确定沙漠地区啮齿动物群落的共存状态和个体大小之间的关系。他认为,个别小物种在一小部分栖息地中受到种间竞争。欧文(1988)利用iltmalns模型研究了啮齿动物和食肉动物的多样性和低生产率,生产率降低时,其多样性得到改善[6]。Brown(1985)研究了增加的食物和物种迁移对社区结构的影响。限制食物资源和种间竞争是影响沙漠地区啮齿动物社区的主要因素之一。Borund(1989)研究了沙漠地区啮齿动物和物种的共存机制,提出了两个机制:环境选择和食物效率的季节变化。Ktoler(1948)研究了沙漠地区啮齿动物群落的结构,并认为啮齿动物群落处于掠夺或资源的风险。当栖息地捕食风险不同时,捕食可以形成猎物社区结构,捕食者逃避风险栖息地专业化减少种间竞争,促进不同人群的共存。啮齿动物继承研究是社区生态研究的内容之一,其理论与实践研究对生态研究具有重要意义,防治啮齿动物和啮齿动物的防治也很重要。1.2.2国内研究现状近年来,中国生态工作者对干旱区啮齿动物群落进行了大量的基础研究,包括物种组成,结构,动植物,均匀度,相对丰度,物种多样性,分布群体,相似系数,利基,社区优势等等。比如著名学者周庆强(1982)研究了中国内蒙古白银溪莱典型草原的啮齿动物群落的多样性,空间布局和结构[7]。在本文中,研究了高寒草甸地区幼虫的多样性。刘乃发(1990),吴晓东(1994)利用数学模型研究了干旱区啮齿动物群落结构与环境的关系。多样性和植物高度和覆盖面,土壤和降水。阿布里米提(1991)研究了新疆干旱区啮齿动物群落结构特征与干旱地区环境因素之间的关系曾宗勇(1994)研究了北美沙漠啮齿动物群落变化与物种多样性等特征的关系。从营养,空间和利基的角度来看,社区中种间关系的重要组成部分是竞争在有限的营养,时间和空间。竞争导致时间或空间位置的一些分离,一些只是部分分离,有些还没有分离。近年来,生态学家对城市和农田啮齿动物群落的继承进行了研究,但对早期干旱地区啮齿类动物群落继承的研究较少。只有刘继科(1979)研究了农田啮齿动物群落继代和生物量变化[7]。郭聪(1992)研究了农村啮齿动物群落的继承趋势及其在洞庭丘陵平原的继承。丁平(1992)研究了人口迁移与养殖小野兽群体的关系,并讨论了小型哺乳动物群落和养殖小野兽群落的迁移与传播之间的关系[5]。在荒漠地区的啮齿动物社区演变,只有张大明(1992)的部分研究工作。1.2.3干旱地区啮齿动物群落的发展方向和趋势科学研究的发展周期是从定性研究到定量研究。近年来,生态学研究表明,啮齿动物种群生态学研究成功运用了数学模型,使啮齿动物的种群生态越来越客观越来越准确,促进了啮齿动物种群生态成熟发育。而啮齿动物社区生态晚期的演变,对理论和方法的了解还不成熟。但随着动物群落生态学的发展,我们的生态学家将从定性描述到准确定量研究,进一步研究啮齿动物群落生态学的研究,促进啮齿动物群落生态学的成熟与发展。诸如feger(1957),梁忠禹(1964),杨春文(1991),米静川(1990,1993)利用计算机技术和数学原理研究干旱地区啮齿动物群落的结构和多样性。刘乃法(1994)采用统计学方法,通过电子计算机研究了沙漠地区啮齿动物群落结构与环境因素的关系。随着科学的发展,电脑广泛应用于生态研究。我们的生态工作者还使用电脑通过多变量分析中的聚类分析和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度沙石厂水资源管理与利用合同3篇
- 2024年货车融资租赁合同3篇
- 2024年度股权投资合同投资标的详细描述2篇
- 二零二四年度机器设备租赁合同及运营管理服务协议3篇
- 2024年度互联网金融平台技术与运营合同2篇
- 2024年度采购员福利改善合同:砂石场与采购员之间的福利待遇调整协议
- 2024年生产制造劳务分包合同样本
- 2024年修订:工程合同签订条件及注意事项2篇
- 2024年专用:酒类产品代理销售合同样本3篇
- 2024年广告发布合同:广告公司与广告主间的广告投放协议3篇
- 工程新增工程量补充协议怎么写
- 《活着》读书分享
- 恙虫病患者的护理查房
- 人生四时唐诗九味
- 基模高斯光束光斑半径
- 2024年高中学业水平合格性考试数学模拟试卷试题(含答案详解)
- 工业自动化中的智能装配线布局
- 社会心理学研究中的数据分析方法
- 人教版三年级数学上册“双减”作业设计 7.3周长的认识(解析版)
- 曼昆宏观经济学课后习题答案
- 北京市社保培训课件
评论
0/150
提交评论