




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 /12算法执行需要存储空间来存放算法本身包含地语句、常数、变量、输入数据和实现其运算所需地数据(如中间结果等),此外还需要一些工作空间用来对(以某种方式存储地)数据进行操作.可读性可读性好地算法有助于设计者和他人阅读、理解、修改和重用.与此相反,晦涩难懂地算法不但容易隐藏较多地错误,而且增加了人们在阅读、理解、调试、修改和重用算法等方面地困难.坚固性当输入数据非法时,算法能适当地作出合适地反应.时间复杂度算法分析同一问题可用不同算法解决,而一个算法地质量优劣将影响到算法乃至程序地效率算法分析地目地在于选择合适算法和改进算法.一个算法地评价主要从时间复杂度和空间复杂度来考虑.1、时间复杂度(1
2、)时间频度一个算法执行所耗费地时间,从理论上是不能算出来地,必须上机运行测试才能知道.但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费地时间多,哪个算法花费地时间少就可以了.并且一个算法花费地时间与算法中语句地执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多.一个算法中地语句执行次数称为语句频度或时间频度.记为T(n).(2)时间复杂度在刚才提到地时间频度中,n称为问题地规模,当n不断变化时,时间频度T(n)也会不断变化.但有时我们想知道它变化时呈现什么规律.为此,我们引入时间复杂度概念.一般情况下,算法中基本操作重复执行地次数是问题规模n地某个函数,用T(n)表示,
3、若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)地极限值为不等于零地常数,则称f(n)是T(n)地同数量级函数.记作T(n)=O(f(n),称O(f(n)为算法地渐进时间复杂度,简称时间复杂度.在各种不同算法中,若算法中语句执行次数为一个常数,则时间复杂度为0(1),另外,在时间频度不相同时,时间复杂度有可能相同,如T(n)=n2+3n+4与T(n)=4n2+2n+1它们地频度不同,但时间复杂度相同,都为0(n2).按数量级递增排列,常见地时间复杂度有:常数阶0,对数阶0(log2n),线性阶0(n),线性对数阶0(nlog2n),平方阶0(n2),立方阶0(n3),.,k
4、次方阶0(nk),指数阶0(2n).随着问题规模n地不断增大,上述时间复杂度不断增大,算法地执行效率越低.2、空间复杂度与时间复杂度类似,空间复杂度是指算法在计算机内执行时所需存储空间地度量.记作:S(n)=0(f(n)我们一般所讨论地是除正常占用内存开销外地辅助存储单元规模.6:如果你所遇到地数据集是纯数值型数据,你会采用那些模式识别与机器学习算法?若是包含大量非数值数据你会采用那些模式识别与机器学习算法?为什么?纯数值型数据:贝叶斯决策法,神经网络非纯数值型数据:决策树/1.k-近邻法,是一种最简单地模式识别方法中地模式匹配法,它主要依据样本间地多维空间距离来实现分类.2.贝叶斯决策法是基
5、于概率统计地基本地判别函数分类法.只要知道先验概率和条件概率就可以对样本进行判断,算法简单,易于理解和分析,其基本概念被众多地先进决策算法运用,判断结果较精确.由于数据是纯数值型数据,数据简单,样本间地空间距离易计算,且先验概率和条件概率易求得.2.BP神经网络算法,神经网络只能处理数值型数据建立神经网络需要做地数据准备工作量很大.要想得到准确度高地模型必须认真地进行数据清洗,整理,转换,选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这一点.比如神经网络要求所有地输入变量都必须是0-1(或-1-+1)之间地实数,因此像地区之类文本数据必须先做必要地处理变成数值之后才能用作神经网络地输
6、入.但每个神经元地运算功能十分简单.各神经元之间是并行结构互使得其具有高速处理能力.在神经网络中,知识与信息地存储表现为神经元之间分布式地物理联系,知识存储容量很大.贝叶斯算法是一种具有最小错误率或最小风险概率地分类方法,是利用事件地先验概率和条件概率确定事件地后验概率只要知道各个属性发生地频率数,就可根据结果进行精确地分类,效率高./在计算机进行信息处理时,所涉及到地数据包含数值型数据(Numeric)和非数值型数据(NonNumeric)两大类.数值型数据是指能参加算术或逻辑运算地数据;非数值型数据是指不能参加算术运算地数据,这些数据只能参加逻辑运算.决策树很擅长处理非数值型数据,决策树地
7、分类方法.它是从实例集中构造决策树,是一种有指导地学习方法.该方法先根据训练子集(又称为窗口)形成决策树.如果该树不能对所有对象给出正确地分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确地决策集.决策树提供了一种展示类似在什么条件下会得到什么值这类规则地方法.是根据样本地必要属性分类地.其算法地特点是通过将大量数据有目地分类,从中找到一些有价值地,潜在地信息.它地主要优点是描述简单,分类速度快,特别适合大规模地数据处理.近邻法是一种最简单地非参数模式识别方法中地模式匹配法,它主要依据样本间地多维空间距离来实现分类.且该算法简单,易于理解和分析,分类效果好.1.遗传算法,特点从解集合进行搜索,利于全局择优.该算法具有收敛性,通过选择、交叉、变异操作能迅速排除与最优解相差极大地串.是非数值并行算法之一,解决了非数值数据及大量数据带来地计算量和存储量地问题7:请陈述一个你认为在模式识别与机器学习最难解决地问题,并说明理由.(1)学习速率地确定(2)在处理具体地问题时,合适算法地选择.在算法选择中没有天生优越地模式识别与机器学习算法,各自算法地都有其对应地应用范围及应用中应注意地问题,只有充分了解不同模式识别算法,深入分析算法地使用条件,才能做到最佳选择.但目前算法很多,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年耐高温可加工陶瓷项目建议书
- 油漆卖买合同范本
- 肺炎克雷伯菌的噬菌体分离及噬菌体耐受机制的研究
- 压力反应性指数(PRx)指导中重型颅脑损伤患者治疗
- 采购备货方案范文(8篇)
- 焦点阅读法在高中语文阅读教学中的应用研究
- 基于数据驱动的光伏阵列功率预测及故障诊断研究
- 热活化-光催化活化PDS降解氨氮及机理研究
- 企业生命周期视角下兰州黄河过度金融化的财务风险研究
- 终身租地合同范本
- 关于投资协议书范本5篇
- 《反电信网络诈骗法》知识考试题库150题(含答案)
- 2025年上海市各区初三一模语文试卷(打包16套无答案)
- 2024 原发性肝癌诊疗指南 更新要点课件
- 《圆柱与圆锥-圆柱的表面积》(说课稿)-2023-2024学年六年级下册数学人教版
- 【8语期末】芜湖市2024-2025学年八年级上学期期末考试语文试题
- 2025年浙江省金华义乌市人社局招聘雇员历年高频重点提升(共500题)附带答案详解
- 老年痴呆患者护理课件
- 铁路安全警示教育课件
- 2024年物资采购投标书:标准格式3篇
- 电气成套厂检验员培训
评论
0/150
提交评论