版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、专业前沿讲座心得体会近年来,数据挖掘引起了信息产业界的极大关注,其主 要原因是存在大量数据,可以广泛使用,并且迫切需要将这 些数据转换成有用的信息和知识。获取的信息和知识可以广 泛用于各种应用,包括商务管理,生产控制,市场分析,工 程设计和科学探索等。机器学习和数据挖掘这些年一直是计算机应用方面研 究的重点和热点,首先要了解什么是数据挖掘,简单地说, 数据挖掘是从大量数据中提取或 挖掘 知识。我一直对这方 面的知识颇感兴趣,这学期学院开设的学术前沿讲座的课程, 很有幸听到了文益民教授对于自己在机器学习和数据挖掘 方面研究的讲座,让我对这些知识有了深入浅出的理解,受 益匪浅。1212 月 5 5
2、 号,文益民教授做了题为“大规模数据的分类” 的讲座,在讲座的最开始,文教授提到了戈登德莱顿学 习的革命一书,皆在指导我们如何积累知识如何思考如何 学习如何去做研究,具有抛砖引玉的指导意义。在这之后, 又对了解机器学习和数据挖掘首先要了解的知识做了简要 的说明,比如对于问题的分类是分为线性问题和非线性问题 比如聚类的含义是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程 ; ; 比如对于这个世界上计算机的分 类可以只分成工人 (maker)(maker) 和思考者 (thinker)(thinker) 两类。至此正 式进入问题的讨论。对于这次讲座,文教授从四个方面进行了讲授。第一, 实
3、际应用中的大规模数据分类问题。第二,大规模数据给机 器学习带来的挑战。第三,大规模数据分类算法的研究。第 四,展望发展前景。文教授主要是在第三点中做了很多工作 也取得了可喜的成绩。在机器学习的实际应用中,大规模数据分类问题一般会 应用在以下几个方面,在高速高精度的工业图像检测方面, 在专利分类方面,在生物信息数据快速增长方面,在支持向 量机参数选择方面。大规模数据给机器学习带来的问题有: 1 1、算法一般不 是收敛太慢就是难以收敛,训练时间过长。2 2、海量数据无 法一次装入内存。3 3、算法可靠性得不到保证。 4 4、已经训练 好的学习器遇到心得训练样本时需要重新训练。在最重要的部分, 文教
4、授提到了几个重要的研究方法,包括算法,这里面包含有: 1 1、基于并行计算的算法, 2 2、以 并行计算方法求解工作集方法中每个迭代步中二次规划的 子问题, 3 3、 Meta-learningMeta-learning ,最小最大模块化支持向量机以 及 快 速 模 块 化 支 持 向 量 机 ,4 4 、 Cluster-SVMCluster-SVM , Cluster-based-SVMCluster-based-SVM , Cascade-SVMCascade-SVM 文教授在第三和第四点 中都有自己的工作和贡献,在第三点中,他提出了分类面拼 接算法, 在第四点中, 提出了分层并行支持向
5、量机训练算法。对于分类面拼接算法我进行了比较仔细的了解,并下载阅读 了文教授于 XXXX 年 3 3 月份在湖南大学学报上发表的论文“基 于分类面的快速模块化支持向量机研究” ,对于分类面拼接 算法有了初步的研究,下面说说我对这个算法的理解。信息采集和信息处理技术的快速发展导致了诸如公共 健康数据、信用交易数据、国家经济普查数据、网络文本数 据和地理信息数据等大规模数据集的产生。由于训练时间很 长和空间需求很大,现有的大多数机器学习算法很难被直接 用于大规模数据的机器学习。这个算法是针对大多数现有的机器学习算法处理大规 模问题时需要的训练时间很长和存储空间很大的难点而提 出的,英文名是psfn
6、rSVMspsfnrSVMs ,在训练阶段, psfm2SVMspsfm2SVMs 采用一簇平行超平面对大规模 问题实施软划分,然后针对每个子问题并行训练支持向量机。 在测试阶段,测试样本坐落于哪个子问题所在空间中,就由 该子问题训练的支持向量机给出判别结果。在 4 4 个大规模问 题上的实验表明 : : 与采取硬划分的快速模块化支持向量机 (fm2SVMs)(fm2SVMs)相比,软划分能够使 psfm2SVMpsfm2SVMs s得到更加光滑的 分类面,因而 ps2fm2SVMsps2fm2SVMs 的泛化能力较高。在不增加训练 时间的条件下,psfm2SVMspsfm2SVMs 减少了由
7、于训练集分割导致的分 类器泛化能力下降。支持向量机方法的本质是在训练集的一个高维像空间 中寻找最大间隔分类超平面,这个分类超平面对应于训练集 所在空间的一个光滑曲面。如果采用训练集分割的方法,将 这个光滑曲面分段求出,然后进行连接,就可以得到这个光 滑曲面的近似曲面。该算法使用平行超平面簇对训练集实施软划分,使得拼接后的分类面相比 fm2SVMSfm2SVMS 得到的分类面更光滑,更接近最 优分类曲面。因而,psfm2SVMspsfm2SVMs 的泛化能力比 fm2SVMsfm2SVMs 的泛 化能力要高。在并行条件下,两者的训练时间和测试时间相 同。在多核计算技术快速发展的今天,本文提出的算
8、法,提 供了一种可行的并行机器学习框架,对于研制高速高精度的 机器学习算法具有一定的借鉴意义。未来计划研究随机向量 w w 的方向对 psfm2SVMspsfm2SVMs 泛化能力的影响,并将该算法用于高 速高精度工业图像检测。这就是我的心得体会,在讲座的最后,文教授还对机器 学习和数据挖掘的未来进行了展望,诸如现在流行的云计算, 还有动态数据流学习,例外的发现,学习更复杂的函数,粒 计算等等,都是今后发展的的热点。听完这个讲座,我感到 责任重大, 即使是一个点, 也还有很多方面值得拓展和探索, 作为研究生,研究是我们主要的工作,想要取得满意的结果 和优异的成绩,我们所要做的就是倍加努力,汲取
9、现有的知 识,在新的领域开拓新的研究道路,积极探索,永不止步。在科学技术和信息技术的带动下,经济全球化的进程逐 步加快,企业面临的竞争已演变为价值链与价值链之间的竞 争,为了提高供应链管理对我绩效,要做到拥有高效运行机 制的同时建立一个科学合理的供应链及其管理系统。因此, 供应链优化势在必行。今天企业面临的最大挑战之一,就是要对从未有过的需 求变数做出快速的反应。很多原因导致了产品和技术的生命 周期缩短,企业间的竞争压力也导致产品的频繁变化。为了 应对这个挑战,企业需要集中力量做到比以前更敏捷,以便 在更短的时间内对产量和种类的变化做出反应。一条快速的 供应链能够是企业更加快速的发展。供应链的
10、定义是:供应链是围绕核心企业,将供应商、 制造商、分销商、零售商,直至最终客户连成一个整体的功 能网链结构,通过对信息流、物流,资金流的控制,从采购 原材料开始,制成中间产品以及最终产品,最后由销售网络 把产品送到消费者手中。供应链管理的基本概念使供应商、 制造商、分销商、零售商和最终 用户形成整体的功能网链 包括所有加盟企业 ( 节点企业 ); ; 从原材料供应开始,直至最 终产品 ; ; 通过供应商到用户的物料链、信息链和资金链,实 现增值链,即使相关企业都有收益 (多赢 )。首先,供应链管理把产品在满足客户需求的过程中对成 本有影响的各个成员单位都考虑在内了,包括从原材料供应 商、制造商
11、到仓库再经过配送中心到渠道商。不过,实际上 在供应链分析中,有必要考虑供应商的供应商以及顾客的顾 客,因为它们对供应链的业绩也是有影响的。其次,供应链管理的目的在于追求整个供应链的整体效 率和整个系统费用的有效性,总是力图使系统总成本降至最 低。因此,供应链管理的重点不在于简单地使某个供应链成 员的运输成本达到最小或减少库存,而在于通过采用系统方 法来协调供应链成员以使整个供应链总成本最低,使整个供 应链系统处于最流畅的运作中。第三,供应链管理是围绕把供应商、制造商、仓库、配 送中心和渠道商有机结合成一体这个问题来展开的,因此它 包括企业许多层次上的活动,包括战略层次、战术层次和作业层次等。尽
12、管在实际的物流管理中,只有通过供应链的有机整合, 企业才能显著地降低成本和提高服务水平,但是在实践中供 应链的整合是非常困难的,这是因为:首先,供应链中的不 同成员存在着不同的、相互冲突的目标。比如,供应商一般 希望制造商进行稳定数量的大量采购,而交货期可以灵活变 动 ; ; 与供应商愿望相反,尽管大多数制造商愿意实施长期生 产运转,但它们必须顾及顾客的需求及其变化并作出积极响 应,这就要求制造商灵活地选择采购策略。因此,供应商的 目标与制造商追求灵活性的目标之间就不可避免地存在矛 盾。供应链是一个动态的系统,随时间而不断地变化。事实 上,不仅顾客需求和供应商能力随时间而变化,而且供应链 成员
13、之间的关系也会随时间而变化。比如,随着顾客购买力 的提高,供应商和制造商均面临着更大的压力来生产更多品 种更具个性化的高质量产品,进而最终生产定制化的产品。在听讲座的时候老师讲得很认真,我也带着解决以下五 个问题尝试着学习。包括物流管理与供应链管理的关系处理, 物流企业和生产制造企业物流的视觉差异、物流管理战略和 战术问题的区分与协调、反映物流领域的最新研究与实践成 果及理论性与实用性相合共五个问题。学习的过程可以分为两个阶段,一从被动地听老师授课, 起初就觉得讲座理论性太强,而可感性又不高,难以更好的 理解书中的理论,没法更好地学习知识点,二对课本上所提 到的案例加上老师的讲解后,案例具体的
14、指出存在的相关问 题,并提出的对应的解决措施,我对课程理论的学习进入了 半知半解的状态,有了一定的认识、了解、感悟,通过听讲 座我对书本的理论又有了进一步的认识,可感悟有了进一步的提升。对比自己本学期所学到的知识及能力,感觉自己再 具体提出相关解决措施的时候,没办法更好的调研、分析, 得出解决的方案,理论与实际的两者结合不够,没办法列出 更为具体且行的方式以解决问题,提出方案的可操作性都有 待提升。自己学习方面的转变由只是老师讲解,转变到了自己主 动去了解、学习。通过自己上网下载相关案例,学习更多的 东西。这就是我这学期有学习进步的地方。不足之处:由于是第一次听这一类的讲座,自己没办法 去了解
15、到哪些途径与方法能够更好的解决我们的问题。通过本学期的学习,我明显的感觉到了,在看待问题, 分析、解决具体问题方面的能力,明显不足,心态上有些急 切,很想学习相关方面的具体解决问题的知识,进一步提升 自己。在进一步学习的方面,我希望老师能再强化学生在这方 面的意识,旨在合适的时候指出学生的不足和问题,让学生 更好的意识到问题,有何途径去更好的解决问题,灌输树立 学生们树立这方面的意识或习惯。学生和老师的沟通不足,导致学生上课没办法更好的与 老师所讲解的内容,能有知识。思想或思维上的碰撞,擦出 思维碰撞的火花。在讲座之前,老师能先提前跟下节课有关 的案例,课后让学生更好的在课前提出相关的问题,讲
16、座上 引导学生更好的在课前思考提出相关的问题,讲座上引导学 生广泛地参与到思考与讨论中出现了什么问题,为什么会出 现问题,怎么去解决问题,为什么要这么去解决问题,如何 具体的提出相关可行具体的方案去落实。这样子就能更好地 让学生对理论与运用有更深地认识了。通过这次讲座我不仅学习到了专业知识,也使得我的视 野更开阔了,学习能力也提高了。我觉得这是我踏上社会之 前收获的一笔财富。听了几位老师所讲的学科先沿讲座, 我的感想颇多。 尤 其是对林林老师的智慧时代中的挑战与机遇颇有感触。 下面我谈谈自己通过听讲,查资料,经过思考后对这一问题 的理解。 当今的信息新技术主要包括这么几类,即新息安 全新技术:
17、主要包括密码技术、入侵检测系统、信息隐藏技 术、身份认证技术、数据库安全技术、 网络容灾和灾难恢 复、网络安全设计等。信息化新技术:信息化新技术主要涉 及电子政务、电子商务、城市信息化、企业信息化、农业信 息化、服务业信息化等。软件新技术:软件新技术主要关注 嵌入式计算与嵌入式软件、基于构件的软件开发方法、中间 件技术、数据中心的建设、可信网络计算平台、软件架构设 计、SOASOA 与 RIARIA 技术、软件产品线技术等。网络新技术:网 络新技术包括宽带无线与移动通信、光通信与智能光网络、 家庭网络与智能终端、 宽带多媒体网络、 IPv6IPv6 与下一代网络、分布式系统等。 计算机新技术:
18、 计算机新技术主要关注网格 计算、人机接口、高性能计算和高性能服务器、智能计算、 磁存储技术、光存储技术、中文信息处理与智能人机交互、 数字媒体与内容管理、音视频编 / / 解码技术等。大胆的预测一下计算机技术往下怎么发展,因为形势明白了,历史规律搞清楚了,需求也明白了,该怎么做呢? ?我大胆做这么一个发言,中国计算机界必须把握机遇迎接挑战。 看一下处理器方面该怎么做,上个世纪我们关心的是每秒种 可以完成多少指令,处理的速度。后来发现不对,应该做高 性能的处理器,每花掉一块钱可以处理多少能力,重要的是 功耗要低,然后是无线,是互联,我们更关心消耗每瓦功率 处理能力是多少, 大家关心的点开始转移
19、,从每秒处理能力, 关心到每块买到多少处理能力,到最后消耗每瓦功耗有多少 能力。在处理结构上面有什么变化, 从上世纪 7070 年代左右,人围着计算机转,每个单位只要很好就有一个漂亮的机房, 大家围着机房转,算题是通过一个小窗口把题递进去,过一 段时间里面算好,把题递出来。那时候一切围绕CPUCPU 转,所以那时候 CPUCPU 当之无愧,我的处理器是中心所以叫CPUCPU 再往下可以看到计算机围着人转,我们口袋里的手表等一切一 切,人走到哪里,计算装备围着我来转,在机器内部不是围 着 CPUCPU 转,而是围着存储期,I/OI/O,通道转,因此不能光搞 CPUCPU 比如出现 PIMPIM
20、等新的名称,所以我们应该与时俱进。 从 CPUCPU C C 要改成无处不在的处理单元。网络将怎么发展,我们在上个世纪 7070 年代所关心的就 是互联互通互操作,在这儿不是讲互联互通互操作不重要, 它是一个基础绝对重要,关心这个是数据和控制信号的传递, 数据和控制信号可以传过去。做了一些日子以后发现,需求不仅仅是这个,我们要提高网络的带宽,我们关心是信息沟 通和处理能力的增强, 光把信号传过去是不是可以处理好呢 再往下又是怎样的 ? ?我们应该关心网上有这些信息,有这么 多人用,是动态的变化,所以我们要关心信息融合、信息确 认等。要把消息传给该给的人,该给的时间,该给的地方, 该给的人,传正
21、确的东西,这个变化不承认不行的,以往包 括我个人在内,我和我同事们宣扬,看我家里环境,办公室 环境,我计算机有多少能力联网,这已经过去了。下面关心 的是这个网络具有多少计算个算计的能力,算计要做推理更 难,再往下要面对什么问题? ?我的网络环境怎么样有非常强的资源按需聚合, 人机协同工作的协调能力, 体系结构将怎 么发展,7070年代的时候,大家做体系结构设计,费劲脑筋是 在计算机内挖掘可能的潜力,处理可能的矛盾,搞体系结构 的人,什么是好的所长,厂长,它的学问是处理轻重缓急, 这件事应该放得下,哪件事应该要处理,所以好的应该处理 删、增、减、抑、扬,在这种情况下发现,我们设计在机群 中挖掘和
22、平衡, 我们要在网络环境下怎么做挖掘和平衡, 因 为系统给人用的, 机器的环境, 是给销售人员, 管理者用的, 所以把协同工作做好,就要验证,所以从HPCSHPCS 变成 HPCEHPCE我们需要的不是高性能,需要的是生产力可用性,中国科学 家预感比较早,因此 19971997 年再一次会上,就决定当前做 ClieitServerClieitServer ,之后做 ClusterCluster ,之后做 NetworkingNetworking ,之后 是VSE基于网络的虚拟服务含量是未来体系结构的发展方 向。这是 19971997 年 8 8 月 2525 号,到 19981998年的时候,世界有名 的计算机科学家 IseaIsea 发表了 GRIDGRID 专著,我们要把 GRIDGRID 定 位了,而是要考虑你究竟想干什么 ? ?我们做一个好的系统,必须要看到定位准确,你在这个坐标上关于服务,你是要做 计算服务,还是数据服务,还是应用服务,还是信息服务, 还是知识服务,还是实用的服务。如果明确了你的目标,你 的技术就明确, 你的评价指标就明确了。 如果要做信息服务, 你就要了解你处的信息是多大一块,这件事很重要,不能杀 鸡用牛刀,也不能杀牛用鸡刀,如果系统力度大小这么大, 最后生产的问题,究竟打算怎么交帐,是向投钱的单位交一 个概念的设计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度城市安全防护系统抵押借款合同
- 二零二五年度股份占比合同协议书:5G通信技术股权投资合作协议
- 2025年度酒店与保险公司合作协议价合同样本
- 2025年度二零二五年度离婚协议及财产分割与子女教育权益合同
- 现代科技展厅的节能环保材料解决方案
- 2025年度二零二五年度购物中心租赁铺面租赁合同租赁保证金协议
- 2025年度影视演员经纪与经纪公司合作经纪合同
- 2025年度银行贷款居间服务与贷款风险防范合同
- 智慧课堂在教育领域的应用与挑战
- 让孩子主动学习卫生知识-家长的引导方法与实践效果研究
- 2025年有机肥行业发展趋势分析报告
- 2023-2024年员工三级安全培训考试题及参考答案(综合题)
- 2025-2030年中国融雪剂行业运行动态及发展前景预测报告
- 对口升学语文模拟试卷(6)-江西省(解析版)
- 2025保安部年度工作计划
- 2024年江苏经贸职业技术学院单招职业适应性测试题库
- 人居环境综合治理项目项目背景及必要性分析
- 招标采购基础知识培训
- 电力系统分布式模型预测控制方法综述与展望
- 2024年注册建筑师-二级注册建筑师考试近5年真题附答案
- 五年级口算题卡每天100题带答案
评论
0/150
提交评论