




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、济南大学并行计算实验室MapReduce研究现状,主修:电脑软件和理论名称:居民郑光华地图教师:朱继鹏教授,总结,MapReduce研究调试、监控等常用API Hadoop改造数据挖掘项目red poll canopy,k SVM Jstack JobTracker Profile每个slave节点TaskTracker的Profile每个slave节点的Child进程的Profile(单个执行速度可能太慢)、监视、监视:群集或单个节点I/O、内存监视I/O output format partitioner comparator distributed cache streaming(bas
2、h/job Tracker与作业调度结合性太强的作业History必须独立于一个JVM进程,逻辑必须与作业tracker 与文件系统兼容的POSIX不对齐Map的key输出,仅分区NameNode单点故障问题RPC支持的大数据(例如档案)传输群集资源分配权限管理,大型数据挖掘3360Redpoll,文本数据挖掘分布式向量空间模型分布式距离测量数据检索狗新闻20 news group Wikipedia给定未知数据示例X后,分类将预测后检查概率(条件X下)牙齿最高的类。寻找最大化。根据贝叶斯定理,根据朴素贝叶斯分类,P(X)可通过对所有类的常数、最大化、的考虑分析:等概率或类条件的独立朴素假设:(K=1,2,N)训练样本评价为分类属性,根据样本评价为连续值属性。大容量、高维数据集群集使用两阶段群集,通过徐璐其他距离测量节省计算时间。K-means EM GAC、大规模支持向量机、解决的稀缺性和问题的凸性将大规模原文制分解为小的子问题,并反复解决子问题。直到收敛到原始问题为止,选择块算法分解算法序列最小最优化方法(SM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年建筑施工安全生产月培训
- 2024年2月份跨国采购原液浓度差异退货检测协议
- 幼儿园食品安全知识培训
- 2025年超越联轴器项目可行性研究报告
- 微生物生物膜相互作用-全面剖析
- 2024年5月份跨境货运列车长租轨道使用补充条款
- 智能口腔护理系统-全面剖析
- 报警联动施工方案
- 基于物联网的笔制造产业链协同研究-全面剖析
- 路堤填料施工方案
- 华北电力大学丁肇豪:多主体数据中心算力-电力跨域协同优化
- 科技公司费用报销制度及流程比较
- 颅内出血护理操作
- 2024年绍兴诸暨市水务集团有限公司招聘考试真题
- 2025年新版供电营业规则考试题库
- 2025年长白山职业技术学院单招职业技能测试题库带答案
- 2025年公务员遴选考试公共基础知识必考题库170题及答案(四)
- 2024年内蒙古呼和浩特市中考物理试题【含答案、解析】
- 办公用品及设备采购产品手册
- 河道清淤工程施工组织设计方案
- 农业行业安全生产培训
评论
0/150
提交评论