




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高校大数据实验室建设方案一、建设目标章鱼大数据实验室的建设目的是作为大数据教学实验及科研平台,包括数据挖掘与大数据分析平台。实验室的设计全面落实“产、学、研、用” 一体化的思想和模式,从教学、实践、科研 和使用多方面注重专业人才和特色人才的培养。利用虚拟化教学资源, 搭建教学系统和集群平台,将理论学习、 实践教学和大数据项目实战融为一体,由难而易、循序渐进,逐步提升学生的学习技能和实践水平,提高“学”的质量和成效。利用大数据分析主流软件框架,搭建与业界主要用户一致的实验与科研环境,将理论课程中学到的数据挖掘算法运用到实际的数据分析过程中,提升学生的动手操作和项目实践能力。 使得学生所学与企业项
2、目人才需求无缝衔接, 与教师的科研工作紧密配 合。通过专业的大数据分析计算资源搭建的开放式大数据分析平台,可以充分的融合教师的科研需求,教师可以在开放的平台环境下开展大数据科研工作,提升教师的科研创新能力,充分提高“研”的成效。产品优势以能力培养 为核心交互式学习模式提供体系完整、简单易用的在线教学课堂;以基础知识学习、在线视频教学、习题、 线上测试、评估等为主线的一系列方法,确保学生在短时间内掌握大数据虚拟仿真实验、 分析部署技能。真机实验训练实验训练体系设计成各模块相对独立的形式,各模块交互式的实验任务、大数据实验机、 实际项目上机操作,通过多方位的训练,最终灵活的、渐进式地掌握大数据生态
3、体系。大数据实战及案例分析提供实验数据,包括网站流量数据、租房及二手房数据、电商商品交易数据、搜索引擎访 问等多种行业数据,数据内容超过 20TB ,同时周期更新数据内容。充分支撑科研工作提供行业数据及案例解剖用于基础研究,提供数据分析方案及流程,提供数据更新接口 ,可以对行业数据进行分析统计,按需求生成数据报表,为科研工作提供数据支撑。例如某地区经济数据分析、股市数据分析、全国地震数据分析、食品价格行业数据分析等。三、建设规模按照60台大数据实验机容量进行同时在线使用进行建设为基础,整体系统提供快速扩容升级服务。四、硬件配置采用十六台高性能品牌服务器作为大数据节点进行建设,采用企业级全千兆三
4、层交换机进行网络数据交换。每台节点的配置如下:处理器每节点支持2个英特尔?至强?处理器E5-2650CPU高速缓存15MBQPI总线速率7.2GT/S内存提供12个内存插槽,标配 192G内存,支持局级内存纠错,内存镜像,内存热备等局级功能磁盘标配4块3TBSATA硬盘标配2块120G SSD硬盘300G 10000转SAS系统盘网络控制器集成1个高性育汗兆以太网控制器(双口),支持虚拟化加速,网络加速,负载均衡,冗余等高级功能电源标配大功率高效白金级电源,1+1冗余虚拟化技术支持 VMware vSphere、Docker、OpenStack 等五、软件平台介绍1、大数据教学管理系统1.1
5、专业管理提供对专业信息的增加、删除、修改、查询功能。1.2 班级管理提供对专业下属班级的增加、删除、修改、查询功能。1.3 学生管理提供对班级内学生的管理,学生内容包含姓名、学号、所属班级、所属专业、联系手机、 登录次数等内容。1.4 交流日志查阅对实验机分享交流的内容进行查询,包含交流 IP、相关学员、相关老师、实验机编号、交流 内容等内容。1.5 成绩管理对于学习中心在线学习的学习考核成绩进行管理,包含查询及删除等功能。1.6 学习记录提供每个学生在学习中心平台内学习课程的学习记录,包含日期、计划、课程、章节、学习IP等。1.7 学习行为报表对所有学生的课程学习记录进行统计,包含个体统计、
6、班级统计、全体统计等。1.8 课程管理对学习课程进行查询、修改、删除等操作1.9 开通课程计划对于学习开课计划的字段内容包含计划名称、授课讲师、授课时间段、开通状态、允许申 请周期,允许申请人数等,功能提供绑定课程计划相关实训平台课程、授课助教、云实验机绑 定、实验任务绑定等功能。1.10 课程测验习题管理提供对课程相关的习题管理,题型包含单选、多选、判断题等类型,对习题进行增、册、 改、查操作。1.11 分级权限功能系统分为总管理员、助教等二级管理角色,总管理员进行管理所有的功能点,助教可以进 行班级管理、学生管理、开课计划制作、实验机远程协助等。1.12 学生实训系统提供学生根据姓名、学号
7、、密码登录系统进行实训操作,学生只需安装浏览即可进行实验 任务操作;提供实训课程在线学习功能、实验机在线操作、实验报告提交、实验机界面截图、 记录课程学习时长等。1.13 实验机桌面分享提供实验机桌面分享功能,如学生在学习、操作云实验机的过程中,有问题可以向老师发 起协助请求,助教在收到请求时,可以远程访问学生的实验机,并指导如何操作。2、云实验机及实验任务2.1 云实验机提供基于Web浏览器的实验机可视化操作,操作终端无需安装其它开发软件即可进行实验操 作;云实验机可以根据学生编号、实验任务和环境要求自动创建,无需管理人员参与实验机创建操作过程。管理平台对云实验机可以进行停止、销毁操作。2.
8、2 云实验机集群管理功能提供云实验机集群管理,对实验机所属服务器进行新增、删除等操作。2.3 云实验机类型包含Hadoop实验机、Hive实验机、HBase实验机、R语言实验机、Scala实验机、Spark 实验机、Kafka实验机、Sqoop实验机、Flume实验机、数据可视化实验机等。2.4 实验机运行监控系统系统提供对实验集群运行的所有实验机进行监控,可以查询编号、所属服务器、创建时间、运行状态、开放端口等内容。2.5 实验任务管理提供对实验任务内容的管理,包含任务课程、绑定实验机、设定任务成绩总分,排序值等,提供多种实验任务内容,例如 Hadoop实验任务、Hive实验任务、HBase
9、实验任务、Flume与 kafka实验任务等。2.6 实验报告审阅功能在实验任务过程中学生上交的任务报告进行审阅评分,提供按照学生、实验任务等字段进 行检索功能。2.7 云实验机桌面分享系统提供实验机桌面基于浏览器的分享功能,允许学生与学生、学生与老师同步操作实验机桌 面系统,提供基于浏览器的交流功能。.rUI . IdWf -.江 73ml El .二4 F l 开褊;.耳丁 面G 灌修:面n - ' * T W .r一一 n-.-Av;翼唯=不第工二二匕党赢"SSiSNMB叱T r ; ,二 p _ _l 二一“ "F型西五百:g4声毒理兼®1用* 再
10、 ;*n 11a嗯言81aLMBB 1#_ . 7 ,11'WL'r*a -I LXa qj q0 h* . kAX-MHflM0*fw t r3、大数据实战平台系统3.1大数据集群管理系统相关信息,可以对管理节点、计算节点进行启动、停止等操作管理3.2大数据作业工作流系统提供大数据相关作业的上传、部属、流程管理等功能,基于 Web的任务调度、兼容Hadoop、Spark主流版本、失败任务的、运行状态监控等基于分布式集群管理系统,提供大数据集群管理系统,功能包含Hadoop、Hive、HBase、Sqoop、Flume、Spark等节点部属及管理,提供实时监控集群的CPU、内存
11、、硬盘等使用率及F1T1 fkifrhl 51 I六、大数据课程及行业案例实验平台提供100个课时的Hadoop、Spark等大数据主流课程,课程与大数据实验机完美结合,学员在教学管理系统学习课程,随时进行实训操作,包含项目设计、数据采集、清洗、建模、技术实现等,快速提升实操技能,最终掌握大数据开发、数据分析与数据挖掘等大数据能力。部分案例图片:【电商大数据分析架构】小:量:r厂 里:十 代 吹屋坨:无悬疆说;二思 mMi MMWf XF WQMMMHV?.嵯撕则总 迎诩懒<1:;吟一HUW信七14二了二 假即可工:工精鼬omt朝妒 .*fi f1j%LHe isnoHiKd胃葩傲舞照;
12、烟:刚 1憩断蜀忆目铲优魂口'棒 琳ft凰;雄演梦:r ' 僦锚割 林 就的 其以甯7雷;忸血容一工Jj- JTsggT*jW*4卷出星H廉弗I烈W留碑M q r£imw.个«» * 丽h 杀 usm【电商大数据分析案例】Linuxt h2b ip油w e co*bNb电商数据buyer hivr favoritebuyer. II09 order* ordwrjtems cat"kgroup goods goodohitMapReduce一二二ra«sreport ipuvrexam【房产大数据分析架构】【房产大数据分析可视化
13、】八MySQL DBV"£11即”“f> £C 'n icn j*1- I* 工- - -M 二咱度【搜索大数据分析架构】m»QL oah ttpWr* p<kft * prfeuWf电3 rr【网站日志大数据分析架构】课程实验内容包含:课程名称课时课程内容介绍Hadoop基础10讲解Hadoop生态系统,包括操作与开发;详细讲解HDFS和Map-Reduce的功能及作用;了解 MapReduce 原埋、运行流程、 压缩数据处理、作业调度、计算器等环节。HDFS程序开发6讲解Hadoop文件系统 HDFS JAVA API的使用。掌握
14、如何使用 HDFSJava API ,读写文件、读写目录、以及对文件进行压缩处理等。MapReduce 开发6本课程针对Hadoop MapReduce 开发进行讲解。课程以案例为基础,重点介绍 MapReduce 程序结构,以及如何使用MapReduce进行数据统计,去重,排序,Map端Join , Reduce端Join等关联操作,掌握 MapReduce处理过程。Hive数据仓库24Hive是基于Hadoop构建的数据仓库分析系统,通过学习掌握Hive的函数、Hive数据的加载、Hive的DDL操作、自定义函数 (UDF ) 等内容,达到使用 Hive进行查询、汇总、分析数据的能力。分布
15、式数据库 HBase6HBase是Hadoop生态系统中的重要一员,主要用于海量结构化数据存储; 通过学习对 HBase表设计、表操作、数据操作、Java API等内容,掌握对 HBase系统的开发及使用。数据迁移工具Sqoop4Sqoop是关系型数据库和Hadoop生态系统之间进仃数据转换的主要工具; 通过学习将 mysql中的数据导入到 hdfs中、将数据导 入到HBase中、定义导入导出任务等,掌握对数据迁移的能力。分布式日志框架Flume4Flume对海量日志进行米集、聚合和传输的主流大数据工具;课程内容包含 Flume 应用Sih FlumeNG、FlumeOG、Flume 的核 心
16、组件、Flume的架构、Flume的source、sink配置说明等。Kafka流式数据未集4Kafka是分布式的消息队列,广泛应用于实时数据处理。学习内容包含Kafka的体系结构、安装模式及安装部署、Topic、Producer >Consumer >发布订阅消息以及Kafka JAVA 开发等。Spark6Spark是,款局性能的分布式计算框架,比MapReduce计算快百倍;本课程内容全面涵盖了Spark生态系统、Spark与Hadoop对比、开发环境搭建、RDD、编程模型、 Web监控等内容。SparkStreaming4Spark Streaming是用户结合流式、批处理
17、和交互式查询应用的实 时计算框架;本课程内容详细讲解原理与特点、适用场景、Dstream搦作、容错、性能优伊和人在优伊等cSpark SQL4 Spark SQL的出现,使得 SQL-on-Hadoop 的性能相对于Hive有了显著的提高。达到Spark兼容Hive的功能。本课程详细讲解特点、运行架构、数据源、数据缓存、DataFrame等。实战案例搜索引擎日志数据统计分析6讲解Hadoop系统架构设计以及项目分析流程;通过对用户搜索 记录数据的清洗,分析指标内容,得出关键词排行榜、用户停留 时间最图贝卸等。实战案例电子商务平台大数据分析J6讲解Spark系统架构设计以及项目分析流程;本课程主
18、要讲解搭 建电商的数据处理平台、数据统计、分析及可视化技术的应用开发流程。七、行业数据及案例提供大数据实战案例以及行业数据,提供包含海量网站日志分析案例、租房及二手房人数据分析案例、电商商品交易大数据挖掘、搜索引擎关键词分析算法案例、汽车销售数据分析案例等案例讲解及实战作业工作流内容。数据名称数据描述Wf地区房产数据包含二手房在售数据、出租房屋数据、经纪人评价数据等。每周全国汽车数据包含国内不同种类汽车详细配置信息、汽车使用评论数据、汽车销 售数据以及二手车数据等。可用于汽车行业市场行情分析。每月法律咨询数据包含国内所有法律咨询服务机构数据、机构评论数据、有关法律咨 询话题的数据。可用于法律咨
19、询行业市场行情分析,社会治安情况 分析。每周疾病问答数据包含国内不同种类疾病问题数据、医生回复数据、有关疾病常识等 话题的数据。每月股票基金交易数据包含国内、港股、美股等国内外股票行情及交易数据、按照时间段 提供详细数据;也包含证券投资基金、保险基金、信托投资基金等 行情数据。每日天气、气象数据包含全国各个地区气象数据(气温、降水量、风、气压等)、气象观测产品数据。可用于气象业务、天气预报、气候预测以及气象服务。每日人脸图像数据包含国内多种年龄段的人脸图像数据。用于脸部特征分析、人脸识 别、人脸检测等,每个人提供多个角度的图片。每月电商评价数据包含上百万条国内知名电商平台产品评价数据。可用于用
20、户购买产 品意愿分析、个性化推荐和精准营销,进行商业舆情监控和产品的 市场行情分析。每周北京生鲜食品价格数据包含历年北京市蔬菜、水果、肉禽蛋、水产等生鲜食品的最低价、 最高价以及平均价以及最新价格。利用大数据可进行生鲜食品行业 分析。每日搜索引擎访问日志数据包含用户搜索记录数据。通过对用户搜索记录的分析,可以分析用 户行为特征,构建广告点击模型。每周海量网站访问日志数据包含海量用户访问网站的日志数据。通过对日志的分析,我们可以知道获取网站每类贝曲的PV 值(PageView ,贝回访问量)、独立IP数,哪个网页最有价值等。每周八、安装配置1、大数据教学管理系统机器序号主机名 i1硬件配置备注硬盘|CPU/tt I内存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司合同续约协议
- 购买土方合同协议书范本
- 解除保密协议合同
- 小车协议过户合同
- 赠予钱财合同协议
- 劳动合同转签三方协议书
- 月结协议合同编号
- 施工减免店租合同协议书
- 协议转让快递合同
- 亲情房屋合同协议
- Unit+1+Cultural+Heritage+Workbook-高中英语人教版必修第二册
- 孕期免疫系统:如何增强免疫力
- 同等学力申硕英语词汇
- 软件工程导论课件(第六版)(张海潘编著)(1-13章)
- 2023-2024学年广东广州天河区明珠中英文学校数学三上期末联考试题含答案
- 智能仓储管理实战手册
- 提高住院病历完成及时性持续改进(PDCA)
- 气门摇臂轴支座的机械加工工艺及夹具设计毕业设计
- 企业职工代表任命协议书
- 地下管线测绘及数据处理
- 附件1:中国联通动环监控系统B接口技术规范(V3.0)
评论
0/150
提交评论