数据科学技术群工作汇报_第1页
数据科学技术群工作汇报_第2页
数据科学技术群工作汇报_第3页
数据科学技术群工作汇报_第4页
数据科学技术群工作汇报_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据科学技术群工作汇报数据科学知识点分类知识点描述专业课程基础课程计算机专业基础课程,包括程序设计、数据结构、体系结构、操作系统、数据库原理等;进阶课程计算机专业研究生课程,包括算法、统计、机器学习、信息检索、数据挖掘等;职业技能通用技能大数据从业者应当掌握的基本技能,是学习和工作的基础,涉及Linux系统,版本控制软件、集成开发环境、容器化技术和云计算平台等;开发语言主流的程序开发语言、脚本语言、统计分析语言和数据库语言,包括Java、Python、R、SQL等,每一个大数据从业者都应当熟练掌握1种以上开发语言;算法专题介绍大数据分析和处理相关的算法原理,包括深度学习、协同过滤、聚类分析和回

2、归分析等分析类算法,也包括分布式事务、分布式一致性、Map/Reduce等分布式算法;系统平台SQL数据库主要介绍传统基于关系模型并且采用SQL语言作为访问接口的数据库管理系统,也包括Hive等架构在分布式系统上的类SQL系统和基于中间件技术的分布式数据库服务;NoSQL数据库介绍新型的非关系数据库管理系统,这些系统所采用的数据模型包括键值对、图模型、文档模型和宽表模型等,主要通过API接口进行访问;数据处理平台介绍用于大规模数据处理的分布式基础架构平台,包括Apache基金会所开发的Hadoop和加州大学伯克利分校开源的Spark系统;数据科学知识点分类知识点描述系统平台数据流处理介绍基于数

3、据流模型进行在线数据实时处理的系统,主要包括Storm和Spark Streaming;缓存系统在对大规模数据集进行分析和处理过程,采用缓存系统能够有效提高处理性能,目前主流的缓存系统有GemFire、Redis和Cache;消息处理基于分布式队列的消息发布和订阅系统已经被广泛用于处理不断产生的海量日志信息及交易信息,主流的开源消息处理系统有Kafka和RabitMQ;数据分析用于数据分析和挖掘的软件和工具包,主要有Mahout、TensorFlow、MATLAB和Weka等;数据可视化采用图表等方式对数据进行展示在大数据应用中占有重要地位,相关的软件工具和库包括Tableau、Google

4、Charts、Gephi和plotly等;数据集成规划和研发大数据系统时通常需要对不同来源、不同格式和质量的数据进行集成,目前已经有很多用于数据采集、转换和集成的软件平台,Flume和OpenRefine是其中具有代表性的;资源调度介绍用于集群资源(CPU、内存、存储和网络等)管理和分配的系统工具,包括YARN和Mesos;案例分析领域应用通过案例分析可以让学习者获取大数据技术应用的直观感受,有助于对相关技术的的理解和进一步学习。目前大数据技术已经被应用于众多领域,具有代表性的有知识图谱、用户画像、推荐系统、异常检测、社交网络、零售分析、计算广告和人工智能;人才培养角色描述大数据科学家(Big

5、 Data Scientist)专注于大数据领域特定科学问题的深入研究,具有整合不同来源、不同格式、不同质量数据集的能力,通过对数据集的融合和分析,提出具有创新性的解决方案。从业者可以拥有不同的知识背景,如经济、物理、统计、计算机和应用数学等,通常拥有硕士或博士学位。大数据分析师(Big Data Analyst)针对给定应用场景和系统中的数据进行分析,对具体问题提出可行的解决方案,并能够指导工程师进行开发和测试。从业者通常拥有数学、统计、计算机、经济或金融的学士学位,并且熟悉主流的编程语言、开源系统和统计分析工具。大数据架构师(Big Data Architect)针对特定的大数据问题和需求

6、,设计相应的系统架构,是连接大数据科学家、大数据分析师和大数据工程师的桥梁,负责大数据解决方案的全生命周期管理,包括需求分析、技术选型、架构设计、应用设计、开发和测试、部署和运维。从业者需要有丰富的应用架构经验,熟悉主流大数据处理平台的优缺点和适用场景。大数据工程师(Big Data Engineer)根据大数据架构师的设计,在具体项目中负责数据的收集、预处理、算法实现、可视化及部署和运维。从业者应当熟练使用主流的软硬件平台、开发语言和测试工具,具有学习使用大数据相关开源系统的能力,通常拥有计算机相关专业的学士学位。科学家与分析师架构师与工程师2018年本科师资培训项目评审(已完成)要求与流程

7、为期三天,容量不少于40人项目经费不超过人民币80000元(含税费和管理费)2018年1月19日前提交2018年1月31日前推荐至Google教育合作部门推荐标准课程内容与主讲教师(有助于学员开拓视野,加深对数据科学的理解)项目负责人背景和依托单位的保障能力申报情况共收到4份申请书第一推荐:贵州财经大学2018年第一批产学合作协同育人课程项目推荐要求与流程适用于本科课堂教学和在线教育的课程资源申报截止日期是2018年4月30日截止日期前发送到wanzc项目建设经费人民币5万元(1年)与项目挂钩的真实课程情况推荐标准与依托单位所开设正式课程的关系(2/3相符)与数据科学技术知识点相符(优先支持系

8、统平台和案例分析相关课程)课程基础(课程资源、主讲人背景等)课程规模(学时、选课人数等)欢迎咨询和交流!推荐谷歌中国教育合作项目专家组成员参见谷歌中国教育合作项目专家组施行办法任期2年参加年度专家组会议,讨论和拟定合作项目下一步方向和工作重点;审议谷歌教育合作项目重大项目发布或活动方案草案,提供专家咨询建议;受邀参加谷歌教育合作项目申报书评审,给出评审结果和意见;可选参加谷歌中国教育合作部所组织的会议或活动,参与研讨、分享和交流。推荐标准从事数据科学相关的科研与教学工作;积极参与数据科学技术群的活动与交流;:3000数据科学技术课程资源建设内容教学大纲(目标、教材、教学内容、课时安排、考评标准)教学课件(PP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论