




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024年广西职业院校技能大赛
赛项规程
赛项序号:40
赛项组别:中职组
赛项名称:大数据应用与服务
专业大类:电子信息
1
一、竞赛目的
通过本项目竞赛,使中职学生能熟练掌握大数据平台运维、
数据采集与处理、数据分析与可视化方面的核心知识和技能,及
职业道德、团队合作、工匠精神等方面的素养,促进中职大数据
技术应用、软件技术等计算机类专业建设与教学改革;推进中职
学校与相关企业的合作,更好地实现工学结合的人才培养模式,
为大数据行业培养高素质的技能型人才。
二、竞赛内容
在规定时间内完成赛题中规定的任务需求。具体内容如下:
竞赛以企业真实工程项目为基础,面向大数据“开发、运维”
核心岗位需求,大数据行业的典型工作场景,突出工程应用。竞
赛涵盖大数据生命周期典型阶段技术,包括大数据平台搭建、数
据库运行维护、数据清洗、数据标注、数据分析、数据可视化和
业务分析等工作任务,考核参赛选手大数据平台运维、数据采集
与处理、数据分析与可视化等方面的能力。竞赛内容包括:
1.大数据平台搭建:安装Hadoop全分布式平台,安装Hadoop
平台相关的常用组件,包括但不限于ZooKeeper、Flume、Kafka、
Spark、Flink、Redis、HBase等,验证Hadoop平台和相关组件
的可用性。
2.数据库配置维护:基于MySQL数据库进行建库建表,运用
基本的SQL语句完成数据的增删改查等操作。
2
3.使用Python以及相关库,完成网页数据爬取,并存放到
指定位置。
4.编写Spark程序,完成对数据清洗、处理。
5.数据获取与清洗:读取CSV数据源,对指定字段进行有效
性检查,正确处理无效值和异常值,对数据进行一致性检查,对
数据进行清洗和转换。
6.数据统计:编写JavaMapReduce程序,并将程序打包部署
到Hadoop平台上运行,对数据进行统计汇总、分区分组和排序
等操作。使用HDFS上传和下载文件。
7.数据标注:使用Python程序、SQL语句对数据进行分类
标注,将标注后的数据保存到指定位置。
8.数据可视化:使用SQL语句对数据统计分析,展示统计结
果;使用Web技术或Python可视化技术对数据进行呈现,包括
但不限于柱状图、折线图、玫瑰图、气泡图、饼状图、条形图、
雷达图、散点图等效果。
9.业务分析:能够理解业务场景,对业务数据进行分析,编
写分析报告。
详见表1。
表1竞赛内容与分值占比
模块主要内容分值
模块一:平台任务一:大数Hadoop平台的安装部署和常用组件的
搭建与运维据平台搭建安装部署。10
3
模块主要内容分值
使用MySQL数据库建库建表,运用基
任务二:数据本的SQL语言完成数据的增删改查等20
库配置维护操作。
对CSV数据文件进行加载、清洗和转
换等操作,识别和处理无效值,检查
任务一:数据数据的一致性,将清洗后的数据保存
获取与清洗到指定位置。使用Python以及相关库,10
完成网页数据爬取,并存放到指定位
模块二:数据置。
获取与处理任务二:数据使用Python语言、SQL语句对数据进
标注行分类标注。10
基于Hadoop平台进行编译、打包、部
任务三:数据署和执行程序,完成数据的统计工作。
统计编写Spark程序,完成对数据清洗、15
处理。
使用SQL语句对数据统计分析,展示
任务一:数据统计结果;使用Web前端框架或者20
模块三:业务可视化Python可视化库对数据进行可视化展
分析与可视化示。
任务二:业务报表分析,对大数据项目的业务场景
分析和数据进行分析,撰写报告。10
团队分工明确合理、操作规范、文明
职业素养竞赛5
三、竞赛时间
本赛项比赛时间为300分钟。在竞赛前1小时,选手进行抽
签,确定技能竞赛的工位号。
详见表2。
表2竞赛时间安排表(以正式公布的赛项指南为准)
时间安排竞赛地
项目时间场次
检录时间竞赛时间点
报到(3月7
9:00-14:00领队、选手预备会前提交,16:00点领队会
日)
技能比赛(3
7:00-20:00技能竞赛07:0008:30-13:30赛场
月8日)
比赛总结(3
9:30-11:00总结会9:30-11:00会议室
月9日)
4
四、竞赛试题
本赛项不设理论考试,对操作技能进行综合考核,技能竞赛
题为公开样题,见本赛项规程的竞赛内容。
五、竞赛规则
(一)参赛资格。
参见2024年广西职业院校技能大赛中职组《大数据应用与
服务》赛项实施方案。
(二)遵循准则。
1.学生必须持本人身份证和参赛证参加比赛。
2.参赛选手出场顺序、位置由抽签决定,不得擅自变更、调
整。
3.参赛选手提前15分钟进入赛场,并按照指定位号参加比
赛。迟到15分钟者,取消比赛资格;比赛开始15分钟后,选手
方可离开赛场。
4.选手在比赛过程中不得擅自离开赛场,如有特殊情况,需
经裁判同意。选手若需休息、饮水或去洗手间等,耗用时间计算
在比赛时间内。
5.比赛结束时,参赛选手应立即停止操作,不得以任何理由
拖延比赛时间。选手操作完成后,在《实际操作现场记录表》上
签名确认,方可离开赛场。
5
六、竞赛环境
(一)竞赛环境安静、整洁。须设立紧急疏散通道,医疗服
务站。
(二)比赛场地可容纳70组队同时比赛,且满足赛项比赛
所需的设备设施。
(三)比赛场地开放,可观摩选手比赛,保证公开、透明。
(四)赛场有志愿服务人员、配备医护人员、医疗室,同时
有治安人员维护比赛现场秩序与卫生。
七、技术规范
《大数据应用与服务》赛项是以教育部颁布的职业学校相关
专业教学指导方案、《中等职业教育专业简介(2022年)》修
订后的大数据应用与服务相关专业人才培养标准和国家职业技
术技能标准《大数据工程技术人员》(2021年版)(初级)规
定的技能要求为标准。
八、技术平台
大赛采用的设备:《大数据应用与服务》竞赛通用平台。包
括竞赛服务器、竞赛系统平台、单个赛位环境及工具,竞赛环境
使用集群模式,集群规模根据参赛队的数量构建,各工位通过网
络进行连接访问。赛项设备及工具清单见表2。
表2《大数据应用与服务》赛项设备及工具清单
序号名称规格数量备注
1服务器集群组1支撑大数据竞赛平台运行,可以采用
6
序号名称规格数量备注
线下或云端方式,每台配置如下:
CPU:不少于32核
内存:不少于256GB
存储:不少于480GBSSD系统盘,不少
于4TB存储盘
各参赛选手比赛使用电脑,采用PC机,
每组参赛团队需要3台PC机,每台配
置如下:
2PC机台80CPU:性能不低于i5处理器
内存:不少于8GB
硬盘:不少于200GB
显示器:分辨率1024*768以上
大数据集群操作系
3统套1Linux(CentOS7)
大数据应用与服务支持竞赛各环节,包含竞赛管理、延
4竞赛通用平台套1时管理等,运行稳定
Hadoop2.7.7以上、Yarn3.1.3、
ZooKeeper3.4.14以上、
Hive2.3.4/3.1.2、JDK1.8、Scala2.11
5大数据相关组件套80以上、Spark3.0.0/3.1.1、
Flume1.9.0、Kafka2.1以上、
Sqoop1.4.7以上、Flink1.14.0、
Redis6.2.6、Excel/WPS、HBase2.2.3
Java8、Python3、Scala2.11以上、
6开发语言套80JavaScript
numpy1.18.5、pandas1.3.4/2.1.3、
matplotlib3.5.0、pyecharts2.0.4、
7开发库套80seaborn0.11.2、Vue.js3.2、
openpyxl3.0.9、ECharts5.1以上、
lxml4.9.3、beautifulsoup44.12.2
8浏览器套80Chrome
9项目管理工具套80Maven3.8.4
10PC操作系统套80Win10/Win11
IDEA2023(CommunityEdition)、
11开发工具套80PyCharm2023(CommunityEdition)、
Visualstudiocode1.79以上
Xshell、系统自带终端工具、平台工
12SSH连接工具套80具
13数据库工具套80Dbeaver、平台工具
14文档编辑器套80WPS2019及以上
15输入法套80搜狗拼音输入法
7
九、评分标准
(一)制订原则。
大赛裁判工作按照公平、公正、公开的原则进行。以教育部
颁布的职业学校相关专业教学指导方案和国家职业技术技能标
准《大数据工程技术人员》(2021年版)(初级)规定的应知、
应会的要求为评分原则,依据参赛选手整体表现综合评定,全面
评价参赛选手职业技能水平。
(二)评分方法。
1.裁判员选聘。按照职业院校技能大赛专家和裁判工作管理
办法相关制度建立2024年广西职业院校技能大赛赛项裁判库。
裁判长由大赛裁判委员会向大赛组委会推荐,由大赛组委会聘
任。裁判长组建裁判组,执行裁判长负责制。
2.裁判员人数。总人数为9人(其中裁判长1人,裁判员8
人)。
3.成绩审核方法。
(1)本赛项采用结果评分,按照选手对应题目要求实现过
程及结果进行评分。
(2)根据竞赛内容模块进行裁判分工,负责相同模块评分
工作的不同裁判,采取随机抽签独立评分,确保成绩评定严谨、
客观、准确。裁判进行随机抽签分组,杜绝主观意愿组队,各自
完全独立评分,裁判员间互不干涉,比赛监督人员可随机监督。
8
(3)每个裁判小组汇总本组所有的评分,各模块分别计算
得分,错误不传递,按规定比例计入选手总分,本组裁判员进行
核对并签字确认,成绩汇总表备案以供核查。
(4)为保障成绩评判的准确性,裁判组对赛项总成绩排名
前30%的所有参赛队伍的成绩进行复核,其余成绩进行抽检复核,
抽检覆盖率不得低于15%。裁判组在复检中发现错误,需以书面
方式及时告知裁判长,由裁判长更正成绩并签字确认。如复核、
抽检错误率超过5%的,裁判组需对所有成绩进行复核。
(5)现场工作人员对裁判员的成绩进行核对无误后送至统
分室进行成绩录入。成绩录入完毕后,工作人员交换岗位进行核
对,无误后,按照各模块成绩所占比例统计选手最终成绩并打印
完毕交至裁判长审核签字。
(6)在竞赛过程中,参赛选手如有不服从裁判裁决、扰乱
赛场秩序、舞弊等行为的,由裁判长按照规定扣减相应分数,情
节严重的将取消比赛资格,比赛成绩计0分。
4.成绩公布方法。
待比赛结果评判完毕,成绩录入审核无误后,由裁判长在成
绩汇总表上签字并通过通告栏进行公布。
(三)评分标准。
评分标准具体见表3。
9
表3《大数据应用与服务》赛项考核要点和评分标准
模块主要内容分值评分标准
根据题目要求作
任务一:大数Hadoop平台的安装部署和常用组10答,答案不正确得
据平台搭建件的安装部署。0分,正确10分
模块一:平
台搭建与运任务二:数据使用MySQL数据库建库建表,运根据题目要求作
维用基本的SQL语言完成数据的增20答,答案不正确得
库配置维护删改查等操作。0分,正确20分
小计30
对CSV数据文件进行加载、清洗
和转换等操作,识别和处理无效根据题目要求作
任务一:数据值,检查数据的一致性,将清洗10答,答案不正确得
获取与清洗后的数据保存到指定位置。使用
Python以及相关库,完成网页数0分,正确10分
据爬取,并存放到指定位置。
模块二:数任务二:数据使用Python语言、SQL语句对数根据题目要求作
据获取与处标注据进行分类标注。10答,答案不正确得
理0分,正确10分
基于Hadoop平台进行编译、打包、
任务三:数据部署和执行程序,完成数据的统根据题目要求作
统计计工作。编写Spark程序,完成15答,答案不正确得
对数据清洗、处理。0分,正确15分
小计35
使用SQL语句对数据统计分析,根据题目要求作
任务一:数据展示统计结果;使用Excel、Web20答,答案不正确得
可视化前端框架或者Python可视化库对0分,正确20分
模块三:业数据进行可视化展示。
务分析与可根据题目要求作
视化任务二:业务报表分析,对大数据项目的业务10答,答案不正确得
分析场景和数据进行分析,撰写报告。0分,正确10分
小计30
任务一:考察团队分工明确合理、操作规范、5根据操作规范、职
模块四:职业职业素养文明竞赛业素养水平打分
素养
小计5
总分100
10
十、奖项设定
参见2024年广西职业院校技能大赛中职组《大数据应用与
服务》赛项实施方案。
十一、赛项安全管理
(一)赛场组织与管理员应制定安保须知、安全隐患规避方
法及突发事件预案,设立紧急疏散路线及通道等。确保比赛期间
所有进入赛点车辆、人员需凭证入内;严禁携带易燃易爆等危险
品及比赛严令禁止的物品进入场地;场地设备设施均可安全使
用。
(二)参赛选手在参赛过程中,必须服从场内裁判及工作人
员的指挥,严格按照制作规程进行操作,正确使用器具及设备。
(三)赛场设置警戒线,赛场24小时有人看管;比赛前两
天起,赛场实行全方位封闭,除工作人员外,选手和指导老师等
非工作人员不准进场。赛场设置联网的监控体系,可以对赛场进
行24小时监控。
(四)裁判员在比赛前,宣读安全注意事项,当现场出现突
发事件时,应及时给予处置。
(五)竞赛过程中如若发生用电安全或有人员身体出现异常
情况,应立即报告现场总指挥,同时启动处理应急预案,各类人
员按照分工各尽其责,立即展开现场处置和人员疏散,最大限度
减少人员伤害和财产损失。
11
十二、申诉与仲裁的程序
(一)参赛队对不符合赛项规程规定的仪器、设备、工装、
材料、物件、计算机软硬件、竞赛使用工具、用品;竞赛执裁、
赛场管理、竞赛成绩,以及工作人员的不规范行为等,可向赛项
裁判长及大赛仲裁委员会提出申诉。
(二)申诉主体为参赛队领队。
(三)申诉启动时,参赛队以该赛项领队亲笔签字同意的书
面报告递交材料。报告应对申诉事件的现象、发生时间、涉及人
员、申诉依据等进行充分、实事求是的叙述。非书面申诉不予受
理。
(四)提出申诉的时间应在比赛结束后(选手赛场比赛内容
全部完成)2小时内,超过时效不予受理。
(五)赛项裁判长在接到申诉报告后的2小时内组织复议,
并及时将复议结果以书面形式告知申诉方。申诉方对复议结果仍
有异议,可由该赛项领队代表参赛学校递交加盖学校公章的书面
报告向大赛仲裁委员会提出申诉。大赛仲裁委员会的仲裁结果为
最终结果。
(六)申诉方不得以任何理由拒绝接收仲裁结果;不得以任
何理由采取过激行为扰乱赛场秩序;仲裁结果由申诉人签收,不
能代收;如在约定时间和地点申诉人离开,视为自行放弃申诉。
(七)申诉方可随时提出放弃申诉。
(八)申诉方必须提供真实的申诉信息并严格遵守申诉程
12
序,提出无理申诉或采取过激行为扰乱赛场秩序的应给予取消参
赛成绩等处罚。
十三、竞赛观摩
(一)观摩对象。
比赛期间将设竞赛临时观摩区,邀请来自全区相关行业职业
教育院校代表、优秀教育工作者、专家学者、大型企业领导者、
业界精英、专业学生等观摩比赛。
(二)观摩方法及纪律要求。
参加观摩的代表须遵守大赛纪律,按照大赛组委会的组织有
序观摩。比赛期间,保持观摩室安静。凡观摩人员均不得进入赛
场内部进行拍照、交流、观看。
十四、竞赛须知
(一)大赛人员须知。
为确保大赛工作安全、有序开展,涉及大赛工作的人员应自
查健康状况,一旦发现身体有不适症状,及时向所在单位报告,
并尽快就诊检查。
(二)参赛队须知。
1.参赛队名称统一使用选手所在学校全称,团体赛不接受跨
校组队报名。
13
2.参赛选手在报名资格审查通过后,原则上不再更换,如备
赛过程中,选手因身患疾病或不可抗拒原因不能参赛,所在学校
需于开赛10个工作日前出具书面报告并按相关参赛选手资格补
充人员并接受审核。竞赛开始后,参赛队
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西省卫生类事业单位竞聘-影像技术类近年考试真题库-含答案解析
- 售票服务礼仪培训
- 2024-2025学年下学期高二英语外研社版同步经典题精练之动词词义辨析
- 平常心态培训
- 大学人生安全教育
- 借条与欠条的相关知识
- 开腹手术围手术期护理
- 产险在线销售-项目经理培训weijh
- 第5章 树和二叉树-25春-250314
- 2025年医药商品储运员职业技能考试题库(含答案)
- 《公路桥梁抗震设计细则》-鲍卫刚
- 保洁员安全培训教育课件
- 量子传感器技术与应用
- 赵一曼英雄事迹
- 2024届辽宁省名校联盟高考模拟卷(调研卷)数学试题(一)
- 用户需求调研结果分析报告
- Creo-7.0基础教程-配套课件
- 方格网土方计算表
- 乡村教师先进事迹材料:做好老师做好人
- 腹部损伤病人护理查房
- 高考专题复习:诗歌鉴赏之咏史怀古诗
评论
0/150
提交评论