版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
甘肃商务大数据分析与应用大赛学生试题B卷
——南方科技有限公司大数据案例分析
一、公司背景
1、公司基本资料
南方科技有限公司成立于2006年,是一家专注于智能硬件、
电子产品研发的全球化移动互联网企业,同时也是一家专注于智
能手机、服务器及电脑建设的创新型科技企业,主要经营范围包
括:电脑产品的开发、生产、销售;服务器的生产、销售;手机
产品的开发、生产、销售;许可证范围内的进出口业务等。
2、公司组织结构
公司下设财务部、销售部、生产车间、采购部、研发部、行
政部、人力资源部。
财务部负责日常企业财务工作,包括严格遵守结算纪律,搞
好财务收支,及时反映和分析财务计划的执行情况;经常性检查
财务纪律的遵守情况等财务工作;
销售部负责产品的市场渠道开拓与销售工作,执行并完成公
司产品年度销售计划;动态把握市场价格,定期向公司提供市场
分析及预测报告等;
生产车间负责经营产品的生产、安全、设备等管理工作;组
织落实公司的生产计划,了解各道工序的进度,掌握生产、供应
1
情况等。
采购部负责掌握市场产品信息,开拓新的货源,优化进货渠
道,降低采购成本;选择、评审、联络供应商,建立供应商档案、
维护与供应商的关系;根据项目进度计划,编制合理的采购计划,
生产产品的原材料采购等。
研发部负责行新产品的研发和已有产品的维护升级工作;根
据业务部市场调研的结果和客户需求定制产品开发方向等。
行政部负责公司各职能部门的关系协调;各项规章制度制定
和实施;日常行政、法务等职能工作等。
人力资源部负责建立、建全公司人力资源管理系统;负责制
订公司用工制度、人力资源管理制度;制订和实施人力资源部年
度工作目标和工作计划;人员招聘、人员管理等工作;
3、主要生产、销售产品
公司主要生产和销售电脑、手机、服务器三类产品。其产量
销量均在全国范围内处于领先地位。
4、经营模式
公司采取的是轻资产运营模式,自己负责研发、设计、售后
服务等,生产、物流配送环节全部都是外包。采用外包的形式减
少了固定成本的投入和摊销,甩开最重、最积压资金的部分,同
时产品销售采用直销、分销相结合的销售模式,在各省市县设立
直营店和授权品牌门店。
2
5、经营成果
公司自创办以来,在2008年销售额3000万,2013年、2014
年及2015年,销售额增长分别有6.2%、11.4%及26.0%,2015
年,公司收入1246亿元人民币,同比增长61.3%,按收入增长速
度计算,在互联网公司中排名第14。
2018年7月12日,入选2017福布斯中国最具创新力企业
榜。
6、未来发展
未来,公司将立足主业,大力推动产品的多元化发展和产品
升级,实现企业经济的最大化增长,同时继续坚持改革创新发展
理念,坚持可持续化发展战略,整合已有资源和市场,继续保持
和巩固企业在行业中的地位。在市场经济的指引下,进一步做好
产品,做大品牌,做强企业,持续提供高质量、安全、技术领先
的产品,为客户和社会创造持续价值。
二、公共规则
1、命名规则
在进行路径建立时,考生需要对标题、代号、数据库表等进
行命名,需按以下规则命名,未按规定命名不得分,且影响后续
题目得分。
3
1.1创建表命名规则
“标题/简称”的命名规则为“考号+名称”,“代号”的命名
规则为“考号+首字母缩写”,“数据库表”的命名规则为“考号+
首字母缩写_分层名称”。
以下题为例:
在DMP“数据加工厂_设计区_工厂分层_ODS操作数据”路径
下创建主题域、主题及模型管理,通过“创建自定义模型(全部
字段需要手动定义)”方式创建。
路径标题/简称数据源连接描述
主题域财务默认数据源连接不填
主题现金流量默认数据源连接不填
模型管理现金流量简表/不填
如考生考号为KS011,则上述路径实际命名如下:
路径标题/简称代号数据源连接数据库表
主题域KS011财务KS011CW默认数据源连接/
主题KS011现金流量KS011XJLL默认数据源连接/
模型管理KS011现金流量简表KS011XJLLJB/KS011XJLLJB_ODS
1.2数据转换命名规则
“转换标题”的命名规则为“考号+名称+ETL”,“转换代号”
的命名规则为“考号+首字母缩写+ETL”。
以下题为例:
路径转换标题
ETL转换客户年龄维表ETL
如考生考号为KS011,则上述路径实际命名如下:
路径转换标题转换代号描述
ETL转换KS011客户年龄维表ETLKS011KHNLWBETL/
4
1.3数据分析命名规则
在进行路径建立时,考生需要对标题、代号、数据库表等进
行命名,需按以下规则命名,未按规定命名不得分,且影响后续
题目得分。“名称”的命名规则为“考号+名称,”“编号”的命名
规则为“考号+首字母缩写”
以下题为例:
在“商务智能—仪表盘”模块选择“数据集定义”,完成下
列路径要求的建立。
路径名称
系统商务大数据
模块运营分析
分组春节销售动态
春节销售实时数据
数据集春节分时段销售数据
春节各品牌销售占比
如考生考号为KS011,则上述路径实际命名如下:
在“商务智能—仪表盘”模块选择“数据集定义”,完成下
列路径要求的建立。
路径编号名称
系统KS011BBDKS011商务大数据
模块KS011YYFXKS011运营分析
分组KS011CJXSDTKS011春节销售动态
KS011CJXSSSSJKS011春节销售实时数据
数据集KS011CJFSDXSSJKS011春节分时段销售数据
KS011CJGPPXSZBKS011春节各品牌销售占比
2、无需操作步骤不体现原则
由于DMP及BA工具可操作模块较多,在命题过程中,无需
进行操作的步骤不进行描述,考生仅需针对题目所列项进行操作,
5
未列项目保持原始状态,无需另行操作,多余操作不得分,且影
响后续题目得分。
3、组件要求使用方式
(1)连接组件:默认使用左连接,其余连接方式不得分
(2)排序组件:默认使用升序,大小写不敏感,排序字段
为各数据表中的公共字段,其他排序方式不得分。
(3)分组组件,聚合别名默认为字段名首字母缩写(使用
大写字母),其他命名方式无法完成字段映射;使用分组组件时,
需先将数据进行排序,否则可能出现分组错误的情况;此试题分
组组件中聚合字段涉及聚合方法均为“求和”。
分组组件使用方式示例:
(4)需要进行数据过滤时,使用“表输入组件”里的“过
滤条件”进行过滤,使用其他方式不得分。
(5)计算器组件:
1)查找方式
方式一:使用搜索框定位查找
6
方式二:按照查找路径直接查找
2)使用方法
举例:计算毛利,毛利=主营业务收入-主营业务成本。具
体设置如下:
(6)如试题出现新组件,将在“公共规则”中给出使用规
范,需按使用规范操作,其他操作不得分。
7
4、路径建立
在DMP工具中建立路径时,维表均归属于主题中,不得在主
题域中新建维表,在主题域中新建维表不得分,且影响后续题目
得分。
使用DMP和BA工具进行路径建设时,考生请注意路径的层
级,在同一层级下建立不同子层级时,上级层级仅为方便考生查
找路径使用,请勿重复建立。重复建立不得分,且影响后续题目
得分。
5、删除数据表
出现需要删除维表或模型管理的情况时,如果数据库无数据,
系统会提示是否删除表对应的数据库,请选择删除;如果数据库
已有数据,新建数据库时出现数据库名重复时,请在数据库名称
后增加一位数字,此操作不影响得分。
6、ETL组件修改
ETL转换组件需要修改时,需要将要修改的组件删除后,重
新添加该组件,如果直接在组件上修改,可能出现修改无效的现
象,影响考试系统评分。
7、ETL“运行”操作原则
本次考试的各项任务是否点击“运行”按钮,请以题目任务
8
描述的要求为准。如未按题目要求操作,影响考试系统评分。
8、字段数据类型
进行字段设置时,试题会在“公共规则”中给出字段设置要
求,不按要求设置不得分。
字段名别名数据类型长度精度
XH序号字符型6
SPBM商品编码字符型10
……
9、创建表评分点
1)路径的简称、代号、数据源连接符合题目要求;
2)维表、模型管理的简称、代号、数据库表名称符合题目
要求;
3)创建表的字段数量、顺序、字段名、每个字段的属性设
置符合题目要求,注意只有该字段的所有属性设置均正确该字段
才得分。
10、数据转换评分点
1)路径正确;
2)ETL转换的标题、代号符合题目要求;
3)ETL转换的组件名称、数量、数据源连接、选择表等符
合题目要求。
11、相关参考知识
指标计算公式(题面中未给出公式的任务均在此查找,且任
9
务涉及新字段名均为首字母缩写)
1)平均单价=售价/数量
2)毛利=售价-成本
3)现金流动负债比=年经营活动现金净流量/期末流动负债
4)现金及现金等价资产总量=货币资金+短期有价证券
5)现金比率=现金及现金等价资产总量/流动负债
6)营运资金=流动资产-流动负债
7)流动比率=流动资产/流动负债
8)资产负债率=负债总额/资产总额
9)产权比率=负债总额/所有者权益总额
10)税负率=应交增值税/主营业务收入
12、数据集定义评分点
1)路径的编号、名称符合题目要求
2)数据集来源及语句要求符合题目要求
3)数据集预览字段名、字段说明、字段序号符合题目要求
13、部件定义评分点
1)路径的编号、名称、数据集符合题目要求
2)部件配置符合题目要求
10
三、运营数据岗
职责一:销售业绩数据整理
业务描述
销售业绩是指在一个时间段或者阶段展开销售业务后的收
益总结,是开展销售业务后实现销售收入的结果。根据每天、每
月、每年的销售业务数据统计出的收入业绩结果能够反映企业一
定期间经营状况。数据使用者可以通过销售业绩,了解企业的经
营成果,评价企业的盈利能力,并可在一定程度上预测企业未来
销售情况,为其决策提供有力依据。
工作任务1:销售业绩月度数据整理(14分,主题域1分、主题2
分、模型管理6分、ETL转换总分5分(只有表输入和表输出的ETL
转换每个1分,其他的2分)
本任务注重考查数据建模方法,不对ETL转换中的数据运行有效
进行考核,故本任务不提供原始数据。
公司每年都会在年度结束后对数据进行销售月度分析,从而
判断销售业绩的月度变动规律,为下年经营计划提供参考数据。
作为公司的运营数据分析专员,请你根据需求,抽取2020年月
度销售业绩的相关数据,对其进行整理。
数据整理规则如下:
11
1.1ODS创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
默认数据源
主题域考号+销售业绩考号+XSYJ/
连接
默认数据源
主题考号+近年销售明细考号+JNXSMX/
连接
模型管理考号+销售明细表考号+XSMXB/考号+XSMXB_ODS
《销售明细表》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
RQ日期字符型10否否
DDBH订单编号字符型10否否
KHBH客户编号字符型10否否
CPBH产品编号字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
1.2ODS层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+销售明细表ETL考号+XSMXBETL/
ETL转换要求如下:
12
《销售明细表ETL》
组件名称数据源连接选择表
表输入1销售数据库XSMXB_ZY
表输出1默认数据源连接考号+XSMXB_ODS
1.3DW层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DW数据
仓库”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
默认数据源连
主题域考号+销售业绩考号+XSYJ/
接
考号+2020年销考号默认数据源连
主题/
售明细+2020NXSMX接
模型管考号+2020年销考号考号
/
理售数据+2020NXSSJ+2020NXSSJ_DW
《2020年销售数据》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
RQ日期字符型10否否
DDBH订单编号字符型10否否
KHBH客户编号字符型10否否
CPBH产品编号字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
1.4DW层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_DW数据
仓库_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
13
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+2020年销售数据ETL考号+2020NXSSJETL/
ETL转换要求如下:
《2020年销售数据ETL》
组件名称数据源连接选择表
表输入1默认数据源连接考号+XSMXB_ODS
过滤条件/年度=“2020”
表输出1默认数据源连接考号+2020NXSSJ_DW
1.5DM层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
考号+销售业默认数据源连
主题域考号+XSYJ/
绩接
考号+2020年考号默认数据源连
主题/
销售明细+2020NXSMX接
考号+2020年考号
模型管理/考号+2020NYDXSQK_DM
月度销售情况+2020NYDXSQK
《2020年月度销售情况》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
SL数量整型否否
SJ售价浮点型202否否
1.6DM层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
14
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+2020年月度销售情况ETL考号+2020NYDXSQKETL/
ETL转换要求如下:
《2020年月度销售情况ETL》
组件名称数据源连接选择表
表输入1默认数据源连接考号+2020NXSSJ_DW
排序组件1/排序字段:年度、月份
分组字段:年度、月份
分组1/
聚合字段:数量、售价
表输出1默认数据源连接考号+2020NYDXSQK_DM
工作任务2:各板块业绩整理(13分,主题域1分、主题1分、模型
管理6分、ETL转换总分5分(只有表输入和表输出的ETL转换每个
1分,其他的2分)
本任务注重考查数据建模方法,不对ETL转换中的数据运行有效
进行考核,故本任务不提供原始数据。
2020年,公司的销售业绩得到了巨大的飞跃。为了了解各
板块对公司的贡献,请你根据要求,从默认数据源连接数据库中
抽取板块销售业绩的相关数据,对2020年各板块的业绩进行数
据整理。
数据整理规则如下:
2.1ODS层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
15
数据”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
默认数据源
主题域考号+销售业绩考号+XSYJ/
连接
默认数据源
主题考号+各业务业绩考号+GYWYJ/
连接
模型管考号
考号+业务销售数据考号+YWXSSJ/
理+YWXSSJ_ODS
《业务销售数据》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
RQ日期字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
2.2ODS层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+业务销售数据ETL考号+YWXSSJETL/
ETL转换要求如下:
《业务销售数据ETL》
组件名称数据源连接选择表
表输入1销售数据库XSSJ_ZY
表输出1默认数据源连接考号+YWXSSJ_ODS
16
2.3DW层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DW数据
仓库”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
默认数据源连
主题域考号+销售业绩考号+XSYJ/
接
考号+各业务业默认数据源连
主题考号+GYWYJ/
绩接
考号+销售数据
模型管理考号+XSSJHZ/考号+XSSJHZ_DW
汇总
《销售数据汇总》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
2.4DW层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_DW数据
仓库_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+销售数据汇总ETL考号+XSSJHZETL/
ETL转换要求如下:
《销售数据汇总ETL》
组件名称数据源连接选择表
表输入1默认数据源连接考号+YWXSSJ_ODS
17
排序组件1/排序字段:年度、月份、业务类别
分组字段:年度、月份、业务类别
分组1/
聚合字段:数量、售价
表输出1默认数据源连接考号+XSSJHZ_DW
2.5DM层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
主题域考号+销售业绩考号+XSYJ默认数据源连接/
考号+各业务业
主题考号+GYWYJ默认数据源连接/
绩
考号+各业务均考号考号
模型管理/
价数据表+GYWJJSJB+GYWJJSJB_DM
《各业务均价数据表》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
PJDJ平均单价浮点型202否否
2.6DM层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+各业务均价数据表ETL考号+GYWJJSJBETL/
18
ETL转换要求如下:
《各业务均价数据表ETL》
组件名称数据源连接选择表
表输入1默认数据源连接考号+XSSJHZ_DW
排序组件1/排序字段:年度、月份、业务类别
新字段名PJDJ
字段A售价
字段B数量
计算器1/值类型浮点型
计算重要考点,不作提示
长度20
精度2
表输出1默认数据源连接考号+GYWJJSJB_DM
工作任务3:服务器业务销售业绩增长趋势数据整理(11分,主题域
1分、主题1分、模型管理4分、ETL转换总分5分(只有表输入和
表输出的ETL转换每个2分,其他的3分)
本任务注重考查数据建模方法,不对ETL转换中的数据运行有效
进行考核,故本任务不提供原始数据。
2020年1月,公司成立服务器业务部。经过一年时间的发
展,销售收入已达14.5亿元,发展势头迅猛。为了完成公司对
服务器业务部门新一年的考核指标制定工作,需要对2020年服
务器业务的销售数据进行整理分析。从而对服务器业务的发展趋
势做一定预测,得出合理的考核指标。作为公司的运营数据分析
专员,请你根据需求,抽取2020年销售业绩的相关数据,对其
进行整理。
数据整理规则如下:
19
3.1ODS层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据”路径下新建主题域和主题,通过“创建自定义模型(全
部字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
主题域考号+销售业绩考号+XSYJ默认数据源连接/
考号+服务器业考号
主题默认数据源连接/
绩增长趋势+FWQYJZZQS
模型管考号+业绩月度考号考号
/
理数据+YJYDSJ+YJYDSJ_ODS
《业绩月度数据》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
YWLB业务类别字符型10否否
SL数量整型否否
SJ售价浮点型202否否
CB成本浮点型202否否
3.2ODS层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+业绩月度数据ETL考号+YJYDSJETL/
ETL转换要求如下:
《业绩月度数据ETL》
组件名称数据源连接选择表
表输入1销售数据库XSMXB_ZY
20
表输出1默认数据源连接考号+YJYDSJ_ODS
3.3DM层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
主题域考号+销售业绩考号+XSYJ默认数据源连接/
考号+服务器业考号
主题默认数据源连接/
绩增长趋势+FWQYJZZQS
模型管考号+服务器业考号考号
/
理绩月度变动+FWQYJYDBD+FWQYJYDBD_DM
《服务器业绩月度变动》信息如下:
字段名别名数据类型长度精度是否为空是否主键
ND年度字符型10否否
YF月份字符型10否否
SL数量整型否否
YWLB业务类别字符型否否
SJ售价浮点型202否否
CB成本浮点型202否否
ML毛利浮点型202否否
3.4DM层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_DM数据
集市_ETL转换”路径下创建指定名称的ETL转换。(此题无需点
击“运行”按钮)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+服务器业绩月度变动ETL考号+FWQYJYDBDETL/
ETL转换要求如下:
21
《服务器业绩月度变动ETL》
组件名称数据源连接选择表
表输入1默认数据源连接考号+YJYDSJ_ODS
过滤条件/业务类别=“服务器”且年度=“2020”
新字段名ML
字段A售价
字段B成本
计算器1/值类型浮点型
计算重要考点,不作提示
长度20
精度2
排序组件1/排序字段:年度、月份、业务类别
分组字段:年度、月份、业务类别
分组1/
聚合字段:数量、售价、成本、ML
表输出1默认数据源连接考号+FWQYJYDBD_DM
职责二:客商数据整理
业务描述
随着经济全球化的逐步深入,科技、通讯、交通等各领域高
速发展,行业间呈现出不断加速融合、资源迅速整合的趋势,企
业已经从单一主体之间的竞争转变为企业所拥有的供应链之间
的整体竞争。企业的原材料供应、到货检验、过程控制、委外加
工、产品出厂检验、分装、仓库管理、物流配送、线上线下的销
售、供应商评价、客户反馈跟踪、产品提升等各环节的有效运转
越来越需要上下游各级客户、供应商的紧密配合,以及对其相关
信息的及时精准获取与分析决策。这些都依赖于对客户、供应商
信息的有效整合,及其信息在企业间的及时共享和运用,“客商
数据”即在其中起到了“神经元”的作用,能够做到对客户、供
应商数据的精准定位,并以此作为中心进行信息的扩展,以有效
22
地帮助提升信息的附加值。
工作任务4:优质供应商评定(40分,主题域1分、主题1分、维表
及模型管理14分、ETL转换总分24分(只有表输入和表输出的ETL
转换每个2分,其他的4分)
为识别出有能力满足公司采购要求的优质供应商,公司建立
了一套完整的供应商评估体系和分级系统,严格审核每一个供应
商。每隔半年,公司都会重新审核所有的供应商并严格执行分级
制度。(A级供应商评级标准:年采购金额大于等于5000万,质
量评定为A,信用评级为A)。
请你根据要求,抽取相关数据,对公司供应商数据进行整理,
选出评级为A的供应商。
数据整理规则如下:
4.1ODS层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据”路径下新建主题域和主题,通过“创建自定义维表及模型
(全部字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
路径标题/简称代号数据源连接数据库表
默认数据源
主题域考号+客商数据考号+KSSJ/
连接
考号+供应商等级数考号默认数据源
主题/
据+GYSDJSJ连接
考号考号
维表考号+供应商信息表/
+GYSXXB+GYSXXB_ODS
模型管理考号+采购汇总数据考号/考号
23
+CGHZSJ+CGHZSJ_ODS
《供应商信息表》信息如下:ID字段为GYSBH,文字字段为GYSBH;
字段名别名数据类型长度精度描述
GYSBH供应商编号字符型20
GYSMC供应商名称字符型30
XY信用字符型10
SF省份字符型20
CS城市字符型30
YWLB业务类别字符型20
ZLPJ质量评价字符型5
《采购汇总数据》信息如下:
字段名别名数据类型长度精度是否为空是否主键描述
ND年度字符型10否否
YF月份字符型10否否
RQ日期字符型10否否
DDBH订单编号字符型10否否
YWLB业务类别字符型10否否
CPBH产品编号字符型10否否
GYSBH供应商编号字符型10否否
CGSL采购数量整型否否
CGJE采购金额浮点型202否否
4.2ODS层数据转换
参照下表,在DMP“数据加工厂_设计区_工厂分层_ODS操作
数据_ETL转换”路径下创建指定名称的ETL转换。(此题需要点
击“运行”按钮,得出数据)
ETL转换命名如下:
路径转换标题转换代号描述
ETL转换考号+供应商信息表ETL考号+GYSXXBETL/
ETL转换考号+采购汇总数据ETL考号+CGHZSJETL/
ETL转换要求如下:
《供应商信息表ETL》
组件名称数据源连接选择表
表输入1公共基础数据GYSXXB
表输出1默认数据源连接考号+GYSXXB_ODS
24
《采购汇总数据ETL》
组件名称数据源连接选择表
表输入1采购数据库CGHZB_2020
表输出1默认数据源连接考号+CGHZSJ_ODS
ETL转换输出结果如下:
《供应商信息表ETL》
业务类质量评
供应商编号供应商名称信用省份城市
别价
ZY01001供应商001A贵州省贵阳市手机C
ZY01002供应商002A湖南省常德市手机D
ZY01003供应商003D山东省滨州市手机C
ZY01004供应商004B河南省平顶山市手机D
ZY01005供应商005A山西省大同市手机A
ZY01006供应商006C安徽省池州市手机B
ZY01007供应商007B浙江省杭州市手机C
……
《采购汇总数据ETL》
业务产品供应商采购
年度月份日期订单编号采购金额
类别编号编号数量
202011ZJ01004电脑ZJ001ZY010051216452308700
202011ZJ01023电脑ZJ006ZY020171262954308720
202013ZJ01042电脑ZJ011ZY020331292955595959
202013ZJ01061电脑ZJ016ZY020361521065405959
202016ZJ01080电脑ZJ021ZY020541382277405959
202018ZJ01099电脑ZJ026ZY020851332874640859
202018ZJ01118电脑ZJ031ZY021161284471930859
2020110ZJ01137电脑ZJ036ZY021471303979540859
……
………………
4.3DW层创建表
参照下表,在DMP“数据加工厂_设计区_工厂分层_DW数据
仓库”路径下新建主题域和主题,通过“创建自定义模型(全部
字段需要手动定义)”方式创建指定名称的表。
路径要求如下:
25
路径标题/简称代号数据源连接数据库表
默认数据源连
主题域考号+客商数据考号+KSSJ/
接
考号+供应商等考号默认数据源连
主题/
级数据+GYSDJSJ接
考号+供应商采考号考号
模型管理/
购数据汇总+GYSCGSJHZ+GYSCGSJHZ_DW
考号+供应商信考号考号
模型管理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 配电网负荷动态平衡技术
- 保险行业数字化转型模板
- 职业导论-2018-2019年房地产经纪人《职业导论》真题汇编
- 房地产交易制度政策-《房地产基本制度与政策》真题汇编4
- 要怎么写问卷调查报告
- 人教版三年级数学下册第三单元复式统计表综合卷(含答案)
- 山西省朔州市部分学校2024-2025学年八年级上学期期末生物学试卷(含答案)
- 产权技术合同在跨国技术转移中的法律风险与防范
- 苏州中考英语模拟试卷单选题及答案
- 二零二五版房屋遗产继承分配与拆除重建工程融资合同3篇
- 成品可靠性测试计划
- 汉声数学绘本《数是怎么来的》
- 人工智能基础与应用课件
- 仿制药一致性评价
- 【译林版】六年级英语(下册)单词默写单
- 计算机二级wps题库及答案
- 整套课件:工业催化
- 爆破安全管理知识培训
- 旅游地理学教案
- 煤矸石综合利用途径课件
- 企业信息公示联络员备案申请表
评论
0/150
提交评论