商务数据分析基础与应用(微课版)王华新课后题答案_第1页
商务数据分析基础与应用(微课版)王华新课后题答案_第2页
商务数据分析基础与应用(微课版)王华新课后题答案_第3页
商务数据分析基础与应用(微课版)王华新课后题答案_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商务数据分析基础与应用(微课版)王华新课后题答案项目一商务数据分析认知一、单选题DDA多选题ABCDEABCDBCD三、名词解释略四、简答题略项目二收集商务数据1.单选题DBCBC2.多选题ABCDABABD3.判断题√√×√4.简答题1.参考答案:为了保证收集工作的有效性和数据价值,需要注意以下几个原则:(1)及时性。注意数据的产生时间,过时的数据解决不了当下的问题。(2)全面性。充分考虑到内部和外部的数据来源,尽量避免幸存者偏差、选择性偏差等。(3)相关性。避免犯两类错误:有什么数据就用什么数据,且喜欢复杂的模型;不进行事前调查,没有任何基础就想当然的收集数据。(4)经济性。在选择要分析的商业指标、确定数据收集方法以及收集流程的过程中,要将可能产生的效益与花费的人力、物力、财力、时间等成本进行衡量,从而制定更为经济可行的数据收集方案。2.参考答案:数据分析人员可以按照如下的流程进行操作:(1)定位商业问题,确定有理有据的收集指标。定位商业问题的最终目的是要透过现象看本质,运用4W提问法挖掘期望成果和行动之间的因果关系。(2)考虑指标特征,选择经济可行的收集方法。确定了要收集的数据指标后,就需要着手根据指标特征结合收集成本,考虑获取数据应使用的方法。(3)明确任务分工,制定切实有效的收集方案。在正式进行数据收集工作前,应明确数据收集的指标范围和时间范围。接着明确这些数据需要从哪些途径及部门收集,最后确定参与部门和人员配备并落实为工作方案。(4)建立数据规范,进行完整准确的数据检查数据指标需对数据进行唯一性标识,并且贯穿之后的数据查询、分析和应用,建立数据指标规范是为了使后续工作有一个可以遵循的原则,也为庞杂的数据分析工作确定了可以识别的唯一标识。5.论述题参考答案:二手数据包括内部数据和外部数据两种。(1)内部数据内部数据来自于组织内部,因其他目的而收集。内部数据的收集来源为业务资料、统计资料、数据库等(企业数据库、部门沟通等),收集方法包括报表收集、数据库收集、系统日志数据收集等。①报表收集。报表收集是指企业可以通过相关业务部门每日、周的工作报表进行数据收集,如销售明细、出入库清单、客服记录等。②数据库收集。数据库收集是指企业将数据库收集系统直接对接到业务后台服务器,业务后台每时每刻产生的大量业务记录即可写入到数据库中,最后由特定的处理系统进行数据分析。③系统日志数据收集。系统日志数据收集主要针对互联网上的商务活动。网站日志会记录访客IP地址、访问时间、访问次数、停留时间、访客来源等数据。通过对这些日志信息进行收集、分析,可以挖掘企业业务平台日志数据中的潜在价值。(2)外部数据外部数据是指从组织外部获得的二手数据。外部数据的收集来源为公开出版的资料、计算机数据库、其它来自互联网的资料(网站日志、第三方平台统计、互联网检索、网络爬虫等),收集方法包括文献收集、网页数据收集等。文献收集即通过政府部门、机构协会、新闻媒体、出版社等发布的统计收据、行业调查报告、新闻报道、出版物。项目三预处理商务数据1.单选题BCCADC2.多选题BDABCABCDABCD3.判断题×√√√√4.简答题1.参考答案:原始数据主要存在以下几个问题:(1)缺失数据,是指在实践过程中因种种原因没有能够获取观测对象的相关信息,造成数据不完全。(2)异常值数据,也可称为离群点,是指所获得的数据中与平均值的偏差超过两倍及两倍以上标准差的数据。(3)重复数据,一般分为实体重复和字段重复两种。其中,实体重复是指所有字段完全重复,字段重复则表示某一个或多个不该重复的字段重复。(4)冗余数据,一方面是指多个数据集合并时,同一内容不同命名或者编码,例如某数据集中的变量名称为“用户编码”,在另一个数据集中却为“id”;另一方面也指数据集中的2个或多个变量之间存在相关或者推导关系。冗余数据会造成数据重复或分析结果产生偏差。(5)不一致数据,一般表现为3个方面的问题:一是人为/机械原因导致的录入错误或者数据规范不同;二是变量单位或者量纲不匹配;三是数据特征不适应特定数据分析模型的需求或变量过多分析难度较大。2.参考答案:测度数据的集中趋势的指标可分为数值平均数和位置代表值两大类。数据平均数主要包括算术平均数、调和平均数和几何平均数;位置代表值主要有中位数和众数。数列20,6,5.论述题参考答案:可做如下数据清洗:(1)对于缺失值,id为A002的会员缺失信息过多,在分析线上消费金额字段时可参与运算,在分析其他字段时可考虑删除改行。id为A001的会员线上消费金额缺失,需追溯数据源,在这里也可通过公式“线上消费金额=消费金额-线下消费金额”计算得出。(2)对于异常值,id为A005的会员消费金额明显偏离平均值,需追溯数据源,如无法回溯,可填充该列平均值。(3)对于重复值,表格中有两个完全相同的id为A004的会员信息,删除其中一行即可。项目四商务数据分析一、单选题CD二、多选题ABCDABCDEABCDBCD三、名词解释略四、简答题略五、论述题参考答案(1)从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因可以从两个角度来分析:站在消费者的角度来看,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。(2)针对该问题背后的两方面原因,运营改进计划也分两方面:一是针对消费者周末没有购买欲望的心理,引导提醒消费者周末就应该准备好该产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论