Excel数据分析实践活动_第1页
Excel数据分析实践活动_第2页
Excel数据分析实践活动_第3页
Excel数据分析实践活动_第4页
Excel数据分析实践活动_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Excel数据分析实践活动一、实践目的1、学生了解商务数据的重要作用与应用。2、学生学会商务数据分析的基本方法,技能。为以后从事更深层次的数据科学内容做准备。3、让学生了解数据分析和挖掘岗位目前的就业形式和前景及所需相关技能,了解企业实际需求。对于自身以后的学习方向和就业范围有初步的印象,为走好数据分析方向的职业道路提供有力的指引。4、目前高校理学、工学研究生均会涉及到数据科学的内容,本科生目前都要学习数据分析各个方面的基础知识,通过本次培训本科生可掌握一定的数据分析的方法和技能。二、实践内容Excel数据的导入、数据清洗、数据的处理、数据的抽取、数据合并、数据计算、数据类型和数据分析以及数据的展现、参观华为云(西北)联合创新中心。三、实践过程众所周知,大学生所学的专业知识是为了毕业后找到一份适合自己的不错的工作,也就是要为自己的职业生涯打下坚实良好的基础。所以在大学这个阶段,我们要学的不仅仅是专业理论与知识,更重要的是学习如何将理论运用到实践中去。只有将理论与实践很好的结合,才能真正将自己的专业和日后的职业联系到一起,从而在竞争中获得优势。我校在每个学期末布置实训短学期任务,组织我们应用统计专业的同学集体培训了Excel实训课程,让我们能够熟练掌握Excel软件的各项运用。同时,学校还组织我们参观了华为在西北创意园区,给了我们一个提前进入社会实践的机会,我们可以在一次次的实践当中体验不同职业,从中汲取宝贵经验。甚至在一次次的实践当中,我们会找到最适合自己的职业,以便在毕业后的求职路上少走弯路。从事各式各样的工作,能够锻炼我们的沟通能力和社交能力,加强我们自身职业素质的培养。能够让我们收获很多在之前完全陌生的专业知识。因此,做好每次的实践任务,是我们每个学生义不容辞的责任。在Excel的实训培训中,我清楚掌握了数据处理各方面的问题,比如:数据的导入、数据清洗、数据的处理、数据的抽取、数据合并、数据计算、数据类型和数据分析以及数据的展现。虽然看起来只有这几个内容,实际上每个内容都包含有许多不同的小知识点需要我们去掌握。第一天:导入数据有三种不同的方法:方法1:文本文档,步骤需要这几项,①设置语言格式②设置分隔符③设置格列数据格式;方法2:数据库,步骤有些复杂,需要我们,先处理数据--来自Access--数据透视表(表容量大时不合适)号码放到值区域--字段值设置(求和改成计数)--品牌放到行;方法3:网站的数据,这个操作的步骤就比较简单,只需要我们数据--来自网站--输入包含数据的网址--选择导入数据的区域—导入即可。第二天:数据清洗有五种方法,方法1:菜单删除法,作用是删除重复值;方法2:条件格式标识法,但只能标记重复值,步骤:选中数据--开始—条件格式--突出显示单元格规则--重复值;方法3:高级筛选法,这个方法可以得到重复结果,可以将重复值筛选出来;方法4:函数法(Countif),不仅能得到重复次数,还可以计算值重复值,步骤:空白单元格处--公式--插入函数--找到函数Countif--Range(筛选范围)--快捷键:Ctrl+shift+向下箭头(筛选条件)--选择第一个号码--点击小十字;方法5:数据透视表法,可以统计重复次数,可以得到排序的结果,就是步骤相对来说比较复查,先选中所有数据--插入--数据透视表(默认设置)--号码放到行,号码放到值--得到号码的统计数据--选择一个右键--排序。第三天:数据的处理,又细分为缺失值的处理、空白值的处理。在缺失值的处理中分为两种输入不同值的方法,第一种是多个单元格中输入同一个值的方法:选择多个单元格--输入值--按Ctrl+回车键;第二种是选中多个不连续空单元格的方法:开始--选择--定位条件--空值。而在空白值的处理,有替换和函数(trim)两种方法。第四天:数据的抽取分为字段拆分和记录随机抽取。字段拆分中又有两种方法,方法1:菜单法(选中段列--在该列旁边插入列--点击列右键插入数据--数据工具--分列--固定宽度--选择分列长度(7)舍弃后面的--点击另一半(选择不导入此列)—目标区域为新插入列),分为三步:第一步,设置固定宽度;第二步,设置分列线;第三步,设置格列类型,选择目标位置。方法2:函数法,有三种不同的函数,分别对应不同的用法,mid()从字符串中,指定位置起,返回指定长度的字符;left()从字符串中,第一个字符起,返回指定长度的字符;right()从字符串中,最后一个字符起,返回指定长度的字符。记录随机抽取:生成随机数rand()对随机数排序rank()排序函数 第一个参数:按照什么排序-选择第一个随机数 第二个参数:选择范围--选择随机数整个列 第一个排名生成后双击小十字生成所有的排名把排序结果中,前200名数据提取出来VlookupVlookup()搜索提取函数第一个参数为序号:F2(根据什么找找什么)第二个参数为选择的范围:AB列(在哪儿找)第三个参数为找到第二列号码:2(从条件列起相对应的第几列)第四个参数为匹配模式:0--精确匹配(精确匹配或模糊匹配)1--模糊匹配第五天:数据合并分为列的合并和字段匹配。列的合并有三中方法,方法1:函数法(Concatenate);方法2:&(文本连接符)例:&:=A2&"-"&B2&"-"&C2;方法3:Date(日期连接函数)例:date(2019,10,1)-date(2018,10,1)。在多条件匹配中,vlookup是重要的内容,具体格式是这样,Vlookup(1个号码,区域,列号,false),Vlookup的执行原理:从区域(第2个空)的首列,搜索第一空的值。Vlookup(1个号码,区域,列号,false),PPT中的多条件匹配,使用了excel数组计算。数组运算执行方法:CTRL+SHIFT+ENTER(回车)。第六天:数据的计算分为日期计算、标准化计算和加权求和。日期求和,基本格式是Datedif(起始日期,结束日期,"日期格式参数"),作用是能计算起始和终止日期之间所经历的时长。列如:月的计算:(结束日期-起始日期)/30,年的计算:(结束日期-起始日期)/365。时长格式又分为:Y:以年显示year()提取日期中的年份;M:以月显示month()提取日期中的月份;D:以日显示day()提取日期中的日;Today()返回当前系统日期。标准化计算能使一些数据的异常值落到正常的0-1的区间。计算方法:,其中的Max为最大值,min为最小值。加权求和,可以通知加权,让数据的占比均化。格式为Sumproduct(区域1,区域2),实质是各数据乘以权重,并求各乘积的和。综合得分框输入:==SUMPRODUCT(B2:F2,权重!$B$2:$F$2),第一个参数:数据区域(B2到F2),第二个参数:权重区域(B2到F2)按F4固定权重区域。第七天:数据类型中,行/列转换,操作步骤为:复制数据区域--找到目标位置--右击--选择性粘贴对话框中,选择“转置”。文本到数值,分为三种方法,方法1:分列,操作:选中数据区域--数据--分列--分列第三不选择“常规”类型;方法2:选择性粘贴--运算,操作:先复制“1”--选中数据--选择粘贴--运算;方法3:智能标记。在数值--文本中分为两种方法,方法1:分列;方法2:函数,text(数值,“格式”),常用格式为:小数(0.00)百分比(0.0%)日期(00年00月00日)。二维表转换为一维表,方法是使用数据透视表制作向导,操作:第一步ALT+D+P(打开向导对话框),第二步多重合并数据区域,第三步自定义页字段,第四步选择数据区域,第五步双击数据透视表的总计值(可以把二维转一维)。第八天:数据分析分为对比分析、数据分析表、结构分析、分布分析、交叉分析和多表关联分析RFM分析。对比分析又细分为环比和同比。环比:同一年中,上个月和下个月的数据比较(3月-2月)/2月;同比:两年中,同一时间的比较(2012年-2011年)/2011年。但是得注意,在数据透视表中,计算环比:选择‘值显示方式’为差异百分比。选择字段为“注册时间”,基本项为“上一个”。数据透视表中,计算同比:选择‘值显示方式’为差异百分比。选择字段为“年”,基本项为“上一个”。结构分析也称为占比分析,占比是一个项目中,各决定因素所在的比例。分布分析中,分组是相应值落入到各组中的比率。交叉分析的目的是从两个维度对我们的客户进行分类,操作步骤:1.用vlookup确定各客户,两个维度的性质;2.用数据透视表,从两个维度进行分类,来统计各分类的客户人数;3.从一维表的角度,查看客户分类情况的操作(1.以表格形式显示;2.重复所有标签;3.不显示汇总结果)。多表关联分析RFM分析:(是根据客户活跃程度和交易金额贡献,进行客户价值细分的一种方法),步骤:1.将数据表添加至"数据模型"中;2.插入数据透视表;3.建立数据表之间的关系;4.拖动数据字段进行分析,其中R:指购买时间间隔、F:购买的次数、M:购买的金额。分布分析是根据分析的目的,将数值型数据进行等距或不等距的分组,有两种方法,方法1:vlookup方法分组,可以进行不等距分组,用vlookup分组后,用数据透视表统计分组结果;方法2:数据透视表分组,只能进行等距分组操作:直接用数据透视表的分组功能完成即可。第九天:数据分析中最为重要的是矩阵分析。操作步骤:1.先进行定性分组,对数据进行平均值的计算,计算平均值得在透视表的计算区域上,右击--值字段设置--平均值;2.复制透视表数据到新的位置,其中得注意,粘贴数据时,用‘选择性粘贴’中的值;3.制作散点(矩阵)图,方法:选中月平均消费和月平均流量的值--插入--散点图,注意:不选行/列标签及总计;4.散点图x/y坐标轴,移动到平均值交叉位置,方法:在坐标轴上右击--坐标轴格式,设置即可;5.重新绘制x/y的坐标轴;6.给散点添加标签,1)在点上右击--添加标签,2)选中标签--右击--设置标签格式--单元格中的值--选择文字性的标签--取消Y值。我们不仅在学校里进行Excel的培训,第十天的时候我们还走出校园,到华为云西北联合联合创新中心去参观了一番。华为于1987年在中国深圳正式注册成立,注册资本2.1万元。现任总裁为任正非,董事长为孙亚芳。2007年合同销售额160亿美元,其中海外销售额115亿美元,并且是当年中国国内电子行业营利和纳税第一。截至2007年底,华为在国际市场上覆盖100多个国家和地区,全球排名前50名的电信运营商中,已有35家使用华为的产品和服务。2008年合同销售额233亿美元,是当年中国国内电子行业营利和纳税第一。截至2008年底,华为在国际市场上覆盖100多个国家和地区,全球排名前50名的电信运营商中,已有45家使用华为的产品和服务。2008年,华为公司成为世界专利“申请数量”(非核准)年度最多的公司,结束了飞利浦垄断长达十年之久的“霸主”地位。2009年,合同销售额300亿美元,国内首次突破100亿美元,销售额达到215亿美元没去过华为之前,我对华为的认识只停留在世界五百强企业和卖手机这两个概念上,直到我亲身去参观了创新中心之后才发现原来华为一路发展起来是多么的艰难,不仅涉及电子科技方面更涉及到航天航空领域,甚至还为在校大学生创立了很多创业的机会,一步步走向世界五百强,是中国的骄傲。以及华为人那种艰苦创业的精神也深深打动我。华为云(西北)联合创新中心是华为公司、西安国家民用航天产业基地及西安方点科技孵化器有限公司共同打造,是华为公司在高科技产业生态领域的核心布局之一。创新中心充分发挥华为的领先技术和资源,阻力中小企业快速发展,为企业及创新者赋能。“以奋斗者为本长期检查艰苦奋斗”是华为一直以来遵循的准则。也因如此,带领我们参观的员工向我们介绍到,在这儿的每一个员工都不是本地人,全部都是从全国各地华为的分公司派来的,甚至有些被外派到国外,他们无怨无悔,依旧艰苦奋斗着,仅仅只是因为这是华为一贯遵循艰苦奋斗的原则。华为还在全球设立了36个培训中心,为当地培养技术人员,并大力推行员工的本地化。全球范围内的本地化经营,不仅加深了我们对当地市场的了解,也为所在国家和地区的社会经济发展作出了贡献。在参观的过程中我最喜欢的是培训中心,华为重视培训是很有名的。比较我以往参观的企业,华为确实有它独到的地方。印象较深的,一是建筑的设计,美观实用,不张扬,但很有现代感。二是环境优美,无论是绿化面积还是室内装修,都是那么完美。三是园区管理,据说园区管理是外包的,井然有序,气氛活泼,充满生机。参观完后我们来到生活区。活动中心有各种设施,员工们在篮球场、网球场、乒乓球室、台球室、羽毛球馆搞运动,或者在阅览室看书(阅览室看书是免费的),员工们互相打着招呼,非常阳光和热情。四、实践体会通过短学期中前两周的学习,我首先充分认识到了Excel对于我们应用统计专业学生以后的工作就业中起到重要的作用,能够熟练掌握Excel软件的各项运用是我们以后从事各种不同工作岗位必不可少的一种专业技能。我们可以利用Excel做一些数据的处理和数据分析,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论