业务数据的四大方法_第1页
业务数据的四大方法_第2页
业务数据的四大方法_第3页
业务数据的四大方法_第4页
业务数据的四大方法_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

业务数据的分析方法学员使用EXCEL的熟练程度学员对数理统计的熟悉程度议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:描述统计假设检验方差分析回归分析

利用EXCEL分析数据常用图和表:折线图,饼图,面积图,频数表和柱状图,散点图,时间序列数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE利用EXCEL分析数据

--折线图折线图:显示随时间或类别而变化的趋势线折线图类型利用EXCEL分析数据

--饼图饼图:显示每一数值相对于总数值的大小,分离饼图强调单个数值的大小饼图类型利用EXCEL分析数据

--面积图面积图:显示每一数值所占大小随时间或类别而变化的趋势线面积图类类型利用EXCEL分析数数据:--柱状状图柱状图::比较相相交于类类别轴上上的数值值大小;;堆积柱状状图:比比较相交交于类别别轴上的的每一数数值相对对于总数数值的大大小柱状图类类型条形图类类型条形图也也可用一一种类似似的方法法显示数数据,仅仅仅是将将垂直方方向换成成水平方方法而已已。堆积条形形图可以以在同一一个条上上连续地地显示各各种数据据,而不不像簇状状条形图图那样把把条并列列在一起起显示数数据。频数分析析和直方方图频数分布布表指,,在不同同的类别别里发生生了多少少次观测测值直方图通通过图形形的方式式表达了了同样信信息。直方图的的应用举举例来自Shoes.xls利用EXCEL分析数数据--散点点图散点图::比较成成对的数数值。散点图类类型利用散点点图的关关系分析析我们经常常关心两两个变量量之间的的关系。。一个非非常有用用的显示示这个关关系的方方法是对对每一个个观测值值都在图图上作一一个点,,这个点点的坐标标代表了了两个相相关变量量的值。。结果产产生的图图就是散散点图。。通过检检查散点点的分布布,我们们可以查查看两个个变量之之间有没没有什么么关系,,如果有有,是什什么样的的关系。。来自Actors.xls例5:时间序列列制图时间序序列图图的本本质是是散点点图,,时间间序列列变量量在纵纵轴,,时间间变量量在横横轴。。同时时为了了分布布的趋趋势更更加清清晰,,这些些点通通常是是通过过线连连接在在一起起。来自Toys.xls例6::练习:分分析某某某区区近期期得业业务状状况分析指指标:总总收件件票数数,日日均均收件件票数数,日日人人均效效能要求:各指标标逐月月变化化情况况各指标标的相相关性性各分部部的票票数占占该区区总票票数的的比例例变化化数据透透视图图数据透透视图图报表表是一一种具具有图图表格格式的的交互互式数数据汇汇总报报表,,是一一个Excel功能能很强强大,,而且且易于于使用用的工工具。。这个工工具提提供了了大量量有用用的信信息,,可以以让我我们可可以从从不同同角度度切割割,就就是可可以把把数据据分成成一些些子集集。数据透透视表表的创创建与与常规规的MicrosoftExcel图图表表不同同。在在创建建数据据透视视图报报表后后,您您还可可以通通过拖拖动其其字段段和项项目来来查看看不同同层次次的明明细数数据或或重新新组织织图表表的版版式。。例7::AccountingProfessionals.xls数数据据集来自AccountingProfessionals.xls创建数数据透透视图图的步步骤选择数数据范范围确定所所要创创建表表格的的类型型确定字字段设设置选择报报表格格式选择读读取方方式数据透透视表表的优优点在在于::如果果想要要改分分析,,可以以仅仅仅将带带有阴阴影的的变量量名拖拖出透透视表表,并并用其其他变变量代代替,,你能能轻易易地在在字段段域中中增加加多个个变量量来创创建不不同的的数据据图。。创建数数据透透视图图的优优点利用EXCEL分析析数据据常用图图和表表:折线图图,饼饼图图,面面积积图,频频数表表和柱柱状图图,散点图图,时时间间序列列数据透透视图图常用简简单的的统计计命令令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE平均值值平均值值:是是某个变变量所所有值值的平平均数数。如如果数数据代代表了了一个个大量量数据据的样样本,,我们们就叫叫他样样本均均值。。如果果是对对象是是整体体分析析,就就是整整体均均值。。公式::Excel命令令:=AVERAGE() ̄Σni=1χiχ=n四分位位数和和百分分比Excel命令令:QUARTILE(salary,,1):返返回回一组组数据据的四四分位位点PERCENTILE(salary,,.05):返返回回一组组数据据的K百分分比的的数值值点最小值值、最最大值值Excel命令令:MAX(number1,number2…):返回回一组组数据据的最最大值值,忽忽略略文本本MIN(number1,number2…):返回回一组组数据据的最最小值值,忽忽略略文本本方差描述样样本数数据的的离散散程度度公式::Excel命令令:VAR(supplied)STDEV(supplied)σ2=Σni

=1(χi

χ)2n ̄计算均均值,中中位数数,众众数数,方方差差举例例RangenamesSupplier1:A4:A14Supplier2:B4:B14来自Otis4.xls相关分分析用于反反映分分析变变量间间的密密切程程度相关系系数度度量的的是两两个间间隔尺尺度变变量之之间线线性关关联关关系的的程度度。正的相相关系系数表表示一一个变变量的的较大大值和和另一一个变变量的的较大大值是是联系系在一一起的的。而而负的的相关关系数数则表表示一一个变变量的的较大大值和和另一一个变变量的的较小小值之之间具具有的的关联联关系系。相关分分析举举例来自Expenses.xls相关分分析举举例–用用于运运动的的支出出与用用于文文化的的支出出的关关系来自Expenses.xls来自Expenses.xls相关分分析举举例–收收入与与用于于文化化的支支出的的关系系相关分分析举举例–相相关系系数与与协方方差来自Expenses.xls数据分分析的的常用用软件件MINITABSPSSEXCEL-XLSTAT议程利用EXCEL分析析数据据常用统统计软软件数据挖挖掘常用统统计方方法:描述统统计假设检检验方差分分析回归分分析数据挖挖掘(DataMining)什么是是DataMining?DataMining的应应用DataMining算算法包包括:预测(Prediction)分类(Classification)联系(Association)回归(Regression)什么是是DataMining?通过采采用自自动或或半自自动的的手段段,从大量量数据据中提提取出出可信信、新新颖、、有效效并能能被人人理解解的信信息的的高级级处理理过程程按企业业既定定业务务目标标,对对大量量的企企业数数据进进行探探索和和分析析,揭揭示隐隐藏的的、未未知的的或验验证已已知的的规律律性,,并进进一步步将其其模型型化的的先进进有效效的方方法数据挖挖掘能能够帮帮助你你选择择正确确瞄准准潜在在目标标,向向现有有的客客户提提供额额外的的产品品,识识别那那些准准备离离开的的好客客户发现最最有价价值的的客户户数据挖挖掘的的作用用使组合合销售售更有有效率率数据挖挖掘的的作用用留住那那些最最有价价值的的客户户数据挖挖掘的的作用用用更小小的成成本发发现欺欺诈现现象数据挖挖掘的的作用用数据挖挖掘应应用领领域电信:流失失银行::聚类类(细细分)),交交叉叉销售售百货公公司/超市市:购购物篮篮分析析((关联联规则则)保险::细分分,交交叉销销售,,流失失(原原因分分析))信用卡卡:欺诈探探测,,细分分电子商商务::网站日日志分分析税务部部门::偷漏漏税行行为探探测警察机机关::犯罪罪行为为分析析医学::医疗保保健议程利用EXCEL分析析数据据常用统统计软软件数据挖挖掘常用统统计方方法:描述统统计假设检检验方差分分析回归分分析假设检检验涉及对对总体体参数数数值值有关关的两两个命命题(假设设)作作推断断步骤提出待待检验验的假假设选择显显著性性水平平确定一一个作作结论论的判判断准准则收集数数据并并计算算检验验统计计量用决策策法则则检验验统计计量并并得出出结论论假设检检验包包括:t检检验和和z检检验验方差分分析(ANOVA)单因素素方差差分析析:通通过过简单单的方方差分分析,,对两两个以以上样样本平平均值值进行行相等等性假假设检检验((样本本取自自具有有相同同平均均值的的样本本总体体)。。此方方法是是对双双平均均值检检验((如t-检验验)的的扩充充。可重复双因因素分析:对单因因素方差分分析的扩展展,即每一一组数据包包含不止一一个样本。。无重复双因因素分析:通过双因素素方差分析析(但每组组数据只包包含一个样样本),对对两个以上上样本均值值进行相等等性假设检检验(样本本取自具有有相同平均均值的样本本总体)。。此方法是是对双平均均值检验((如t-检验)的的扩充。回归分析回归分析是是一种用于于两个或两两个以上变变量之间建建立关系的的统计技术术在回归分析析里,要在在分析所感感兴趣的变变量-因变变量或相应应变量与一一个或几个个字变量或或预测变量量之间建立立关系回归分析的的目标,是是建立一个个回归模型型或一个预预测方程,,使因变量量能与那一一个或几个个自变量联联系起来。。这样回归归模型就可可以用来凭凭借这些自自变量描述述预测和控控制因变量量。包括:简单单回归模型型、多元回回归模型讨论9、静夜夜四无无邻,,荒居居旧业业贫。。。1月-231月-23Thursday,January5,202310、雨中黄黄叶树,,灯下白白头人。。。04:05:2804:05:2804:051/5/20234:05:28AM11、以我独沈久久,愧君相见见频。。1月-2304:05:2804:05Jan-2305-Jan-2312、故人人江海海别,,几度度隔山山川。。。04:05:2804:05:2804:05Thursday,January5,202313、乍见翻疑疑梦,相悲悲各问年。。。1月-231月-2304:05:2804:05:28January5,202314、他乡生白发发,旧国见青青山。。05一月20234:05:28上午04:05:281月-2315、比不了得得就不比,,得不到的的就不要。。。。一月234:05上上午1月-2304:05January5,202316、行动出出成果,,工作出出财富。。。2023/1/54:05:2804:05:2805January202317、做做前前,,能能够够环环视视四四周周;;做做时时,,你你只只能能或或者者最最好好沿沿着着以以脚脚为为起起点点的的射射线线向向前前。。。。4:05:28上上午午4:05上上午午04:05:281月月-239、没有有失败败,只只有暂暂时停停止成成功!!。1月-231月-23Thursday,January5,202310、很多事情情努力了未未必有结果果,但是不不努力却什什么改变也也没有。。。04:05:2804:05:2804:051/5/20234:05:28AM11、成功就就是日复复一日那那一点点点小小努努力的积积累。。。1月-2304:05:2804:05Jan-2305-Jan-2312、世间成成事,不不求其绝绝对圆满满,留一一份不足足,可得得无限完完美。。。04:05:2804:05:2804:05Thursday,January5,202313、不知香香积寺,,数里入入云峰。。。1月-231月-2304:05:2804:05:28January5,202314、意意志志坚坚强强的的人人能能把把世世界界放放在在手手中中像像泥泥块块一一样样任任意意揉揉捏捏。。05一一月月20234:05:28上上午午04:05:281月月-2315、楚塞塞三湘湘接,,荆门门九派派通。。。。一月234:05上上午午1月-2304:05January5,202316、少年十五二二十时,步行行夺得胡马骑骑。。2023/1/54:05:2904:05:2905January202317、空山山新雨雨后,,天气气晚来来秋。。。4:05:29上上午4:05上上午午04:05:291月-239、杨柳散散和风,,青山澹澹吾虑。。。1月-231月-23Thursday,January5,202310、阅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论