业务数据的方法(一)_第1页
业务数据的方法(一)_第2页
业务数据的方法(一)_第3页
业务数据的方法(一)_第4页
业务数据的方法(一)_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

业务数据的分析方法学员使用EXCEL的熟练程度学员对数理统计的熟悉程度议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:描述统计假设检验方差分析回归分析

利用EXCEL分析数据常用图和表:折线图,饼图,面积图,频数表和柱状图,散点图,时间序列数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE利用EXCEL分析数据

--折线图折线图:显示随时间或类别而变化的趋势线折线图类型利用EXCEL分析数据

--饼图饼图:显示每一数值相对于总数值的大小,分离饼图强调单个数值的大小饼图类型利用EXCEL分析数据

--面积图面积图:显示每一数值所占大小随时间或类别而变化的趋势线面积图图类型型利用EXCEL分析析数据据:--柱柱状图图柱状图图:比比较相相交于于类别别轴上上的数数值大大小;;堆积柱柱状图图:比比较相相交于于类别别轴上上的每每一数数值相相对于于总数数值的的大小小柱状图图类型型条形图图类型型条形图图也可可用一一种类类似的的方法法显示示数据据,仅仅仅是是将垂垂直方方向换换成水水平方方法而而已。。堆积条条形图图可以以在同同一个个条上上连续续地显显示各各种数数据,,而不不像簇簇状条条形图图那样样把条条并列列在一一起显显示数数据。。频数分分析和和直方方图频数分分布表表指,,在不不同的的类别别里发发生了了多少少次观观测值值直方图图通过过图形形的方方式表表达了了同样样信息息。直方图图的应应用举举例来自Shoes.xls利用EXCEL分析析数据据--散散点图图散点图图:比比较成成对的的数值值。散点图图类型型利用散散点图图的关关系分分析我们经经常关关心两两个变变量之之间的的关系系。一一个非非常有有用的的显示示这个个关系系的方方法是是对每每一个个观测测值都都在图图上作作一个个点,,这个个点的的坐标标代表表了两两个相相关变变量的的值。。结果果产生生的图图就是是散点点图。。通过过检查查散点点的分分布,,我们们可以以查看看两个个变量量之间间有没没有什什么关关系,,如果果有,,是什什么样样的关关系。。来自Actors.xls例5::时间序序列制制图时间序序列图图的本本质是是散点点图,,时间间序列列变量量在纵纵轴,,时间间变量量在横横轴。。同时时为了了分布布的趋趋势更更加清清晰,,这些些点通通常是是通过过线连连接在在一起起。来自Toys.xls例6::练习:分分析某某某区区近期期得业业务状状况分析指指标:总总收件件票数数,日日均均收件件票数数,日日人人均效效能要求:各指标标逐月月变化化情况况各指标标的相相关性性各分部部的票票数占占该区区总票票数的的比例例变化化数据透透视图图数据透透视图图报表表是一一种具具有图图表格格式的的交互互式数数据汇汇总报报表,,是一一个Excel功能能很强强大,,而且且易于于使用用的工工具。。这个工工具提提供了了大量量有用用的信信息,,可以以让我我们可可以从从不同同角度度切割割,就就是可可以把把数据据分成成一些些子集集。数据透透视表表的创创建与与常规规的MicrosoftExcel图图表表不同同。在在创建建数据据透视视图报报表后后,您您还可可以通通过拖拖动其其字段段和项项目来来查看看不同同层次次的明明细数数据或或重新新组织织图表表的版版式。。例7::AccountingProfessionals.xls数数据据集来自AccountingProfessionals.xls创建数数据透透视图图的步步骤选择数数据范范围确定所所要创创建表表格的的类型型确定字字段设设置选择报报表格格式选择读读取方方式数据透透视表表的优优点在在于::如果果想要要改分分析,,可以以仅仅仅将带带有阴阴影的的变量量名拖拖出透透视表表,并并用其其他变变量代代替,,你能能轻易易地在在字段段域中中增加加多个个变量量来创创建不不同的的数据据图。。创建数数据透透视图图的优优点利用EXCEL分析析数据据常用图图和表表:折线图图,饼饼图图,面面积积图,频频数表表和柱柱状图图,散点图图,时时间间序列列数据透透视图图常用简简单的的统计计命令令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE平均值平均值:是是某个变量所所有值的平平均数。如如果数据代代表了一个个大量数据据的样本,,我们就叫叫他样本均均值。如果果是对象是是整体分析析,就是整整体均值。。公式:Excel命令:=AVERAGE() ̄Σni=1χiχ=n四分位数和和百分比Excel命令:QUARTILE(salary,,1):返返回一组组数据的四四分位点PERCENTILE(salary,.05):返返回一组组数据的K百分比的的数值点最小值、最最大值Excel命令:MAX(number1,number2…):返回一组组数据的最最大值,忽忽略文本本MIN(number1,number2…):返回一组组数据的最最小值,忽忽略文本本方差描述样本数数据的离散散程度公式:Excel命令:VAR(supplied)STDEV(supplied)σ2=Σni

=1(χi

χ)2n ̄计算均值,中位数数,众数数,方差差举例RangenamesSupplier1:A4:A14

Supplier2:B4:B14来自Otis4.xls相关分析用于反映分分析变量间间的密切程程度相关系数度度量的是两两个间隔尺尺度变量之之间线性关关联关系的的程度。正的相关系系数表示一一个变量的的较大值和和另一个变变量的较大大值是联系系在一起的的。而负的的相关系数数则表示一一个变量的的较大值和和另一个变变量的较小小值之间具具有的关联联关系。相关分析举举例来自Expenses.xls相关分析举举例–用于运运动的支出出与用于文文化的支出出的关系来自Expenses.xls来自Expenses.xls相关分析举举例–收入与与用于文化化的支出的的关系相关分析举举例–相关系系数与协方方差来自Expenses.xls数据分析的的常用软件件MINITABSPSSEXCEL-XLSTAT议程利用EXCEL分析析数据常用统计软软件数据挖掘常用统计方方法:描述统计假设检验方差分析回归分析数据挖掘(DataMining)什么是DataMining?DataMining的应应用DataMining算算法包括:预测(Prediction)分类(Classification)联系(Association)回归(Regression)什么是DataMining?通过采用自自动或半自自动的手段段,从大量数据据中提取出出可信、新新颖、有效效并能被人人理解的信信息的高级级处理过程程按企业既定定业务目标标,对大量量的企业数数据进行探探索和分析析,揭示隐隐藏的、未未知的或验验证已知的的规律性,,并进一步步将其模型型化的先进进有效的方方法数据挖掘能能够帮助你你选择正确确瞄准潜在在目标,向向现有的客客户提供额额外的产品品,识别那那些准备离离开的好客客户发现最有价价值的客户户数据挖掘的的作用使组合销售售更有效率率数据挖掘的的作用留住那些最最有价值的的客户数据挖掘的的作用用更小的成成本发现欺欺诈现象数据挖掘的的作用数据挖掘应应用领域电信:流失银行:聚类类(细分)),交叉叉销售百货公司/超市:购购物篮分析析(关联联规则)保险:细分分,交叉销销售,流失失(原因分分析)信用卡:欺诈探测,,细分电子商务::网站日志分分析税务部门::偷漏税行行为探测警察机关::犯罪行为为分析医学:医疗保健议程利用EXCEL分析析数据常用统计软软件数据挖掘常用统计方方法:描述统计假设检验方差分析回归分析假设检验涉及对总体体参数数值值有关的两两个命题(假设)作作推断步骤提出待检验验的假设选择显著性性水平确定一个作作结论的判判断准则收集数据并并计算检验验统计量用决策法则则检验统计计量并得出出结论假设检验包包括:t检验和和z检验验方差分析(ANOVA)单因素方差差分析:

通过过简单的方方差分析,,对两个以以上样本平平均值进行行相等性假假设检验((样本取自自具有相同同平均值的的样本总体体)。此方方法是对双双平均值检检验(如t-检验验)的扩充充。可重复双因因素分析:对单因因素方差分分析的扩展展,即每一一组数据包包含不止一一个样本。。无重复双因因素分析:通过双因素素方差分析析(但每组组数据只包包含一个样样本),对对两个以上上样本均值值进行相等等性假设检检验(样本本取自具有有相同平均均值的样本本总体)。。此方法是是对双平均均值检验((如t-检验)的的扩充。回归分析回归分析是是一种用于于两个或两两个以上变变量之间建建立关系的的统计技术术在回归分析析里,要在在分析所感感兴趣的变变量-因变变量或相应应变量与一一个或几个个字变量或或预测变量量之间建立立关系回归分析的的目标,是是建立一个个回归模型型或一个预预测方程,,使因变量量能与那一一个或几个个自变量联联系起来。。这样回归归模型就可可以用来凭凭借这些自自变量描述述预测和控控制因变量量。包括:简单单回归模型型、多元回回归模型讨论9、静夜四无无邻,荒居居旧业贫。。。1月-231月-23Thursday,January5,202310、雨雨中中黄黄叶叶树树,,灯灯下下白白头头人人。。。。04:05:3004:05:3004:051/5/20234:05:30AM11、以我我独沈沈久,,愧君君相见见频。。。1月-2304:05:3004:05Jan-2305-Jan-2312、故人江江海别,,几度隔隔山川。。。04:05:3004:05:3004:05Thursday,January5,202313、乍见翻疑梦梦,相悲各问问年。。1月-231月-2304:05:3004:05:30January5,202314、他他乡乡生生白白发发,,旧旧国国见见青青山山。。。。05一一月月20234:05:30上上午午04:05:301月月-2315、比不不了得得就不不比,,得不不到的的就不不要。。。。一月234:05上上午午1月-2304:05January5,202316、行动出成成果,工作作出财富。。。2023/1/54:05:3004:05:3005January202317、做前,,能够环环视四周周;做时时,你只只能或者者最好沿沿着以脚脚为起点点的射线线向前。。。4:05:30上午午4:05上午午04:05:301月-239、没有失败败,只有暂暂时停止成成功!。1月-231月-23Thursday,January5,202310、很多事情情努力了未未必有结果果,但是不不努力却什什么改变也也没有。。。04:05:3004:05:3004:051/5/20234:05:30AM11、成成功功就就是是日日复复一一日日那那一一点点点点小小小小努努力力的的积积累累。。。。1月月-2304:05:3004:05Jan-2305-Jan-2312、世间间成事事,不不求其其绝对对圆满满,留留一份份不足足,可可得无无限完完美。。。04:05:3004:05:3004:05Thursday,January5,202313、不知香香积寺,,数里入入云峰。。。1月-231月-2304:05:3004:05:30January5,202314、意志坚强强的人能把把世界放在在手中像泥泥块一样任任意揉捏。。05一月月20234:05:30上上午04:05:301月-2315、楚塞三湘接接,荆门九派派通。。。一月234:05上上午1月-2304:05January5,202316、少年年十五五二十十时,,步行行夺得得胡马马骑。。。2023/1/54:05:3004:05:3005January202317、空空山山新新雨雨后后,,天天气气晚晚来来秋秋。。。。4:05:30上午午4:05上午午04:05:301月-239、杨柳柳散和和风,,青山山澹吾吾虑。。。1月-231月-23Thursday,January5,202310、阅读一切切好书如同同和过去最最杰出的人人谈话。04:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论