商务数据 分析与应用_第1页
商务数据 分析与应用_第2页
商务数据 分析与应用_第3页
商务数据 分析与应用_第4页
商务数据 分析与应用_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ContentsPage目录页—1—

第一章概述一、商务数据分析的意义二、商务数据分析的流程三、商务数据分析的原则第二章典型任务分析一、行业分析二、客户分析三、产品分析四、运营分析第三章常用分析模型一、PEST模型二、SWOT模型三、5W2H模型四、逻辑树模型ContentsPage目录页—2—

第四章常用分析方法一、静态分析指标二、动态分析方法三、统计指数四、抽样推断五、相关与回归六、决策树七、聚类分析八、神经网络第四章常用分析方法二、动态分析方法一、静态分析指标四、抽样推断三、统计指数六、决策树五、相关与回归八、神经网络七、聚类算法ContentsContentsContentsContentsContents常用分析方法第四章常用分析方法1234总量指标

相对指标

平均指标

变异指标

一、静态分析指标第四章常用分析方法总量指标单位总量是总体内所有单位数的总和。例如,全国高校总数、某企业员工总数等。标志总量指总体内各单位标志值的综合。例如,全国高校固定资产总值、某企业员工工资总额等。时期指标是说明现象在一段时间内某种标志值累计的总量指标。例如,某企业2016年全年销售总额。时点指标是说明现象在某一时刻上某种标志总量的状态指标。实务指标是根据事物的自然属性和物理属性单位计量的统计指标,例如,商品按“件”、长度按“米”计量等。价值指标是以货币作为尺度计量社会物质财务或劳动陈国的统计指标,劳动量指标是以劳动时间为计量单位的统计指标,一般用工时、人月标识。

1.单位总量和标志总量

2.时期指标和时点指标

3.实物指标、价值指标和劳动量指标(一)总量指标总量指标是反映社会经济现象在一定时间、地点和条件下的总体规模或水平的统计指标。它的表现形式为绝对数,故又称为统计绝对数。例如,一个企业的总营业额、固定资产投资总额、员工总数、产品销售总量等,都是反映现象的总量,因此,都是总量指标。总量指标按不同的标志又可以分为三种类形。第四章常用分析方法相对指标百分数是将对比基数抽象为100而计算的相对数,是相对指标中最常用的表现形式。例如,某企业商品年销售计划指标为42万元,当年实际销售额46.2万元,则计划完成率为110%。千分数是将对比基数抽象为1000而计算的相对数,例如,我国2010年人口出生率为11.9‰。百分数是将对比基数抽象为10而计算的相对数,例如,商品销售额近今年比去年增长一成,即增长1/10,10%。倍数和系数是将对比基数抽象为1而计算的相对数。当分子数值比分母数值大得多时,常用倍数表示;当分子分母数值差别不大时,常用系数表示。例如,我国2010年国内生产总值按2005年价格计算为314469亿元,是2005年国内生产总值184937亿元的1.7倍。

1.百分数和千分数2.成数3.倍数和系数(二)相对指标两个有联系统计指标的比率称为相对指标。与总量指标伴随有单位不同,相对指标在绝大多数情况下采用无名数标识。无名书是一种抽象化的数值,多用倍数或系数、成熟、百分数和千分数表示。相对指标的表现通常可分为以下三种类型。第四章常用分析方法平均指标算数平均数的基本形式是总体单位某一数量标志值之和(总体标志总量)除以总体单位数。例如,某企业2016年8月在职员工数1340人,工资总额4288000元,该企业员工的月平均工资为3200元(即4288000/1340)。算数平均数的根据计算的复杂不同,又分为简单算数平均数和加权算术平均数,在统计学中会详细介绍。调和平均数是根据各个指标的倒数计算出来的平均指标,又成倒数平均数。调和平均数也有简单调和平均数和甲醛调和平均数两种。众数是总体中出现次数最多或最普遍的标志值。再比如,了解某种商品的价格水平,不用全面等级该商品的全部成交价格,只需要用该商品成交量最多的那个价格作为代表值,就可以反映一般水平。中位数是将总体各单位的标志值按大小顺序排列,位于中间的标志值。1.算术平均数2.调和平均数3.众数和中位数(三)平均指标平均指标,是同类社会经济现象总体内各单位某一数量标志在一定时间、地点和条件下数量差异抽象化的代表性水平指标,其数值表现为平均数。平均指标可以反映现象总体的综合特征,也可以反映各变量值分布的集中趋势。平均指标经常用来进行同类现象在不同空间、不同时间条件下的对比分析,从而反映现象在不同地区之间的差异,揭示现象在不同时间之间的发展趋势。第四章常用分析方法(四)变异指标综合反映总体各单位标志值变异程度的指标。简称变异指标。它显示总体中变量数值分布的离散趋势,是说明总体特征的另一个重要指标,与平均数的作用相辅相成。变异指标的计算包括四分位差、平均差、标准差和方差。在统计学中会详细介绍,此处不展开。二、动态分析方法动态分析方法又称时间数列分析,主要用来描述和探索现象随时间发展变化的数量规律性。也就是对处于不断发展变化的社会经济现象从动态的角度进行分析的,通过本章的学习,我们就能利用各种动态分析指标和分析方法对现实经济问题进行分析。(一)动态数列的概念动态数列又称时间数列,是指将同类指标在不同时间上的数值按时间的先后顺序排列起来形成的统计数列,也称为时间数列或动态数列,是一种常见的经济数据表现形式,如表1-2所示。指标2017-8-012017-8-022017-8-032017-8-042017-8-04访客数920835603729902支付总金额814.91203.2992.4789.1821.3支付转化率5.54%6.89%4.96%9.22%8.13%平均客单价15.9819.4314.7922.3818.18表1-2某网店2017-8-01至2017-8-04运营统计数据第四章常用分析方法(二)动态数列的分类把一系列同类的平均指标数值按时间先后顺序排列而形成的动态数列,称之为平均数动态数列。它可以用来说明社会现象在不同时期的一般水平的发展变化情况。例如,表1-2中的平均客单价就是平均数动态数列。把一系列同类的总量指标按时间先后顺序排列而形成的动态数列,称之为绝对数动态数列。按照绝对数所反映的社会经济现象的不同性质,绝对数动态数列又可分为时期数列和时点数列两种。时期数列是反映一段时间内发展过程总量的绝对数数列;时点数列是反映一定时刻(瞬间)上的状态总量的绝对数动态数列。把一系列同类的相对指标数值按时间先后顺序排列而形成的动态数列,称之为相对数动态数列。它可以用来说明社会现象间相互联系的发展变化情况。例如,表1-2中的支付转化率就是相对数动态数列。1.绝对数动态数列2.相对数动态数列3.平均数动态数列第四章常用分析方法三、统计指数统计指数分析法是经济分析中广泛应用的一种方法,是人们在统计物价水平的变动中产生和发展起来的,最早可追溯到1650年英国人沃汉(R.Voughan)所编制的物价指数。(一)统计指数的作用统计指数在社会经济领域内广泛应用,这是由于统计指数具有独特的功能,能够发挥重要的作用。具体表现在以下几个方面:1.综合反映复杂社会经济总体在时间和空间方面的变动方向和变动程度。这是统计指数的最重要的作用。在社会经济现象中,大量存在着不能直接加总或不能直接对比的复杂总体,为了反映和研究它们的变动方向和变动程度,只能通过统计指数法,编制统计指数才能得到解决。2.分析和测定社会经济现象总体变动受各因素变动的影响。社会经济现象总体中包含着数量因素和质量因素,通过编制数量因素指数和质量因素指数,可以分析和测定各因素变动对总体变动的影响。3.研究平均指标指数变动及其受水平因素和结构因素变动的影响。平均指标中包含水平因素和结构因素,因此可以编制可变组成指数,不变组成指数和结构影响指数,研究平均指标的变动及其各因素变动对平均指标变动的影响。例如,我国国家统计局编制的零售物价指数和居民消费价格指数等等。第四章常用分析方法(二)统计指数的类型统计指数可以从不同角度进行分类,其中主要的分类有以下几种:1.个体指数和总指数2.数量指标指数和质量指标指数3.动态指数和静态指数4.定基指数和环比指数按研究对象范围的不同,指数可以分为个体指数、总指数和组指数。个体指数反映某种社会经济现象个别事物变动的情况。如反映某一种商品物价变动的情况。总指数则综合反映某种事物包括若干个别事物总的变动情况,如反映若干商品总的物价变动情况。统计指数按所表示的特征不同,可以分为数量指标指数和质量指标指数。数量指标指数反映现象总体的规模和水平的变动状况,如产量指数,职工人数指数等。质量指标指数则反映现象总体内涵质量的变动,如商品物价指数,劳动生产率指数等。统计指数按其本来的涵义,都是指动态指数。但在实际运用过程中,涵义渐渐推广到了静态事物和空间对比,因而产生了静态指数。所谓静态指数是指在同一时间条件下不同单位,不同地区间同一事物数量进行对比所形成的指数;或同一单位,同一地区计划指标与实际指标进行对比所形成的指数。统计指数按在指数数列中所采用的基期不同,可以分为定基指数和环比指数。定基指数指在数列中以某一固定时期的水平作对比基准的指数;环比指数则是以其前一时期的水平作为对比基准的指数。5.综合指数与平均指数按研究方法的不同,可以分为综合指数与平均指数。综合指数是将不可以直接度量的指数化指标,通过同度量因素转化为可以合计的总量指标,然后将不同时期的总量指标进行对比以综合反映现象的动态变化;平均指数则是以个体指数为基础,通过简单平均或加权平均的方法计算总指数。这两种指数既是独立的指数形式,又存在内在的联系。想一想-你知道以下统计指数吗?消费品价格指数、生活费用价格指数、生产资料价格指数、道琼斯指数、上证指数、恒生指数、行业景气指数。第四章常用分析方法四、抽样推断抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性做出具有一定可靠程度的估计判断。例如,某鞋厂对出厂产品进行抽样检测,推断整体商品的合格率。(一)抽样推断的作用1.解决无法进行全面调查的问题不能进行全面调查或很难进行全面调查,但又需要了解其全面数量情况的社会经济现象。例如,电视机使用寿命检验.罐头的防腐期限试验.轮胎的里程试验等。这些调查所使用的测试手段对产品具有破坏性。不可能进行全面调查,只能采用抽样调查。2.补充或修正全面调查的数据全面调查由于范围广工作量大、参加人员多,往往容易发生登记性误差和计算误差。如果在全面调查后,随机抽取一部分单位重新调查一次,将这些单位两次调查的资料进行对照比较,计算其差错率,并据以对全面资料加以修正,可以进一步提高全面调查资料的准确性。3.用于生产过程的质量控制在工业产品成批或大量连续生产过程中,利用抽样调查可以检验生产过程是否正常,及时提供信息,进行质量控制,保证生产质量稳定。4.假设检验对于某些总体的假设进行检验,判断其真伪,以做出正确的决策。例如,新工艺新技术的改革,是否能收到明显的效果。需要对未知或完全不知道的总体做出一些假设,然后利用抽样推断法,根据试验的材料对所作假设进行检验,做出判断。第四章常用分析方法(二)抽样推断的研究内容抽样推断的目的是借助样本信息特征,来估计和检验总体有关信息的特征,所以从目的上看,包括统计估计和假设检验。然而,只有遵循随机原则抽取样本才能客观地含有总体的信息,因此随机抽样也是一项重要的研究内容。相关内容在统计学中会详细展开。想一想-判断以下哪些做法属于抽样推断?1.根据哥哥的身高判断弟弟的身高2.根据某公司优秀员工事迹推断该公司的企业文化特点3.在啤酒生产线上每小时抽取一瓶,进行质量检查4.在互联网上进行网购消费满意度调查,以了解全体用户满意度第四章常用分析方法五、相关与回归(一)相关关系相关关系是指变量之间存在密切,但不是严格的依存关系,即当一个变量发生变化时,另外的变量也发生变化,但其变化值是不确定的,往往会出现几个不同的数值与之对应。也就是说,因变量的值不能由一个或几个自变量的值惟一确定。例如,商品的需求量和商品的价格之间存在着非常密切的关系。对一般的商品而言,如果商品的价格提高了,该种商品的需求量会下降;如果价格下降了,则该种商品的需求量会提高;但是商品需求量的变化值是不确定的。因为商品的需求量不仅受价格因素的影响,还受消费者收入,其他相关商品价格,消费者对未来的预期,以及一些不可控制的因素的影响,因此,不能根据该种商品的价格求出该种商品的需求量。在统计学上,把现象之间存在的这种不确定的关系称为相关关系。从数量上研究现象之间相关关系的理论和方法称为相关分析。相关关系如果用图形来表示,其对应点不完全落在一条理论曲线上,见图1-6。相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。图1-6相关关系分类示意图第四章常用分析方法五、相关与回归(二)回归的含义“回归”一词是由英国生物学家高尔顿(FrancisGalton)在研究人体身高的遗传问题时首先提出的。根据遗传学的观点:父母身材高的,其子女一般也较高,父母身材矮的,其子女身材也较矮。依此推论,祖祖辈辈遗传下来,身高必然向两极分化,而事实上并非如此。同样身高的父亲,其子女身高并不一致。身材很高的子女往往是由身材中等偏上的父母所生,父母身材矮的其子女一般也较矮,但平均起来并不是特别矮。FrancisGalton把这种人的身高趋向人的平均高度的现象称作“回归”。(三)回归分析“回归分析通过一个变量或一些变量的变化解释另一变量的变化。按照自变量的个数划分为一元回归和多元回归;按照回归曲线的形态划分,有线性(直线)回归和非线性(曲线)回归。实际分析时应根据客观现象的性质、特点、研究目的和任务选取回归分析的方法。回归分析的主要内容和步骤如下:首先依据经济学理论并且通过对问题的分析判断,将变量分为自变量和因变量,一般情况下,自变量表示原因,因变量表示结果;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;接着要估计模型的参数,得出样本回归方程;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验,计量经济学检验、预测检验;当所有检验通过后,就可以应用回归模型了。第四章常用分析方法六、决策树决策树是根据数据的属性采用树状结构建立决策模型,常常用来解决分类和回归问题。决策树在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。例如,银行在发放个人消费贷款时需判断偿还能力,假设针对这个问题考查的属性有三项,分别是房产、婚姻状况和月收入,利用决策树分析过程如下。图1-8决策树分析实例第四章常用分析方法六、决策树图1-8是一棵结构简单的决策树,用于预测贷款用户是否具有偿还贷款的能力。贷款用户主要具备三个属性:是否拥有房产,是否结婚,平均月收入。每一个内部节点都表示一个属性条件判断,叶子节点表示贷款用户是否具有偿还能力。例如:用户甲没有房产,没有结婚,月收入5K。通过决策树的根节点判断,用户甲符合右边分支(拥有房产为“否”);再判断是否结婚,用户甲符合左边分支(是否结婚为否);然后判断月收入是否大于4k,用户甲符合左边分支(月收入大于4K),该用户落在“可以偿还”的叶子节点上。所以预测用户甲具备偿还贷款能力。决策树常见的算法包括CART(ClassificationAndRegressionTree)、ID3、C4.5、随机森林(RandomForest),通常需要借助编程语言来实现。第四章常用分析方法七、聚类算法聚类是把各不相同的个体划分为有更多相似性的子群或者簇的工作。在聚类中,没有预定义的类和样本。记录完全依靠其自相似性被归为一类。如果簇有意义的话,结果业完全由使用者确定赋予该簇何种意义。聚类通常作为市场营销的前奏,例如,不是对“客户对哪些促销反应最好”提出一个统一的适合所有人的标准,而是首先将客户划分为簇,即划分为有相似购物习惯的人群,然后提问对每个簇哪种促销反应最好。聚类在商务数据分析中的应用实例包括客户细分、客户价值分析等。聚类算法将物理或抽象对象集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇的过程,所以同一个簇中的对象有很大的相似性,而不同簇之间的对象有很大的相异性。聚类主要解决的是在“物以类聚、人以群分”,比如以收入分群,高富帅VS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论