(模块四)单元一 描述性统计分析_第1页
(模块四)单元一 描述性统计分析_第2页
(模块四)单元一 描述性统计分析_第3页
(模块四)单元一 描述性统计分析_第4页
(模块四)单元一 描述性统计分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子商务数据分析基础模块四数据描述性分析CONTENT目录单元一描述性统计分析单元二趋势分析单元三对比分析单元四其他分析方法学习目标知识目标技能目标素养目标熟悉描述性统计量的类型和指标含义熟悉图表趋势预测法和时间序列预测法熟悉对比分析法的概念和方法了解频数分析法、分组分析法、结构分析法、平均分析法、交叉分析法和漏斗图分析法能够利用Excel进行数据描述性统计分析能够利用图表趋势预测法和时间序列预测法对电子商务日常运营数据进行趋势分析能够使用同比分析法和环比分析法对本期和同期、本期和上期的数据进行分析能够运用频数分析法、分组分析法、结构分析法、平均分析法、交叉分析法和漏斗图分析法对电子商务数据进行分析具备尊重公民隐私的意识,不侵犯公民合法权益具备实事求是的工作态度,客观反馈数据分析结果具备科学、严谨的职业素养,在数据描述性分析过程中,做到一丝不苟、精益求精具备遵守《国务院反垄断委员会关于平台经济领域的反垄断指南》《中华人民共和国个人信息保护法》《互联网信息服务算法推荐管理规定》等相关法律法规的职业操守知识导图单元一描述性统计分析引导案例对数据进行统计描述是统计分析中最基本的工作,对于整理好的数据,通过描述性统计分析,可以挖掘出很多统计量的特征。以某家航空公司的网上售票处理时长分析为例,有顾客反映其售票处理的速度太慢,为此,航空公司收集了100位顾客购票所花费时间的样本数据如表,描述性统计分析结果如表所示。引导案例航空公司基于以上数据样本,分析得出结论:为一位顾客处理一次售票业务所需的时间设置在5分钟之内是合理的。结合案例,思考并回答以下问题:(1)上面的数据是否支持航空公司“为一位顾客处理一次售票业务所需的时间设置在5分钟以内是合理的”这一说法?(2)使用哪个平均指标来分析上述问题比较合理?为什么?单元一描述性统计分析一、认识描述性统计量描述变量集中趋势的统计量描述变量离散程度的统计量描述变量分布情况的统计量单元一描述性统计分析描述变量集中趋势的统计量平均值(Mean)表示变量值的平均水平,包括算术平均值、加权算术平均值、调和平均值和几何平均值。中位数(Median)是指将各变量值按大小排序后,处于序列中间位置的那个变量值。当变量个数为偶数时,中位数是位于中间位置的两个变量的算术平均值。众数(Mode)一组数据中出现频率最高的数据值。众数只有在总体数据量较多而又有明确的集中趋势的数据中才有意义。和(Sum)某变量的所有变量值之和。单元一描述性统计分析描述变量离散程度的统计量标准差(StandardDeviation)描述变量关于均值的偏离程度方差(Variance)标准差的平方,是各个观测值与其均值离差平方的均值最大值(Maximum)某变量所有取值的最大值单元一描述性统计分析最小值(Minimum)某变量所有取值的最小值极差(Range)又称区域、全距,用R表示,是某变量极大值与极小值之差均值标准误差(StandardErrorofMean)均值的标准误差,是反映抽样误差大小的统计指标,是统计推算可靠性的指标单元一描述性统计分析描述变量分布情况的统计量偏度衡量的是样本分布的偏斜方向和程度峰度衡量的是样本分布曲线的尖峰程度如果样本的偏度接近于0,而峰度接近于0,就可以判断总体的分布接近于正态分布。偏度(Skewness)描述变量分布的对称程度和方向。偏度为0表示对称,大于0表示右偏,小于0表示左偏峰度(Kurtosis)描述变量分布的陡峭程度。峰度为0表示陡峭程度和正态分布相同,大于0表示比正态分布陡峭,小于0表示比正态分布平缓。单元一描述性统计分析知识链接偏度是以正态分布为标准来描述数据对称性的指标。偏度=0,就是正态分布;如果频数分布的高峰向左偏移(偏度>0),长尾向右侧延伸,则称为正偏态分布;同样,如果频数分布的高峰向右偏移(偏度<0),长尾向左侧延伸,则称为负偏态分布。偏度分布示意见图4-1。峰度是相对于正态分布而言的,是描述对称分布曲线峰顶尖峭程度的指标。峰度>0,表示两侧极端数据较少,比正态分布更高更窄,呈尖峭峰分布;峰度<0,表示两侧极端数据较多,比正态分布更低更宽,呈平阔峰分布。峰度分布示意见图4-2。单元一描述性统计分析知识链接图4-1偏度分布示意图图4-2峰度分布示意图单元一描述性统计分析二、数据的描述性统计分析在Excel中添加“数据分析”加载项打开Excel,单击“文件”选项卡,进入“文件”功能区,单击“选项”按钮,在弹出的Excel选项框中点击“加载项”按钮,在“加载项”对话框里找到“管理”功能区,单击其下拉列表,选择“Excel加载项”,并单击“转到”按钮,即可弹出“加载宏”对话框。1单元一描述性统计分析在“加载宏”对话框中选中“分析工具库”、“分析工具库-VBA”(分析工具库的编程加载项)复选框,点击“确定”按钮,即可完成“数据分析”加载项的添加。在Excel的“数据”菜单的右上角即出现了“数据分析”功能项。2单元一描述性统计分析实训专区4-1请在Excel中完成“数据分析”加载项的添加。单元一描述性统计分析利用Excel进行数据的描述性统计分析案例单元一描述性统计分析打开“活动访问数据.xlsx”文件,选择“数据”选项卡,单击“数据分析”按钮。在弹出的“数据分析”对话框中选中“描述统计”分析工具,单击“确定”按钮,便弹出了“描述统计”对话框。1单元一描述性统计分析在“描述统计”对话框中完成各类参数的设置。2输入输入区域:选择需要分析的数据源区域,可选多行或多列,可以采用鼠标进行框选,也可以用键盘进行输入。输入时需要带上绝对引用符号“$”,如本例中数据源区域为$B$1:$B$21分组方式:选择分组方式,如果需要指出【输入区域】中的数据是按行还是按列分组,则选择“逐行”或“逐列”,如本例中选择“逐列”。标志位于第一行:若数据源区域第一行含有标志(字段名、变量名),则应勾选,否则,Excel字段将以“列1、列2、列3……”作为列标志,本例勾选“标志位于第一行”。单元一描述性统计分析输出选项输出区域:可选当前工作表的某个活动单元格、新工作表组或新工作簿,本例将结果输出至当前工作表的D2单元格;汇总统计:包括有平均值、标准误差(相对于平均值)、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数等相关指标,本例勾选“汇总统计”复选框。平均数置信度:置信度也称为可靠度或置信水平、置信系数,是指总体参数值落在样本统计值某一区内的概率,常用的置信度为95%或90%,本例勾选此复选框,并输入“95%”,可用来计算在显著性水平为5%时的平均值置信度。第K大(小)值:表示输入数据组的第几位最大(小)值。本例勾选此复选框,并输入“1”,结果出现最大值和最小值。单元一描述性统计分析完成“描述统计”的设置后,单击“确定”按钮,描述统计结果就会在设定的输出区域展示。本案例中输出区域选择在本表展示,展示结果如图。3可以看到,该电商平台这一时间段内访问量的大体情况是:由于“双11”的到来,随着平台各种推广活动的开展,访客量在“双11”前呈增长趋势,且在“双11”当天达到最高。随着活动结束,店铺的访客量有所下降,但是整体来看,本次活动让店铺访客量的平均水平得到了提高。单元一描述性统计分析实训专区4-2调取源数据4-1,完成店铺7月14日到8月12日期间访客量、浏览量两列数值的描述性统计分析。单元一描述性统计分析1+X考证提要本单元需重点理解与掌握的内容(1)描述变量集中趋势的统计量:平均值、中位数、众数、和等。(2)描述变量离散程度的统计量:标准差、方差、最大值、最小值、极差、均值标准误差等。(3)描述变量分布情况的统计量:偏度、峰度。(4)在Excel中添加“数据分析”加载项的操作步骤:文件—选项—加载项—加载宏。(5)利用Excel进行数据的描述性统计分析的操作步骤:打开“数据分析”窗口一选择“描述统计”按钮—完成参数设置—分析描述统计结果。(6)根据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论