Excel数据整理与分析之描述统计介绍课件_第1页
Excel数据整理与分析之描述统计介绍课件_第2页
Excel数据整理与分析之描述统计介绍课件_第3页
Excel数据整理与分析之描述统计介绍课件_第4页
Excel数据整理与分析之描述统计介绍课件_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Excel数据整理与分析之描述统计介绍课件汇报人:AA2024-01-252023AAREPORTING描述统计基本概念与意义数据收集与整理方法数值型数据描述统计指标类别型数据描述统计指标图表展示技巧在描述统计中应用案例实战:Excel在描述统计中应用目录CATALOGUE2023PART01描述统计基本概念与意义2023REPORTING描述统计定义描述统计是研究数据搜集、整理和描述的统计学方法,其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出表示数据特征的统计指标。描述统计作用描述统计在数据分析中发挥着重要作用,它可以帮助我们了解数据的基本情况,发现数据中的规律和趋势,为后续的推断统计和决策分析提供基础。描述统计定义及作用

数据类型与特点定量数据定量数据是数值型数据,如身高、体重等,具有可加性、可比性和可测量性。定量数据可以进行各种数学运算和统计分析。定性数据定性数据是描述性的、非数值型的数据,如性别、职业等。定性数据通常通过分类、编码和汇总等方式进行处理和分析。时间序列数据时间序列数据是按时间顺序排列的数据,如股票价格、气温变化等。时间序列数据具有趋势性、周期性和随机性等特点。了解数据分布01通过描述统计方法,可以了解数据的分布情况,如数据的集中趋势、离散程度和偏态等。这有助于我们更好地把握数据的整体特征。发现数据规律02描述统计可以帮助我们发现数据中的规律和趋势,如通过绘制折线图或散点图来观察数据的变化趋势。这有助于我们预测未来的数据走向。为推断统计提供基础03描述统计是推断统计的基础,通过描述统计方法可以对数据进行初步的处理和分析,为后续的假设检验、回归分析等推断统计方法提供必要的数据支持。描述统计在数据分析中重要性PART02数据收集与整理方法2023REPORTING通过调查问卷、实验、观察等方式直接获取原始数据。原始数据收集二手数据收集网络爬虫技术从公开数据库、研究报告、政府统计资料等获取已有数据。运用网络爬虫工具自动抓取网页上的结构化数据。030201数据来源及收集途径对缺失数据进行填充、插值或删除等操作。缺失值处理识别并处理数据中的异常值,如离群点、错误数据等。异常值处理将数据类型转换为适合分析的形式,如文本转数值、日期格式转换等。数据类型转换数据清洗与预处理技巧将数据按比例缩放,使之落入一个小的特定区间,如[0,1]或[-1,1]。数据归一化将数据转换为均值为0,标准差为1的标准正态分布。数据标准化将连续型数据转换为离散型数据,如通过分箱、分段等方式。数据离散化数据转换和标准化操作PART03数值型数据描述统计指标2023REPORTING中位数将数值型数据按大小顺序排列,位于中间位置的数。适用于数值型数据,反映数据的中心趋势。均值所有数值的和除以数值的个数。适用于数值型数据,反映数据的平均水平。众数出现次数最多的数。适用于离散型数据,反映数据的集中趋势。均值、中位数和众数计算方法及应用场景应用场景均值常用于表示一组数据的“平均”水平,如平均工资、平均成绩等。中位数用于表示一组数据的“中等”水平,特别适用于存在极端值的数据集。众数用于表示一组数据中出现次数最多的数,常用于市场调研和统计分析中。01020304均值、中位数和众数计算方法及应用场景01方差各数值与均值之差的平方的平均数。反映数据的离散程度。02标准差方差的算术平方根。反映数据的波动大小。03变异系数标准差与均值之比。消除单位和平均数不同对离散程度比较的影响。04方差S^2=∑(Xi-μ)^2/n,其中Xi为各数值,μ为均值,n为数值个数。05标准差S=√S^2,即方差的算术平方根。06变异系数CV=S/μ,即标准差与均值之比。方差、标准差和变异系数含义及计算方法偏态系数:描述数据分布形态的偏斜程度及方向。正偏态表示数据右偏,负偏态表示数据左偏。峰态系数:描述数据分布形态的尖峭程度。峰态系数大于0表示数据分布比正态分布更尖峭,小于0则表示更扁平。在数据分析中应用偏态系数可用于判断数据是否服从正态分布,以及分布的偏斜程度和方向。对于非正态分布的数据,可根据偏态系数进行相应的变换处理,使其接近正态分布。峰态系数可用于判断数据分布的尖峭程度,以及是否存在异常值或极端值。对于峰态系数较大的数据分布,应注意异常值或极端值对分析结果的影响。0102030405偏态和峰态系数在数据分析中应用PART04类别型数据描述统计指标2023REPORTING根据数据的分布规律,选择合适的组数,以充分展示数据的分布情况。确定组数根据数据的波动范围和组数,计算合适的组距,使得数据能够均匀分布在各个组内。确定组距频数分布表制作方法及注意事项根据组距确定各组上下限,注意上限不在内原则。统计各组内的数据个数,得到频数分布表。频数分布表制作方法及注意事项登记频数划分组限注意事项组距选择应合适,过大可能导致信息损失,过小可能增加数据分布的波动性。组数选择不宜过多或过少,以免损失信息或导致数据分布的偏态。组限划分要合理,避免数据过于集中或过于分散。频数分布表制作方法及注意事项交叉表在类别型数据间关系揭示中作用交叉表定义交叉表是一种用于展示两个或多个类别变量之间关系的表格,通过计算不同类别组合下的频数或频率,揭示变量之间的关系。揭示类别变量间关系通过交叉表可以清晰地看出不同类别变量之间的组合情况,进而分析它们之间的关系。判断变量独立性通过比较实际观测频数与期望频数的差异,可以判断两个类别变量是否独立。辅助卡方检验交叉表可以为卡方检验提供必要的数据基础,用于进一步分析类别变量间关系的显著性。卡方检验定义卡方检验是一种用于检验两个或多个类别变量间关系显著性的统计方法,通过比较实际观测频数与期望频数的差异,判断变量间是否存在显著差异。确定自由度根据交叉表的行列数确定自由度。建立假设提出原假设和备择假设,原假设通常为两个类别变量相互独立。查找临界值根据卡方分布表和显著性水平查找临界值。计算卡方值根据实际观测频数和期望频数计算卡方值。比较并作出结论将计算得到的卡方值与临界值进行比较,如果卡方值大于临界值,则拒绝原假设,认为两个类别变量间存在显著差异。卡方检验在类别型数据差异显著性判断中应用PART05图表展示技巧在描述统计中应用2023REPORTING柱状图折线图饼图散点图常见图表类型及其适用场景01020304适用于展示不同类别数据之间的数量对比,如销售额、人口数量等。适用于展示时间序列数据,反映数据随时间变化的趋势,如股票价格、温度变化等。适用于展示数据的占比关系,如市场份额、人口比例等。适用于展示两个变量之间的关系,如身高与体重、广告投入与销售额等。简洁明了、突出重点、避免误导、注重色彩搭配和字体选择。设计原则使用图表样式和主题、添加数据标签和说明、调整图表大小和布局、使用高质量的图像和图标。美观性提升方法图表设计原则与美观性提升方法使用Excel的数据透视表功能,轻松创建交互式动态图表。结合使用Excel的VBA宏编程,实现更复杂的动态图表效果,如自动筛选、动态排序等。利用Excel的条件格式功能,实现数据变化时图表自动更新颜色或形状。将Excel图表嵌入到PPT或Word中,实现数据与图表的实时更新和交互。动态图表制作技巧分享PART06案例实战:Excel在描述统计中应用2023REPORTING案例背景某电商公司需要对其销售数据进行描述性统计分析,以了解销售情况、客户行为和市场趋势。数据准备从公司数据库中导出所需数据,包括订单数据、客户数据、产品数据等,并进行清洗和整理,确保数据质量和准确性。案例背景介绍及数据准备工作03数据可视化呈现通过图表、图形等方式将数据可视化呈现,以便更直观地了解数据分布和特征。01数据导入与整理将清洗后的数据导入Excel,创建数据透视表或使用其他功能进行数据整理,以便于后续分析。02描述性统计指标计算利用Excel内置函数或数据分析工具包,计算各项描述性统计指标,如均值、中位数、众数、方差、标准差等。利用Excel进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论