第三部分统计分析_第1页
第三部分统计分析_第2页
第三部分统计分析_第3页
第三部分统计分析_第4页
第三部分统计分析_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三部分统计分析第1页,课件共41页,创作于2023年2月常用统计分析软件Office

XP组件Word

Excel

PowerPoint

AccessOutlookFrontPage企业版本附:SharePointTeamServices第2页,课件共41页,创作于2023年2月Excel在统计分析中一、Excel的图表功能二、Excel的函数功能三、数据分析工具常用统计分析软件简介第3页,课件共41页,创作于2023年2月Excel的图表功能用图的形式表示统计结果,比一大堆数据简洁、直观,适合向领导汇报和向群众作宣传。合并计算功能可以让报表汇总变得轻松简单;数据透视表功能可以让数据从不同的角度得以展现。第4页,课件共41页,创作于2023年2月图形功能举例:1.利用图表向导作图:

①趋势线②饼图③柱型图2.在图形上添加曲线等附加信息。图表制作1图表制作2第5页,课件共41页,创作于2023年2月表格功能举例:1.公式复制时的相对地址与绝对地址2.报表汇总—分两种情况3.作数据透视表第6页,课件共41页,创作于2023年2月Excel的函数功能

函数是Excel工作表的核心之一,对于函数只要我们输入相应的参数,就会自动地计算出所需要的函数值。Excel提供了435个内部函数进行数学、财务、统计等计算工作。函数的基本格式为:=SUM(A1:A5,C1:C3)第7页,课件共41页,创作于2023年2月函数功能举例1.有关描述统计的函数2.次数分布表3.矩阵运算—

投入产出分析第8页,课件共41页,创作于2023年2月描述统计量描述统计量大致可以分为三类:集中趋势离中趋势分布趋势第9页,课件共41页,创作于2023年2月反映集中趋势的描述统计量常用的反映集中趋势的描述统计量有五个:算术平均数、调和平均数、几何平均数、中位数和众数。前三个平均数是根据所有标志值计算的,又被称为数值平均数,后两个平均数是根据与其所处位置有关的部分标志值计算的,又被称为位置平均数。第10页,课件共41页,创作于2023年2月算术平均数

算术平均数是数据集中趋势的最主要的统计描述量。计算算术平均数使用AVERAGE函数,格式为:AVERAGE(NUMBER1,NUMBER2,……)NUMBER可以是具体的数值,也可以是单元地址或区域名称。第11页,课件共41页,创作于2023年2月调和平均数

调和平均数(又称倒数平均数)是数值倒数算术平均值的倒数。在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,就需要有倒数平均数的形式。计算调和平均数使用HARMEAN函数,格式为:HARMEAN(NUMBER1,NUMBER2,……)第12页,课件共41页,创作于2023年2月几何平均数

几何平均数是N个数值的连乘积,再开N次方根,它是计算平均比率和平均发展速度最适宜的一种方法,因为其数学性质与现象发展的平均速度形成的客观过程相一致。计算几何平均数使用GEOMEAN函数,格式为:GEOMEAN(NUMBER1,NUMBER2,……)第13页,课件共41页,创作于2023年2月中位数

中位数是将全部数值按大小顺序排列后居于中间位置的数值。换句话说,中位数把所有的数值一分为二,有一半数值比它小,另一半数值比它大。计算中位数使用MEDIAN函数,格式为:MEDIAN(NUMBER1,NUMBER2,……)第14页,课件共41页,创作于2023年2月众数

众数是在数列或数据区域中出现频率最多的数值。计算众数使用MODE函数,格式为:MODE(NUMBER1,NUMBER2,……)第15页,课件共41页,创作于2023年2月反映离中趋势的描述统计量

常用的反映离中趋势的描述统计量(简称离中指标)有三个:全距、平均差和标准差(方差)。当对两组数据的差异程度进行相对比较时,往往要计算离散系数,包括全距系数、平均差系数和标准差系数,它等于相应的离中指标除以算术平均数,这样可以消除由于平均数的不同或单位的差异而造成的影响。第16页,课件共41页,创作于2023年2月全距

全距(又称极差)是最大值与最小值之差,用“MAX(ARRAY)—MIN(ARRAY)”求得。ARRAY是指原始资料的存放区域,并且前后应该一致。全距最显著的特点是计算简便、含义清晰,实际工作中常用于产品质量的检验和控制,但全距容易受极端值的影响。第17页,课件共41页,创作于2023年2月平均差

平均差是各个数据与其算术平均数离差绝对值的算术平均数。计算平均差使用AVEDEV函数,格式为:AVEDEV(NUMBER1,NUMBER2,……)NUMBER可以是具体的数值,也可以是单元地址或区域名称。例:AVEDEV(4,5,6,7,5,4,3)=1.020408第18页,课件共41页,创作于2023年2月标准差

标准差用于反映相对于算术平均数的离散程度。计算标准差的函数有两个,一是STDEV函数,二是STDEVP函数。两者的参数是完全一致的,只是计算的公式略有一点不同。格式为:STDEV(NUMBER1,NUMBER2,……)STDEVP(NUMBER1,NUMBER2,……)第19页,课件共41页,创作于2023年2月方差方差是标准差的平方,它也是衡量离散程度的重要指标。计算方差有两个函数,前者是计算样本方差的,后者是计算总体方差的。格式为:VAR(NUMBER1,NUMBER2,……)VARP(NUMBER1,NUMBER2,……)。第20页,课件共41页,创作于2023年2月反映分布趋势的描述统计量常用的反映分布趋势的描述统计量有两个:偏斜度峰值第21页,课件共41页,创作于2023年2月偏斜度偏斜度反映以平均值为中心的分布的不对称程度。计算偏斜度使用SKEW函数,格式为:SKEW(NUMBER1,NUMBER2,……)NUMBER可以是具体的数值,也可以是单元地址或区域名称。正偏斜度表示不对称边的分布更趋向正值。负偏斜度表示不对称边的分布更趋向负值。第22页,课件共41页,创作于2023年2月峰度峰度反映与正态分布相比某一分布的尖锐度或平坦度。计算峰度使用KURT函数,格式为:KURT(NUMBER1,NUMBER2,……)NUMBER可以是具体的数值,也可以是单元地址或区域名称。峰值正峰值表示相对尖锐的分布。负峰值表示相对平坦的分布。第23页,课件共41页,创作于2023年2月次数分布例题江浦县苗圃对110株树苗的高度进行测量(单位:厘米)数据如下,要求编制次数分布表。第24页,课件共41页,创作于2023年2月次数分布编制次数分布表的步骤:①排序并求出全距(最大值—最小值);②确定组数和组距;③确定组限;④归组并计算出各组的次数;⑤显示或打印出次数分布表。第25页,课件共41页,创作于2023年2月次数分布

最简单的次数分布表有两列:第一列是分组标志;第二列是各组的次数。较复杂的次数分布表还可以包含向上累计次数、向下累计次数、频率、累计频率。次数分布图就是根据次数分布表作出来的,洛伦兹曲线则是根据累计频率资料绘制的。第26页,课件共41页,创作于2023年2月次数分布编制次数分布表使用FREQENCY函数,格式为:=FREQUENCY(ARRAY,BINS)FREQENCY函数需要输入两项参数:ARRAY是指原始资料的存放区域,BINS是指统计分组的组上限构成的数值序列。在使用FREQENCY函数之前需要做细致分析,了解数据的性质,还要计算一些基础数据,如组数、组距和各个组限,第27页,课件共41页,创作于2023年2月次数分布特别注意

FREQUENCY函数在统计次数时,将与对应上限值一样大的数也统计在内,即若规定的上限是90,而原始资料中恰有90时,则该“90”被计入这一组,这样和“上限不包括原则”相违背,因此上限必须是一个略小于90的数。Excel所认定的分组标志只是每组的上限,为了能表达清楚,我们还需另外加一列分组标志。第28页,课件共41页,创作于2023年2月矩阵运算、投入产出分析矩阵函数一、计算行列式的值(=MDETERM)二、矩阵相乘(=MMULT)三、矩阵转置(=TRANSPOSE)四、逆矩阵(=MINVERSE)投入产出系数一、直接消耗系数二、完全消耗系数三、影响力系数和感应度系数第29页,课件共41页,创作于2023年2月数据分析工具

“数据分析”是一个外部宏(程序)模块,提供了19个数据分析的实用工具。—

绘制反映数据分布的直方图;获得各种描述统计量;进行时间数列分析和回归分析,做各种假设检验等等。第30页,课件共41页,创作于2023年2月数据分析工具

数据分析前打开“工具”菜单,查看有没有“数据分析”命令。如果没有,表明数据分析工具库尚未安装。这时需要选择菜单“工具”—“加载宏”,打开“加载宏”对话框,从其中的宏表中选定“分析工具库”和“分析工具库-VBA函数”宏。安装了数据分析工具库后,每次启动Excel时,“分析工具库”宏就被自动加载。第31页,课件共41页,创作于2023年2月数据分析举例1、描述统计分析2、假设检验3、方差分析4、回归分析

—(含:时间序列分析)第32页,课件共41页,创作于2023年2月描述统计量反映集中趋势的描述统计量:数值平均数:算术平均数、调和平均数、几何平均数位置平均数:众数、中位数反映离中趋势的描述统计量:全距、平均差、标准差反映分布趋势的描述统计量:偏斜度、峰度第33页,课件共41页,创作于2023年2月假设检验概述

假设检验是统计推断的一个重要方面。数理统计中的假设检验是先对研究总体作出某种假设,然后通过观察和试验来决定假设成立与否。第34页,课件共41页,创作于2023年2月统计假设就是关于“总体的某个声明”或“某事是真的之叙述”。·某航空公司的代表声称该公司民航客机的平均机龄不超过10年。·一位电视台的行政主管认为绝大多数的成年人不会受电视上的暴力所影响。·一位银行行长说顾客在该行排队时间不会超过3分钟。假设检验概述第35页,课件共41页,创作于2023年2月假设检验1.假设检验中的几个基本概念2.假设检验的步骤3.假设检验的方法4.例一~两独立样本的检验5.例二~两相关样本的检验第36页,课件共41页,创作于2023年2月方差分析的例子某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为桔黄色、粉色、绿色和无色透明。随机从五家超级市场上收集了前一期该种饮料的销售量。问:饮料的颜色是否对销售量产生影响。超市无色粉色桔黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8第37页,课件共41页,创作于2023年2月方差分析的原理要检验各个水平的均值是否相等,实现手段是通过方差的比较。观察值之间存在差异,其来源来自于:(1)系统性差异:是由因素中的不同水平造成的。例子中:饮料的不同颜色带来不同的销售量。该差异用水平之间的方差来表示,称为组间方差,记为MSA。(2)随机差异:是由抽选样本的随机性而产生的差异。例子中:相同颜色的饮料在不同的超市销量是不同的。该差异用水平内部的方差来表示,称为组内方差,记为MSE。第3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论