整理EXCEL数据分析_第1页
整理EXCEL数据分析_第2页
整理EXCEL数据分析_第3页
整理EXCEL数据分析_第4页
整理EXCEL数据分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档需要开发复杂的统计或工程分析时,可以使用分析工具库节省步骤和时间。只需为每一个分析工具提供数据和参数,该工具就会使用适当的统计或工程宏函数计算相应的结果并将它们 显示在输出表格中。其中有些工具在生成输出表格时还能同时生成图表。分析工具库包括下面介绍的工具。要访问这些工具,请单击 数据”选项卡上 分析”组中的 数据分析”。如果没有显示 数据分析”命令,则需要加载 分析工具库”加载宏程序。依次单击 文件”选项卡、 选项”和 加载项”类别。 在 管理”框中,选择“Excel加载宏”, 再单击 转到”。在可用加载宏”框中选中 分析工具库”复选框,然后单击 确定”。提示 如果可用加载宏”框中没有

2、分析工具库”,则单击 浏览”进行查找。如果出现一条消息,指出您的计算机上当前没有安装分析工具库,请单击是”进行安装。注释 要包含用于分析工具库的Visual Basic for Applicati on (VBA)函数,您可以按照与加载分析工具库相同的方法加载分析工具库-VBA函数”加载宏。在可用加载宏”框中选中 分析工具库-VBA 函数”复选框。有关每种工具的描述,请单击下面列表中的工具名称。方差分析工具提供了不同类型的方差分析。具体应使用哪一种工具需根据因素的个数以及待检验样本总体中所含样本的个数而定。方差分析:单因素此工具可对两个或更多样本的数据执行简单的方差分析。此分析可提供一种假设测

3、试,即每个样本都取自相同的基础概率分布,而不是对所有样本来说基础概率分布各不相同的其他假设。如果只有两个样本,则可使用工作表函数TTEST。如果有两个以上的样本,则没有合适的TTEST 归纳可用,而是调用 单因素方差分析”模型。方差分析:包含重复的双因素此分析工具可用于当数据可沿着两个不同的维度分类时的情况。例如,在测量植物高度的实验中,可能对植物施用了不同品牌的化肥(例如 A、B和C),并且植物也可能处于不同 温度的环境中(例如高和低)。对于这 6对可能的组合化肥,温度,我们有相同数量 的植物高度观察值。使用此方差分析工具,我们可检验:施用不同品牌化肥的植物的高度是否取自相同的基础样本总体。

4、此分析忽略温度。处于不同温度级别环境中的植物的高度是否取自相同的基础样本总体。此分析忽略所使用的化肥品rF.rrt牌。无论是否考虑在第1个项目符号项中发现的不同品牌化肥之间的差异的影响以及在第2个项目符号项中发现的不同温度之间差异的影响,代表所有化肥,温度值对的6个样本都取自相同的样本总体。另一种假设是除了基于化肥或温度单个因素的差异带来的影响之 外,特定的化肥,温度值对也会有影响。如BE:戲方差分析:无重复的双因素此分析工具可用于当数据像包含重复的双因素那样按照两个不同的维度进行分类时的情况。但是,对于此工具,假设每一对值只有一个观察值(例如,在上面的示例中的每个化肥,温度值对)。CORRE

5、L 和PEARSON 工作表函数均可计算两个测量值变量之间的相关系数,条件是 每种变量的测量值都是对N个对象进行观测所得到的。(丢失任何对象的任何观测值都会导致在分析中忽略该对象。)相关系数分析工具特别适合于当N个对象中的每个对象都有两个以上的测量值变量的情况。它提供一张输出表 (关联矩阵),其中显示了应用于每个可能的测量值变量对的 CORREL (或PEARSON )的值。与协方差一样,相关系数是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值与这两个测量值变量的表示单位无关。(例如, 如果两个测量值变量为重量和高度,当重量单位从磅换算成千克时,

6、相关系数的值并不改 变。)任何相关系数的值都必须介于-1和+1之间(包括-1和+1 )。可以使用相关系数分析工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者 一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量的值趋向于互不关联(相关系数近似于零)。当您对一组个体进行观测而获得了N个不同的测量值变量时,相关”和协方差”工具可以同时在相同设置中使用。相关”和 协方差”工具都会提供一张输出表(矩阵),其中分别显示每对测量值变量之间的相关系数或协方差。不同之处在于相关系数的取值在-1和

7、+1之间(包括-1和+1),而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。协方差”工具为每对测量值变量计算工作表函数COVAR 的值。(当只有两个测量值变量,即N=2 时,可直接使用 COVAR,而不要使用 协方差”工具。)在 协方差”工具的输出 表中的第i行、第i列的对角线上的输入值是第i个测量值变量与其自身的协方差;这正好是用工作表函数 VARP计算得出的变量的总体方差。可以使用 协方差"工具来检验每对测量值变量, 以便确定两个测量值变量是否趋向于同时变 动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否

8、趋向于与另一个变量的较大值相关联(负相关);或者两个变量中的值趋向于互不关联(协方差近似于零)。描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表,提供有关数据趋中性和易变性的信息。指数平滑”分析工具基于前期预测值导出相应的新预测值,并修正前期预测值的误差。此工具将使用平滑常数 a,其大小决定了本次预测对前期预测误差的修正程度。注释 介于0.2到0.3的值是合理的平滑常数。 这些值表明应将当前预测调整20% 到30% 以修正前期预测误差。常数越大响应越快,但是预测变得不稳定。常数较小将导致预 测值的滞后。“F检验双样本方差”分析工具通过双样本F-检验对两个样本总体的方差进行比较。例

9、如,您可在一次游泳比赛中对每两个队的时间样本使用F-检验工具。该工具提供空值假设的检验结果,该假设的内容是:这两个样本来自具有相同方差的分布,而不是方差在基础分布中不相等。该工具计算 F-统计(或F-比值)的F值。F值接近于1说明基础总体方差是相等的。在输出表中,如果 F<1 ,则当总体方差相等且根据所选择的显著水平“F单尾临界值”返回小于1的临界值时,“P(F <= f) 单尾”返回F-统计的观察值小于 F的概率Alpha。如果F > 1 ,则当总体方差相等且根据所选择的显著水平,“F单尾临界值”返回大于1的临界值时,“P(F <= f) 单尾”返回F-统计的观察值大

10、于 F的概率 Alpha。傅立叶分析”分析工具可以解决线性系统问题,并能通过快速傅立叶变换(FFT)进行数据变换来分析周期性的数据。此工具也支持逆变换,即通过对变换后的数据的逆变换返回初始数据。1幅豳1II n1rm 錘L1J:-I11J:i3:11 ; 1.707106 766-1.70 71067ft ft i !11I,fjj i ft mrcin1 B Ha ua B ! II l |卜V.;1J1直方图”分析工具可计算数据单元格区域和数据接收区间的单个和累积频率。此工具可用于统计数据集中某个数值出现的次数。例如,在一个有 20名学生的班里,可按字母评分的分类来确定成绩的分布情况。直方

11、图 表可给出字母评分的边界,以及在最低边界和当前边界之间分数出现的次数。出现频率最多的分数即为数据集中的众数。N为进行移动平均计算的过去期间的个数 Aj为期间j的实际值Fj为期间j的预测值随机数发生器”分析工具可用几个分布之一产生的独立随机数来填充某个区域。 可以通过概 率分布来表示总体中的主体特征。 例如,可以使用正态分布来表示人体身高的总体特征, 或 者使用双值输出的伯努利分布来表示掷币实验结果的总体特征。排位与百分比排位”分析工具可以产生一个数据表,其中包含数据集中各个值的顺序排位和 百分比排位。该工具用来分析数据集中各值之间的相对位置关系。该工具使用工作表函数RANK 和PERCENT

12、RANK 。RANK 不考虑重复值。如果希望考虑重复值,请在使用 工作表函数 RANK 的同时,使用帮助文件中所建议的函数RANK 的修正因素。回归”分析工具通过对一组观察值使用最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量的值影响的。例如,观察某个运动员的运动成绩与一系列统计因素(如年龄、身高和体重等)的关系。可以基于一组已知的成绩统计 数据,确定这三个因素分别在运动成绩测试中所占的比重,然后使用该结果对尚未进行过测试的运动员的表现进行预测。回归”工具使用工作表函数 LINEST抽样”分析工具以数据源区域为总体,从而为其创建一个样本。当总体太大而不

13、能进行处理 或绘制时,可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的,还可以仅对一个周期中特定时间段中的数值进行采样。例如,如果数据源区域包含季度销售量数据,则以四为周期进行采样,将在输出区域中生成与数据源区域中相同季度的数值。双样本t-检验”分析工具基于每个样本检验样本总体平均值是否相等。这三个工具分别使用不同的假设:样本总体方差相等; 样本总体方差不相等; 两个样本代表处理前后同一对象 上的观察值。对于以下所有三个工具,t-统计值t被计算并在输出表中显示为“t Stat。数据决定了 t是负值还是非负值。假设基于相等的基础总体平均值,如果t < 0,则“ P(T <

14、;= t) 单尾”返回t-统计的观察值比 t更趋向负值的概率。如果 t >=0 ,贝U “P(T <= t) 单尾”返回t- 统计的观察值比t更趋向正值的概率。“t单尾临界值”返回截止值,这样,t-统计的观察值将大于或等于 “t单尾临界值”的概率就为 Alpha。“ P(T <= t)双尾”返回将被观察的t-统计的绝对值大于 t的概率。“ P双尾临界值”返回截 止值,这样,被观察的t-统计的绝对值大于 “P双尾临界值”的概率就为 Alpha 。t-检验:成对双样本平均值当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进行了两次检验),可以使用此成对检验。此分析工具

15、及其公式可以进行成对双样本学生t-检验,以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。此t-检验窗体并未假设两个总体的方差是相等的。注释由此工具生成的结果中包含有合并方差,亦即数据相对于平均值的离散值的累积测t-检验:双样本等方差假设本分析工具可进行双样本学生 t-检验。此t-检验窗体假设两个数据集取自具有相同方差的 分布,故也称作同方差 t-检验。可以使用此 t-检验来确定两个样本是否来自具有相同总体 平均值的分布。t-检验:双样本异方差假设本分析工具可进行双样本学生t-检验。此t-检验窗体假设两个数据集取自具有不同方差的分布,故也称作异方差t-检验。如同上面的 等方差”情况,

16、可以使用此 t-检验来确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。当对于每个对象具有唯一一组对象以及代表每个对象在处理前后的测量值的两个样本 时,应使用下面的示例中所描述的成对检验。用于确定统计值 t的公式如下:下面的公式可用于计算自由度df。因为计算结果一般不是整数,所以将 df的值舍入为最接近的整数,以便从t表中获得临界值。因为有可能为TTEST计算出一个带有非整数df的值,所以Excel工作表函数 TTEST 使用计算出的、未进行舍入的 df值。鉴于这些决 定自由度的不同方式,TTEST 函数的结果将与此 t-检验工具的结果在异方差”情况下

17、有所不同。检验:双样本平均值”分析工具可对具有已知方差的平均值进行双样本z-检验。此工具用于检验两个总体平均值之间不存在差异的空值假设,而不是单方或双方的其他假设。如果方差未知,则应使用工作表函数ZTEST。当使用检验”工具时,应该仔细理解输出。当总体平均值之间没有差异时,“P(Z <= z)单尾”是P(Z >= ABS(z),即与z观察值沿着相同的方向远离0的z值的概率。当总体平均值之间没有差异时,“P(Z <= z) 双尾”是P(Z >= ABS(z)或Z <= -ABS(z),即沿着任何方向(而非与观察到的z值的方向一致)远离 0的z值的概率。双尾结果只是单

18、尾结果乘以 2。z-检验工具还可用于当两个总体平均值之间的差异具有特定非零值的空 值假设的情况。例如,可以使用此检验确定两个汽车模型的性能差异。注意该数据分析功能一次只能应用于一张工作表。如果对组合的工作表进行数据分析,计算结果只会显示在第一张工作表上,其余工作表上将显示带格式的空白表格。若要对其余工作表进行数据分析,分别在每张工作表上运行一次分析工具即可。方差分析方差分析工具提供了几种方差分析工具。具体使用哪一种工具则根据因素的个数以及待检验样本总体中所含样本的个数而定。方差分析:单因素此工具可对两个或更多样本的数据执行简单的方差分析。此分析可提供一种假设测试,该假设的内容是:每个样本都取自

19、相同基础概率分布, 而不是对所有样本来 说基础概率分布都不相同。如果只有两个样本,则工作表函数TTEST可被平等使用。如果有两个以上样本,则没有合适的 TTEST归纳和 单因素方差分析”模型可被调用。方差分析:包含重复的双因素 此分析工具可用于当数据按照二维进行分类时的情况。例如,在测量植物高度的实验中,植物可能使用不同品牌的化肥(例如A、B和C),并且也可能放在不同温度的环境中(例如高和低)。对于这 6对可能的组合化肥,温度,我们有 相同数量的植物高度观察值。使用此方差分析工具,我们可检验:使用不同品牌化肥的植物的高度是否取自相同的基础总体;在此分析中,温度可以被忽略。不同温度下的植物的高度

20、是否取自相同的基础总体;在此分析中,化肥可以被忽略。是否考虑到在第 1步中发现的不同品牌化肥之间的差异以及第2步中不同温度之间差异的影响,代表所有 化肥,温度值的6个样本取自相同的样本总体。另一种假设是仅基 于化肥或温度来说,这些差异会对特定的化肥,温度值有影响。方差分析:无重复的双因素此分析工具可用于当数据按照二维进行分类且包含重复的双因素的情况。但是,对于此工具,假设每一对值只有一个观察值(例如,在上面的示例中的 化肥,温度值)。使用此工具我们可以应用方差分析的第1和2步检验:包含重复的双因素情况,但没有足够的数据应用第3步的数据。相关系数CORREL和PEARSON 工作表函数可计算两组

21、不同测量值变量之间的相关系数,条件是 当每种变量的测量值都是对N个对象进行观测所得到的。(任何对象的任何丢失的观测值都会引起在分析中忽略该对象。)系数分析工具特别适合于当N个对象中的每个对象都有多于两个测量值变量的情况。它可提供输出表和相关矩阵,并显示应用于每种可能的测量值 变量对的CORREL (或PEARSON )值。与协方差一样,相关系数是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值独立于这两种测量值变量的表示单位。(例如, 如果两个测量值变量为重量和高度,如果重量单位从磅换算成千克,则相关系数的值不改 变)。任何相关系数的值必须介于-1

22、和+1之间。可以使用相关分析工具来检验每对测量值变量,以便确定两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零)。协方差相关”和协方差”工具可在相同设置下使用,当您对一组个体进行观测而获得了N个不同的测量值变量。相关”和协方差”工具都可返回一个输出表和一个矩阵,分别表示每对测量 值变量之间的相关系数和协方差。不同之处在于相关系数的取值在-1和+1之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。协方差”工具为每对测

23、量值变量计算工作表函数COVAR的值。(当只有两个测量值变量,即N=2时,可直接使用函数 COVAR,而不是协方差工具) 在协方差工具的输出表中的第 i行、第j列的对角线上的输入值就是第i个测量值变量与其自身的协方差;这就是用工作表函数VARP计算得出的变量的总体方差。可以使用协方差工具来检验每对测量值变量,以便确定两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(协方差近似于 零)。描述统计描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表,提供有关

24、数据趋中性和易变性的信息。指数平滑指数平滑”分析工具基于前期预测值导出相应的新预测值,并修正前期预测值的误差。此工具将使用平滑常数 a,其大小决定了本次预测对前期预测误差的修正程度。注释0.2到0.3之间的数值可作为合理的平滑常数。这些数值表明本次预测应将前期预测值的误差调整 20%到30%。大一些的常数导致快一些的响应但会生成不可靠的预测。小 一些的常数会导致预测值长期的延迟。F-检验双样本方差“F佥验双样本方差”分析工具通过双样本 F-检验,对两个样本总体的方差进行比较。例如,您可在一次游泳比赛中对每两个队的时间样本使用F-检验工具。该工具提供空值假设的检验结果,该假设的内容是:这两个样本

25、来自具有相同方差的分布,而不是方差在基础分布中不相等。该工具计算 F-统计(或F-比值)的F值。F值接近于1说明基础总体方差是相等的。在输出表中,如果 F < 1,则当总体方差相等且根据所选择的显著水平“F单尾临界值”返回小于1的临界值时,“P(F <= f)单尾”返回F-统计的观察值小于 F的概率Alpha。如果 F > 1,则当总体方差相等且根据所选择的显著水平,“F单尾临界值”返回大于1的临界值时,“P(F <= f)单尾”返回F-统计的观察值大于 F的概率 Alpha。傅立叶分析傅立叶分析”分析工具可以解决线性系统问题,并能通过快速傅立叶变换(FFT)进行数据变

26、换来分析周期性的数据。此工具也支持逆变换,即通过对变换后的数据的逆变换返回初始数据。直方图直方图”分析工具可计算数据单元格区域和数据接收区间的单个和累积频率。此工具可用于统计数据集中某个数值出现的次数。例如,在一个有 20名学生的班里,可按字母评分的分类来确定成绩的分布情况。直方图 表可给出字母评分的边界,以及在最低边界和当前边界之间分数出现的次数。出现频率最多的分数即为数据集中的众数。移动平均移动平均”分析工具可以基于特定的过去某段时期中变量的平均值,对未来值进行预测。移动平均值提供了由所有历史数据的简单的平均值所代表的趋势信息。使用此工具可以预测销售量、库存或其他趋势。预测值的计算公式如下

27、:式中:N为进行移动平均计算的过去期间的个数Aj为期间j的实际值Fj为期间j的预测值随机数发生器随机数发生器”分析工具可用几个分布中的一个产生的独立随机数来填充某个区域。可以通过概率分布来表示总体中的主体特征。例如,可以使用正态分布来表示人体身高的总体特征,或者使用双值输出的伯努利分布来表示掷币实验结果的总体特征。排位与百分比排位排位与百分比排位”分析工具可以产生一个数据表,在其中包含数据集中各个数值的顺序排位和百分比排位。该工具用来分析数据集中各数值间的相对位置关系。该工具使用工作表函数RANK和PERCENTRANK 。RANK不考虑重复值。如果希望考虑重复值,请在使用 工作表函数 RAN

28、K的同时,使用帮助文件中所建议的函数RANK的修正因素。回归分析回归分析工具通过对一组观察值使用最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量影响的。例如,观察某个运动员的运动成绩与一系列统计因素的关系,如年龄、身高和体重等。可以基于一组已知的成绩统计数据, 确定这三个因素分别在运动成绩测试中所占的比重,使用该结果对尚未进行过测试的运动员的表现作出预测。回归工具使用工作表函数LINEST。抽样分析抽样分析工具以数据源区域为总体,从而为其创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的,还可

29、以对一个周期中特定时间段中的数值进行采样。例如,如果数据源区域包含季度销售量数据,则以四为周期进行取样, 将在输出区域中生成与数据源区域中相同季度的数值。t-检验双样本t-检验”分析工具基于每个样本检验样本总体平均值是否相等。这三个工具分别使用不同的假设:样本总体方差相等; 样本总体方差不相等;两个样本代表处理前后同一对象上的观察值。对于以下所有三个工具,t-统计值t被计算并在输出表中显示为“t Stat。数据决定了 t是负值还是非负值。假设基于相等的基础总体平均值,如果t < 0,贝U “P(T <= t)单尾”返回t-统计的观察值比 t更趋向负值的概率。如果t >=0,贝U “P(T <= t)单尾”返回t-统计的观察值比t更趋向正值的概率。“t单尾临界值”返回截止值,这样,t-统计的观察值将大于或等于“t单尾临界值”的概率就为 Alpha。“P(T <= t)双尾”返回将被观察的 t-统计的绝对值大于t的概率。“P双尾临界值”返回截止值,这样,被观察的t-统计的绝对值大于“P双尾临界值”的概率就为 Alpha。t-检验:双样本等方差假设 本分析工具可进行双样本学生 t-检验。此t-检验窗体先假设两 个数据集取自具有相同方差的分布,故

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论