用Excel进行描述统计分析课件_第1页
用Excel进行描述统计分析课件_第2页
用Excel进行描述统计分析课件_第3页
用Excel进行描述统计分析课件_第4页
用Excel进行描述统计分析课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用Excel进行描述统计分析 实验三8/7/20221西南科技大学生命科学与工程学院周海廷制作集中趋势的测定与分析 1均值函数均值函数主要包括算术平均数、调和平均数和几何平均数。(1)算术平均数语法:AVERAGE(number1,number2, .)其中:Number1, number2, .为需要计算平均值的1到30个参数,参数可以是数字,或者是涉及数字的名称、数组和引用,如果数组或单元格引用参数中包含文字、逻辑值或空单元格,这些值将被忽略,但包含零值的单元格将计算在内。 8/7/20222西南科技大学生命科学与工程学院周海廷制作(2)调和平均数语法:HARMEAN(number1,nu

2、mber2, .)其中:Number1,number2,.为需要计算其平均值的 1 到 30 个参数。(3)几何平均数语法:GEOMEAN(number1,number2, .)其中:Number1,number2,.为需要计算其平均值的1到30个参数。 8/7/20223西南科技大学生命科学与工程学院周海廷制作2中位数(中位次数)函数语法:MEDIAN(number1,number2, .)如果参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值。3众数函数语法:MODE(number1,number2, .)如果数据集合中不含有重复的数据,则MODE()函数返回错

3、误值N/A。4最大(小)值函数语法:MAX(number1,number2,.)MIN(number1,number2, .)如果参数不包含数字,函数MAX(MIN)返回0。 。8/7/20224西南科技大学生命科学与工程学院周海廷制作例18-1:某商场家用电器销售情况如图1所示。 图18-1 某商场家用电器销售情况 8/7/20225西南科技大学生命科学与工程学院周海廷制作(1)计算各种电器的全年平均销售量,如图2所示。 图18-2 家用电器销售量平均数 8/7/20226西南科技大学生命科学与工程学院周海廷制作(2)计算各种电器销售量的中位数,如图3所示。 图18-3 家用电器销售量中位数

4、 8/7/20227西南科技大学生命科学与工程学院周海廷制作(3)计算各种电器销售量的众数,如图4所示。 图18-4 家用电器销售量众数 8/7/20228西南科技大学生命科学与工程学院周海廷制作离中趋势的测定与分析 1样本标准差语法:STDEV(number1,number2,.)其中:Number1,number2,.为对应于构成总体样本的 1 到 30 个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。 8/7/20229西南科技大学生命科学与工程学院周海廷制作2总体标准差语法:STDEVP(number1,number2,.)其中:Number1,numb

5、er2,. 为对应于样本总体的1到30个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。 当样本数较多(n30)时,函数STDEV()和STDEVP()计算结果差不多相等。 8/7/202210西南科技大学生命科学与工程学院周海廷制作例18-2:使用例18-1资料,计算各家电销售量的总体标准差,如图18-5所示。样本标准差的计算方法与总体标准差相同。 图18-5 计算总体标准差 8/7/202211西南科技大学生命科学与工程学院周海廷制作3 四分位数与四分位距语法:QUARTILE(array,quart)array:需要求四分位数值的数组或数字型单元格区域。qu

6、art:决定返回哪一个四分位值。 quart值 函数QUARTILE返回值 0最小数值 1第一个四分位数(第25个百分排位) 2中分位数(第50个百分排位) 3第三个四分位数(第75个百分排位) 4最大数值 表1 Quart值与QUARTILE返回值的对应关系 8/7/202212西南科技大学生命科学与工程学院周海廷制作四分位距是总体中第3四分位数与第1四分位数之差。 例18-3:使用例1资料,计算四分位数和四分位距,如图18-6所示。 图18-6 计算四分位数和四分位距 8/7/202213西南科技大学生命科学与工程学院周海廷制作分布形态的测定与分析 分析总体次数的分布形态有助于识别整个总体

7、的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。 8/7/202214西南科技大学生命科学与工程学院周海廷制作1偏度函数语法:SKEW(number1,number2,.)其中:Number1,number2. 为需要计算偏斜度的1到30个参数。2峰度函数语法:KURT(number1,number2, .)其中:Number1,number2,.为需要计算峰值的1到30个参数。 8/7/202215西南科技大学生命科学与工程学院周海廷制作例18-4:使用例18-1资料,计算各家电销售量的偏度和峰度,

8、如图7所示。 图18-7 销售量的偏度和峰度 8/7/202216西南科技大学生命科学与工程学院周海廷制作偏度为0时为正态分布,正值时为正偏态(峰向左倾),负值时为负偏态(峰向右倾),峰度为0时为正态峰,正值时为尖峰,负值时为平峰。8/7/202217西南科技大学生命科学与工程学院周海廷制作参数估计 8/7/202218西南科技大学生命科学与工程学院周海廷制作总体均值区间估计的基本内容1总体方差2已知,求的置信区间当总体方差2已知时,在置信度为的情况下,可以构造总体均值的置信区间为: 利用Excel计算总体均值置信区间8/7/202219西南科技大学生命科学与工程学院周海廷制作2总体方差2未知

9、,求的置信区间当总体服从正态分布,总体方差2未知时,要用样本方差代替2来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从于自由度为的t分布,在置信度为的情况下,可以构造均值的置信区间为:8/7/202220西南科技大学生命科学与工程学院周海廷制作例20-1:从某班男生中随机抽取10名学生,测得其身高(cm)分别为170、175、172、168、165、178、180、176、177、164,以95%的置信度估计本班男生的平均身高。(1)建立工作表,将以上数据录入。(2)分别计算样本个数、样本的平均数、样本标准差、样本标准误差、对应于置信度95%的概率度、抽样极限误差、置信区间的上、下

10、限。计算结果如图20-1所示。 。8/7/202221西南科技大学生命科学与工程学院周海廷制作图20-1 总体均值置信区间的计算 8/7/202222西南科技大学生命科学与工程学院周海廷制作必要抽样容量的计算公式在其他条件相同的情况下,抽样单位数越多,抽样误差越小,抽样单位数越少,抽样误差越大。确定抽样数目,应考虑以下几个问题:(1)被调查总体的标志变动程度(2)对推断精确度的要求,即被允许的抽样误差范围。(3)对推断把握程度的要求。 (4)抽取调查单位的方式。 利用Excel计算必要样本单位数 8/7/202223西南科技大学生命科学与工程学院周海廷制作用样本均值估计总体均值时所允许的最大绝

11、对误差是抽样极限误差,它表示抽样误差的可能范围,又称允许误差。如果用表示抽样极限误差,则那么样本容量n 的大小则为8/7/202224西南科技大学生命科学与工程学院周海廷制作例20-2:某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?(1)建立“样本容量计算”工作表。(2)分别计算与置信度95.45%对应的z值、样本容量并对其取整。计算结果如图20-2所示。8/7/202225西南科技大学生命科学与工程学院周海廷制作图20-2 必要样本容量计算 8/7/202226西南科技大学生命科学与工程学院周海廷制

12、作总体标准差及方差的估计 方差估计的内容和工作表函数1大样本情况下总体标准差的区间估计只要样本足够大,样本标准差s就服从正态分布,其均值近似等于总体标准差,其标准差 ,所以在置信度为时,的置信区间为: 8/7/202227西南科技大学生命科学与工程学院周海廷制作2小样本情况下正态总体方差的置信区间设为来自均值为、方差为2的正态总体,、2均为未知,则2的点估计量为,且, 那么置信度为时总体方差的置信区间为 8/7/202228西南科技大学生命科学与工程学院周海廷制作Excel提供了两个用于方差估计的工作表函数。(1)卡方分布函数语法:CHIDIST(x,degrees_freedom)其中:x为

13、用来计算分布的数值,degrees_freedom为自由度。(2)卡方分布反函数语法:CHIINV(probability,degrees_freedom)其中:probability为卡方分布的单尾概率,degrees_freedom为自由度。 8/7/202229西南科技大学生命科学与工程学院周海廷制作总体方差的置信区间例3:对某机床生产的一批模具随机抽取20件进行尺寸检测,其尺寸的标准差为0.5毫米,假定总体服从正态分布,以95%的置信度估计这批模具尺寸的方差的置信区间。由于总体方差未知,且又是小样本,所以使用分布进行区间估计。在95%的置信度下,分布的右侧置信度为0.025,左侧置信度

14、为0.975。 8/7/202230西南科技大学生命科学与工程学院周海廷制作(1)建立“方差区间估计”工作表,输入相关数据。(2)分别计算卡方右侧临界值、卡方左侧临界值、总体方差上限、总体方差下限、总体标准差上限、总体标准差下限。计算结果如下图所示。 8/7/202231西南科技大学生命科学与工程学院周海廷制作假设检验 8/7/202232西南科技大学生命科学与工程学院周海廷制作假设检验的基本思想和步骤 1 假设检验的基本思想假设检验是根据样本的信息来判断总体分布是否具有指定的特征。在数理统计中,把需要用样本判断正确与否的命题称为一个假设。根据研究目的提出的假设称为原假设,记为H0;其对立面假

15、设称为备择假设(或对立假设),记为HA。 提出假设之后,要用适当的统计方法决定是否接受假设,称为假设检验或统计假设检验。 8/7/202233西南科技大学生命科学与工程学院周海廷制作例21-1:某厂为了提高其产品的寿命进行了工艺改革,从生产的一大批产品中随机抽取10只,测得其样本均值小时,已知旧工艺条件下的产品寿命服从正态分布N(200, 52),试问新产品的寿命与旧产品的寿命是否一致。一般说来,工艺条件的变化只影响均值,而对方差影响不大。因此,可以认为新产品寿命服从正态分布N(, 52),是未知的,而=200是否成立也是未知的。 8/7/202234西南科技大学生命科学与工程学院周海廷制作如

16、果原假设=200成立,那么x N(200, 52),从而由单个总体的抽样分布的结论可知:,统计量对于给定的=0.05,令,或 8/7/202235西南科技大学生命科学与工程学院周海廷制作由于观测值 ,因此统计量z的观测值z0满足 而由前可知,是一个小概率。 8/7/202236西南科技大学生命科学与工程学院周海廷制作2 假设检验的基本步骤(1)构造假设(2)确定检验的统计量及其分布(3)确定显著性水平(4)确定决策规则 (5)判断决策 8/7/202237西南科技大学生命科学与工程学院周海廷制作1 构造检验统计量设总体X服从正态分布N(, 2),方差2已知,可以通过构造一个服从正态分布的统计量z来进行关于均值的假设检验。设是来自正态总体X的一个简单随机样本,样本均值为, 根据单个总体的抽样分布结论,选用统计量 总体标准差已知条件下均值双侧检验 8/7/202238西南科技大学生命科学与工程学院周海廷制作例21-2:某大学一年级新生女生的身高服从正态分布,平均身高为162.5cm,标准差为6.9cm。若从全校女生中随机抽取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论