版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章统计数据的描述性分析常用来度量集中趋势的指标包括:平均数、中位数、众数。标志值分布的集中趋势。了解集中趋势的量数计算一组数据的均值
学习目标计算一组数据的众数和中位数选择一种集中趋势度量数一.平均数——是依据总体各单位全部标志值计算出的平均数。〔一〕.算术平均数平均数的根本公式(1)简洁算术平均数标志总量除以单位总量而得。计算公式:我国电视观众调查式:例:2023年1月比特啤酒公司销售点销售量60个销售点的啤酒销售量(单位:桶)比特啤酒公司每个销售点月销售量?〔频数〕的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都一样时,即当f1=f2=f3fn时:加权算术平均数就等于简洁算术平均数。使用SPSS求算术平均数利用Analyze==>Descriptive菜单算术平均数二.中位数(Median〕将总体各单位标志值按由小到大的挨次排列后处于中间位置的标志值称为中位数,记为Me。中位数是描述分布中心趋势的另一种典型的度量。中位数是“最中间的数”,一半的观测值比它小,一半比它大。中位数是是依据总体标志值所处的特别位置确定的一类平均指标-位置平均数,不受极端数据的影响。当统计资料中含有特别的或极端的数据时,中位数比算术平均数更具有代表性。5笔付款:9元,10元,10元,11元,60元付款的均值为20元,明显这并不是一个很好的代表值,而中位数M=10元则更能代表平均每笔的付款数。观测变量为定序变量、定距变量或定比率变量时,中位数都是有意义的;但是不适于定类变量。查找中位数的步骤·将全部n个观测值按由小到大的挨次排列;·假设观测值的个数为奇数·假设观测值的个数为偶数,中位数就是排序后最中间的两个观测值的平均。三、众数〔Mode〕——是总体中消灭次数最多的标志值,记为M0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极在某些状况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进展生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。平均数、中位数、众数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者一样。在偏斜分布中,中位数和平均数可能相差很远。均数拉高,这时再承受平均数来描述分布的中心就没有什么实际意义不管这些巨额广告投入有多大,对中位数的值不会有什么影响,由于它们只不过是“中间点”右边的个别点而已。状况下,最好承受中位数而不是平均数来描述分布的中心,以免造成误会。当分布比较有规律时,承受平均数则优于中位数当次数安排呈右偏(正偏)时:算术平均数受极大值的影响当次数安排呈左偏(负偏)时,算术平均数受微小值的影响中位数则总是介于众数和平均数之间。均值和中位数的关系均值是一系列数值的中间点。中位数是一系列个体的中间点〔奇异值〕就不会对中位数产生影响。练习:的报告:特惠食品售出数量价格〔美元〕HugeBurger202.95BabyBurger181.49ChickenLittles253.50PorkerBurger192.95YummyBurger171.99ConDog201.99售出总数119假设仅有平均指标而没有描述分布的伸展程度的统计量来协作,对观测数据的描述不仅是不完整的,还有可能造成误导。例如北京市01是观l000和1271就掩盖了其中有2.5%的家庭月收入低于300元、有1.8%的家庭月收入高于20230元的事实。为此还需要有关分布伸展程度或数据的散布程度的统计量.程度或差异状况。几个总体可以有一样的均值,但取值状况却可以相差很大。对变异性的理解7,6,3,3,13,4,4,5,44,4,4,4,4一.极差〔Range) 描述分布的伸展程度的最简洁的方法之一,两个数表示了数据的分布范围,称它们的差为极差(也称全距),通常记为R。R=最大值-最小值明显,一组数据的差异越大,其极差也越大。产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据分布的他观测值的奇异值,因而是一种比较粗糙的变异指标。二.四分位数差〔Inter-QuartileRange) 将全部数据由小到大排序,用三个数把数据分成四局部,每一局部都包含25%Q1、Q2、和Q3。Q2就是中位数M。有25%的数据小于Q1;有25%的数据大于Q3;Q1和Q3给出了中间一半数据的范围,四分位数差(IQR)为Q1和Q3之间的距离:IQR=Q3-Q1QI和Q3·将数据按从小到大的挨次排列,找出中位数M,即Q2;·找出中位数左边全部观测值的中位数,得到Q1;·找出中位数右边全部观测值的中位数,得到Q3。二.四分位数差〔Inter-QuartileRange) 将全部数据由小到大排序,用三个数把数据分成四局部,每一局部都包含25%Q1、Q2、和Q3。Q2就是中位数M。有25%的数据小于Q1;有25%的数据大于Q3;Q1和Q3给出了中间一半数据的范围,四分位数差(IQR)为Q1和Q3之间的距离:IQR=Q3-Q1QI和Q3·将数据按从小到大的挨次排列,找出中位数M,即Q2;·找出中位数左边全部观测值的中位数,得到Q1;找出中位数右边全部观测值的中位数,得到Q3。三.五数综合合:最小值、第一四分位数、中位数、第三四分位数、最大值用符号表示:Min、Q1、M、Q3、Max依据分布的五数综合,可画出盒型图(boxplot)。“盒型”局部的两端位于两个四分位数,盒型里面的直线段标出中位数的位置。例:依据1998年的一次受众调查,某省电视台以闻类、体育类和电影类节目为主(分钟)的五数综合分别为:闻频道育频道影频道C106090120300观众日收看时间长度的盒型图从三个盒型图可以清楚地看到,电影频道观众的收看时间最长,其中半数观众的收看时间都在1至2个小时之间;体育频道(B)观众的收看时间虽然短于电影频道,但是约有1/4的观众日收看时间都超过了1到了5小时;而闻频道(A)观众的收看时间则相对少得多、也集中得多。〔n=30)例:依据1998年的一次受众调查,某省电视台以闻类、体育类和电影类节目为主(分钟)的五数综合分别为:闻频道A 15 30 45 50 120体育频道影频道C106090120300不同时段播出的电视广告效果比较对变异性的理解7,6,3,3,13,4,4,5,44,4,4,4,4四.平均差平均差是各数据与其均值离差确定值的算术平均数,通常记为A.D。五.方差和标准差描述分布的最常用的统计量是平均数加上标准差,前者描述分布的中心;后者描述分布的伸展程度或离散程度。标准差标准化了与某个值的偏差。标准差每个值与均值的平均距离;方差是标准差的平方。方差和标准差计算公式:1.总体标准差总体标准差记为。2.样本方差与样本标准差样本标准差记为S,样本方差记为S2,在推断统计中,它们分别是总体方差和标准差的优良估量。计算标准差:5,8,5,4,6,7,8,8,3,6对于分组数据方差:例:试计算观众日收看电视时间X的平均数和标准差方差和标准差的计算SPSS。使用SPSS->数据分析->统计功能->返回全部参数中数据的样本方差、标准差。留意:第三节度量偏斜程度的指标?是“瘦高的”还是“矮胖的”?斜度(skewed)向:假设分布是对称的,斜度为零;假设长尾巴指向大的值,则称正偏,斜度为正值;假设长尾巴指向小的值,则称负偏,斜度为负值;分布的斜度示意图:峰度(kurtosis)峰度描述观测值聚拢在中心的程度,是分布外形的另一特征。假设观测值的中心聚拢度与正态分布一样,或分布的外形与正态曲
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 住宅装修预定金协议范本
- 网络公司装修尾款支付协议
- 赛车场样板房装修合同
- 幕墙石材防护剂施工方案
- 体育馆装修质保期规定
- 航空货运合同风险规避技巧
- 家居行业融资链家居间合约
- 2025年度智能穿戴设备研发合同标的及技术要求2篇
- 2025年度铁矿石矿山环境保护合同范本3篇
- 2025年批发买卖合同2篇
- MT/T 199-1996煤矿用液压钻车通用技术条件
- GB/T 6144-1985合成切削液
- GB/T 10357.1-2013家具力学性能试验第1部分:桌类强度和耐久性
- 第三方在线纠纷解决机制(ODR)述评,国际商法论文
- 公寓de全人物攻略本为个人爱好而制成如需转载注明信息
- 第5章-群体-团队沟通-管理沟通
- 肾脏病饮食依从行为量表(RABQ)附有答案
- 深基坑-安全教育课件
- 园林施工管理大型园林集团南部区域养护标准图例
- 排水许可申请表
- 低血糖的观察和护理课件
评论
0/150
提交评论