版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章统计数据的特征值4.1、集中趋势的测定4.2、离散程度的测定4.3、数据分布的形态数据的分布特征4.1集中趋势的测定统计数据一般具有向中间靠拢的趋势,这种向中间靠拢的趋势被称为集中趋势。
一般而言,集中趋势值可以表示变量的一般水平、中等水平或普遍水平等等。通常根据不同类型的变量,集中趋势值一般有众数、中位数和平均值三种。4.1.1众数众数(Mode)即是多数,是变量值表现次数最多的值,可以表示总体的一般水平,通常用Mo表示。适用于分类变量、顺序变量和数值型变量。1、分类变量的众数(60名学生喜好的球类运动)2、顺序变量的众数(
游客对门票价格的评价)3、数值型变量的众数(18名工人每天生产的次品数)(单变量值分组、组距分组)众数计算的一个例子——分组资料身高频率150-1551155-16016160-16542165-17057170-17527175-1806180-18514.1.2中位数和分位数1、中位数中位数(Median)即位置处于中间的数,将一组数据排序后,可以找出一个数据值,以这个数据值为界将总体分为单位数相等的两部分,中位数可以表示总体的中等水平,通常用Me
表示中位数位置:中位数应用场合:顺序数据对门票价格的评价人数向上累积频数向下累积频数百分比%向上累积百分比%向下累积百分比%很高95955001919100较高11420940522.841.881适中11632529123.26558.2较低9942417519.884.835很低765007615.210015.2合计500----100----中位数的位置:(n+1)/2=250.5中位数的应用场合:——数值型中位数位置:例1:根据调查9个投资基金2014年的投资净收益率(%)。27.1,39.2,44.2,44.5,53.8,56.6,59.5,62.5,66.4顺序:123456789Me=53.8例2:随机调查10名职工,记录从家到单位上班的时间(min):31353840424546505212345678910因此取第5个数和第6个数之和的一半:Me=(40+42)/2=41。2、分位数——四分位数上四分位数的位置下四分位数的位置
例:9个投资基金2014年的投资净收益率:27.139.244.244.553.856.659.562.566.4123456789(9+1)/4=2.5,2.5*3=7.54.1.3平均数1、算术平均数2、调和平均数3、几何平均数1、算术平均数——简单算术平均数未分组资料,计算公式:例:根据数据4-2,10名职工从家到单位的平均时间1、算术平均数——加权算术平均数分组资料,计算公式:或者例:根据150名学生身高分组数据计算平均身高。解答一:身高组中值(x)人数(f)(xf)150-155152.51152.5155-160157.5162520160-165162.5426825165-170167.5579547.5170-175172.5274657.5175-180177.561065180-185182.51182.5合计-15024950身高组中值(xi)频率(wi)xi*wi150-155152.50.67%1.02155-160157.510.67%16.80160-165162.528.00%45.50165-170167.538.00%63.65170-175172.518.00%31.05175-180177.54.00%7.10180-185182.50.67%1.22合计-100.00%166.33解答二:4.1.4众数、中位数和平均数的关系4.1.5几何平均数和动态平均增长率几何平均数通常用于计算动态平均值或相对增长率的平均值。其计算公式:例、某投资者初始资本100万,第一年末投资收益100%,即本金和收益之和为200万,第二年末收益-50%(即亏损50%),本金和收益又重新回到100万。如果按照算术平均数计算平均收益率:4.1.6调和平均数调和平均数也分为简单调和平均数和加权调和平均数,计算公式分别是:例、已知某企业销售A产品三批,每一批的销售量、销售价格、销售额数据如表4-5,根据资料计算产品A的平均销售价格。批次销售单价(元/件)数量(件)销售额(元)1105005000210.56006300311.51000115004.2离散程度的测定数据分布的另一个属性就是离散程度,也称作离中程度。离散程度表示了总体内部的差异程度。4.2.1分类数据——异众比率关于60名大学生最喜欢的运动项目,众数组“足球”17人,约占28%,则异众比率为72%,其数值较大,说明学生喜欢的运动项目差异比较大,或者用足球代表大学生运动项目的偏好效果较差。4.2.2数值型数据1、全距(Range)2、平均差平均差是全部变量值与平均值的平均偏离程度。平均差克服了全距的两个缺陷,其计算公式:例、根据下列数据计算职工到单位上班时间的平均差:29313538404245465052未分组数据:分组数据:如果要根据表4-3分组数据计算150名学生的平均差,则:3、方差和标准差
样本方差和标准差重要概念在根据样本数据计算方差或者标准差时,其分母用到的是n-1而不是n。在这里n-1叫做自由度(degrees
offreedom)。例、试根据数据4-2,计算职工到单位上班时间的方差和标准差,29313538404245465052例、
根据数据3-6的分组资料,计算方差是可采用计算表(150名学生身高方差计算表)身高组中值()人数()150-155152.51190.44190.44155-160157.51677.441239.04160-165162.54214.44606.48165-170167.5571.4482.08170-175172.52738.441037.88175-180177.56125.44752.64180-185182.51262.44262.44合计-150-4171根据上面的计算表,得:4、相对离散程度:标准差系数相对离散程度最常用的测度值就是离散系数,其中标准差系数最为常见,它是标准差于平均值的比值,通常用系数或百分比来表示,计算公式是4.2.3数据相对位置的衡量:标准化Z值68.27%95.45%99.73%4.3数据分布的形态4.3.1、偏态及其测度偏态即分布的偏斜程度,在偏态测度指标中,统计学家皮尔森(K.Pearson)给出的偏态系数被普遍采用,公式是:4.3.2峰度及其测度峰度是相对于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版泥浆外运承包合同(含应急处理预案)4篇
- 二零二五版拌合料生产技术标准制定与执行合同4篇
- 二零二五年度智能建筑暖通设备采购合同4篇
- 二零二五版门闸安全标准认证服务合同4篇
- 二零二五年度网络安全年薪制劳动合同4篇
- 二零二五年度冲击锤施工材料质量检测合同2篇
- 二零二五年度租赁市场合同纠纷解决策略4篇
- 二零二五年度城市更新改造项目规划合同4篇
- 二零二五年度农业电商数据安全与隐私保护合同样本3篇
- 2025年度二零二五年度猕猴桃出口贸易代理合同3篇
- 2024年供应链安全培训:深入剖析与应用
- 飞鼠养殖技术指导
- 坏死性筋膜炎
- 整式的加减单元测试题6套
- 股权架构完整
- 山东省泰安市2022年初中学业水平考试生物试题
- 注塑部质量控制标准全套
- 人教A版高中数学选择性必修第一册第二章直线和圆的方程-经典例题及配套练习题含答案解析
- 银行网点服务礼仪标准培训课件
- 二年级下册数学教案 -《数一数(二)》 北师大版
- 晶体三极管资料
评论
0/150
提交评论