




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章数据分布特征的描述一、填空题3.1.1 集中趋势是指一组数据向其中心值靠拢的倾向。3.1.2加权算术平均数受两个重要因素的影响,一个是 各组变量值;另一个是各组变量值出现的 频数或频率。3.1.3计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法。算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用加权调和平均法。是计算平均比率或平均发展速度最适用的一种方法。3.1.6 众数 是指一组数据中出现次数最多的变量值。3.1.7 四分位数是指将按大小顺序排列的一组数据划分为四等分的三个变量值。3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10
2、等分的9个变量值。3.1.9在数据分布呈 完全对称的正态分布时,算术平均数、众数和中位数三者相等。3.1.10异众比率是指 非众数组 的频数占总频数的比率。3.1.11上四分位数与下四分位数之差的简单算术平均数称为四分位差。3.1.12各个变量值与其算术平均数离差的绝对值的平均数称为平均差。3.1.13总体方差是各个数据与其算术平均数的离差平方的平均数,通常以2表示。3.1.14皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布偏斜程度的一种方法。3.1.15 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将
3、其字母填 在题干后面的括号内)3.2.1先将一组数据的变量值按疋顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为(B )A 数值平均数B .位置平均数C 离散系数3.2.2算术平均数反映的是数据分布的什么特征(A )A 集中趋势B 离散趋势C .偏态趋势3.2.3根据算术平均数的性质下列表达式正确的是(A )A (x x)f 0B ?x- xf=0C. ? (x- x)2 f =03.2.4如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是(B)A 算术平均法B 几何平均法C 调和平均法3.2.5 用各组的组中值代表
4、其实际数据计算算术平均数时,通常假定 (A )A 各组数据在组内是均匀分布的B 各组次数相等C 各组数据之间没有差异3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 (A )A M o Me xB x Me MoC x Mo Me3.2.7 离散程度测度指标中,受极端值影响最大的是C )A3.2.8平均差平均差B 标准差C 全距别在于与标准差的主要区(B )对离差的数学处理方法不同计算对象不同A说明问题的角度不同BC(3.2.9B )标准差系数消除了响A总体单位数多少的影响B平均数大小和计量单位的影响C离散程度的影3.2.10 直接使用标准差比较分析两个同类总体平均数的
5、代表性,其前提条件是 B )A 两个总体的标准差应该相等B. 两个总体的平均数应该相等C. 两个总体的离差平方和应该相等3.2.11 下 列 指 标 中 , 实 际 应 用 最 广 泛 的 离 散 程 度 测 度 指 标 是 B )A .平均差B .标准差C .离散系数3.2.12 皮尔 逊 测度 法 就是 利用算 术平 均 数 与 众 数 的 关 系来 测 度 数 据 分 布 的 A )三、多项选择题 (在下列A .偏斜程度B .离散程度C .集中程度4 个备选答案中,至少有二个是正确的,请将其全部选 出,并把字母填在题干后面的括号内)3.3.1描 述 数 据 分 布 集 中 趋 势 的 指
6、 标 有ABCD )A .算术平均数 B.调和平均数C .众数 D .中位数3.3.2描述数据分布离散趋势的指标有ABCD )A 全距B 平均差C标准差D离散系数3.3.3算术平均数所具有的数学性质有AC )A 各个变量值与其平均数离差之和等于零B .各个变量值与其平均数离差的绝对值之和等于零C.各个变量值与其平均数离差的平方和为最小值D .各个变量值与其平均数离差的平方和为最大值3.3.4 下 列 不 适 于 计 算 算 术 平 均 数 的 数 据 类 型 有 AB )A .分类数据B .顺序数据C.数值型数据D .截面数据3.3.5 加 权 算 术 平 均 数 中 , 各 个 变 量 值的
7、 权数 要 起 作 用 必 须 具 备两 个 条件 AD )A .各个变量值之间有差异B .各个变量值的权数相等C.各个变量值相等D .各个变量值的权数有差异3.3.6 下 列 对 众 数 的 解 释 说 明 中 , 正 确 的 有 ABCD )A .众数是指一组数据中出现次数最多的变量值B. 一组数据中可能有多个众数,也可能没有众数C. 众数不受极端值的影响D 众数缺乏灵敏性3.3.7 下 列 对 中 位 数 的 解 释 说 明 中 , 正 确 的 有 ACD )A .中位数不受分布数列的极大或极小值影响B. 中位数是指一组数据中出现次数最多的变量值C. 中位数缺乏灵敏性D .当次数分布偏态
8、时,中位数的代表性会受到影响338 以SKp表示根据皮尔逊测度法计算的偏态系数,下列陈述中正确的是(ABCD )A 经验证明,在适度偏态的情况下,3 SKp 3B.当XMo,SKp0时,数据分布呈对称分布C.当XMo,SKp0时,数据分布呈右(正)偏分布D.当XMo,SKp0时,数据分布呈左(负)偏分布3.3.9下列关于四分位差的解释说明中,正确的有ABCD)A 四分位差就是上四分位数与下四分位数之差的简单算术平均数B. 四分位差越小,表明中位数的代表性越好C. 四分位差越大,表明中位数的代表性越差D 四分位差可以避免受极端值的影响3.3.10 比较不同总体平均数的代表性时,应该使用离散系数,
9、因为 (AB )A .离散系数可以消除平均数大小的影响B. 离散系数可以消除计量单位的影响C. 离散系数可以消除总体单位数多少的影响D .离散系数可以消除变量值之间差异程度的影响四、判断改错题(在你认为正确的题后括号内打“V”。在你认为错误的地方和题后括号内打“ X ”,并在其正下方写出正确的答案来)3.4.1算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。(X,不适用于分类数据和顺序数据)3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。(V )3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。(V )3.4.4 各变量值与其算术平均数的离差平方和为最小值
10、。(V )3.4.5众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。(X,集中趋势 )3.4.6 对于一组数据,可能存在一个或多个众数,也可能不存在众数。(V )3.4.7四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。(X,四等分的三个变量值 )3.4.8十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。(X, 9个变量值)3.4.9在左偏分布中,众数最小,中位数适中,算术平均数最大,即Mo Me X。(X,右偏分布 )3.4.10 数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。(V )3.4.11 在实际工作中,全距常用来检
11、查产品质量的稳定性和进行质量控制。3412偏态和峰态是对分布集中程度的测度。(X,分布形状)3413凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为 平缓,则为低峰度。(V )3414如果以 表示峰度系数,当0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。(X,0 )五、简答题3.5.1什么是集中趋势?测度集中趋势的主要指标有哪些?答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映
12、这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水 平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。3.5.2什么是调和平均数?调和平均数与算术平均数有何关系?答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到 的平均数。从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的, 惟一的区别是计算时使用了不同的数据。
13、3.5.3什么是几何平均数?其应用场合是什么?答:几何平均数也称几何均值,它是n个变量值乘积的n次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。3.5.4什么是离散趋势?测度离散趋势的主要指标有哪些?答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。3.5.5什么是偏
14、度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态?答:偏度是描述数据分布对称性的特征值。峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。根据皮尔逊测度法测算的偏态系数SKp ,经验证明,在适度偏态的情况下,3 SKp 3。当X Mo, SKp 0时,数据分布呈对称分布;当 X M。,SKp 0时,数据 分布呈右(正)偏分布;当 X Mo, SKp 0时,数据分布呈左(负)偏分布。根据中心矩法计算的偏态系数,当 0时,数据分布呈对称分布形态;0,数据分布呈负(左)偏态;0 ,数据分布呈正(右)偏态;值越接近于0,数据分布越趋于对称, 的绝对值越大,数据分布越偏斜。根据峰度系数 ,当 0
15、时,分布曲线为正态曲线;当 0时,分布曲线为高峰曲线, 表明变量值的差异程度小,平均数代表性好;当0时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。六、计算题36 12007年某企业精加工车间 20名工人加工 A零件的产量资料如下:按日产量分组(件)工人人数(人)282294307315322合计20要求:试计算20名工人日产量的算术平均数、众数和中位数。解:(1)20名工人日产量的算数平均数:- xf 28 229 4 30 7 31 5 32 2601/叶小、x30.05 (件 /人)。f2020(2) 从该企业的产量资料表可以看出,20名工人日产量的众数为 30件;(3)
16、20名工人日产量的中位数:工人总数的二分之一是10人,从小到大累计人数首次超过10的组所对应的日产量为30件,则中位数为 30件。3.6.22007年某管理局所属22个企业的工人工资及工人比重资料如下:按月工资分组(元/人)企业数各组工人占工人总数的比重(%)1000以下31510002000735200030008323000以上418合计22100要求:试计算该管理局工人的月平均工资。解:根据已知资料,列表计算如下:某管理局工人的月平均工资计算表按月工资分组(元/人)组中值X各组工人占工人总数的比重 (%) f/ fx (f / f)1000以下5001575001000200015003
17、55250020003000250032800003000以上35001863000合计100203000该管理局工人的月平均工资为:k f 500 15 1500 35 2500 32 3500 18203000/小、x x 2030 (兀 /人)。i 1f100203.6.3某工业局所属生产同一产品企业19个,2007年按工人劳动生产率高低分组如下:按劳动生产率分组(吨/人)企业数各组工人数(人)50 608240060 705160070803120080902120090 10011100合计197500要求:试计算该工业局工人平均劳动生产率。解:根据已知资料,列表计算如下:该工业局工
18、人平均劳动生产率计算表按劳动生产率分组(吨/人)组中值x各组工人数(人)fxf50 6055240013200060 70651600104000708075120090000809085120010200090 100951100104500合计7500532500该工业局工人平均劳动生产率为:xf 55 240065 1600 75 1200 85 120095 1100532500x71 (吨从)。f750075003.6.4某企业生产A种产品需要经过三个连续作业的车间才能完成。2008年1月第-车间粗加工产品的合格率为 98%,第二车间精加工产品的合格率为 95%,第三车间最后装 配的
19、合格率为92%。要求:试计算该产品的企业平均合格率。解:该产品的企业平均合格率为:Gm3.6.5根据抽样调查结果,2008年2月某市居民通讯支出额的众数为120元,算术平均数为150元。要求:试根据算术平均数、中位数及众数之间的关系,计算中位数的近似值,并说明该 市居民通讯支出额分布的态势。解:(1)该市居民通讯支出额的中位数近似值为:Mo 2x 120 2 15033由 120140150 显然有 Mo Me x ,140 (元)。(2)正偏态分布,也即右偏分布。即该市居民通讯支出额呈尾巴拖在右边的3.6.6 某投资银行的年利率按复利计算,19962007年的年利率分组资料如下:按年利率分组
20、(%)年数(年)628493122151合计12要求:试计算19962007年的平均年利率。解:19962007年的平均年利率为:X fxj 100% 12106%2一108%4一109%3一112%2一115% 100% 9.14%3.6.7根据500户抽样调查结果,2007年某市城市居民家庭按月人均可支配收入分组 的资料如下:按月人均可支配收入分组(元/人)各组家庭户数占总户数的比重( % )1000以下151000200028200030003230004000184000以上7合计100要求:根据上述资料计算 2007年该市居民家庭月人均可支配收入及其平均差和标准差。解:x(1)200
21、7年该市居民家庭月人均可支配收入为:500 15 1500 282500 32 3500 18 4500 72240(元 / 人)100 。(2)相关计算过程如下:2007年该市居民家庭月人均可支配收入计算表按月人均可支配收组中值X各组家庭户数占总 户数的比重(% )lx X|x x丄(x 刃 2_L入分组(元/人)f / f1八八1ff1000以下5001517402610045414000100020001500287402072015332800200030002500322608320216320030004000350018126022680285768004000以上4500722
22、601582035753200合计100626093640127240000ADx xf1740 15 L 2260 793640 =936.40(元)100100人均可支配收入的平均差为:(3)标准差为:Sx)2fi500499I17 15 诚 7 竺(1。竺 1129.14 (100499 1004993.6.82006年某校学生会为了解在校大学生的消费支出情况,从全校本科学生中按性别随机各抽取100名,其月消费支出额分组资料如下:月消费支岀额(元)男生(人)女生(人)200以下652003009123004001625400500242450060023186007001410700以上
23、86合计100100要求:根据表中资料(1)分别计算男女学生的平均月消费支出;(2)分别计算男女学生月消费支出的中位数和众数;(3)分别计算男女学生月消费支出的下四分位数和上四分位数;(4)分别计算男女学生月消费支出的平均差、标准差、离散系数,并比较其平均月消 费支出的代表性;(5)分别计算男女学生月消费支出分布的偏态系数和峰度系数,判断其分布形态。 解:(1)男学生的平均月消费支出为:- xf 150 6 L 750 847300/十、x473 (兀);f100100同理得到女学生的平均月消费支出为442元。对男学生而言,(2)男学生月消费支出的中位数为:f / 2=50,首次超过50的累计
24、次数为55,其所对应的组为 400500元,故该组为中位数所在的组;该组 L=400,気=24 , Smi=31 , d=100,代入公式求得:f /2) Sm 1fm400 5031 100 479(元);24同理可得到女学生月消费支出的中位数为433元;男学生月消费支出的众数为:Mo L40024 16(2416)(2423)100489 (元);同理得到女学生月消费支出的众数为393元。(3) 男学生月消费支出的下四分位数为:25的组是300400,该组即对男生而言,Ql的位置=25,由小到大累计次数首次超过QllqldQL为下四分位数所在的组,Sql !=15, fQL=16,dQL
25、=100,代入公式求得:30025 15 100362.5(元);16同理得到女学生月消费支出的下四分位数为332元。男学生月消费支出的上四分位数为:QULqu3 f壬邑 500专100 587(元)同理得到女学生月消费支出的上四分位数为550元(4) 男学生月消费支出的平均差为:ADx x f 150473 6 L |750 4738f %100129 (元)同理可求得女生月消费支出的平均差为121元;男生月消费支出的标准差为:2150 4736 L 750100 124738159.45 (元)同理求得女生月消费支出的标准差为152.21元;男生月消费支出的离散系数为:VsS 159.45
26、x 4730.3371同理可求得女生月消费支出的离散系数为 费支出代表性更强。0.3444,前者小于后者,所以男学生的平均消(5)三阶中心矩呛(X X)3 f;四阶中心矩m44(X X) f偏度系数:m3峰度系数:m4根据公式计算得男生月消费支出的偏度为-0.1879,呈轻度左偏分布;峰度为 -0.5550,呈轻度低峰分布;对女生而言,月消费支出偏度为0.1727,呈轻度右偏分布;峰度为 -0.5015,呈轻度低峰分布。3.6.92007年第一季度某种药品在三个地区的销售额资料如下:月份单价(元/合)销售额(万元)甲地区乙地区丙地区115304524214323528312364230合计9812282要求:根据上述资料,(1)分别计算甲、乙、丙三个地区第一季度该种药品的平均价格;(2)分别计算第一季度各月该种药品的平均价格;(3)计算该种药品第一季度总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全媒体运营师持续学习的重要性:试题及答案
- 2024年国际物流师考试热点前瞻与试题及答案
- 办公软件操作衔接技巧
- 七年级生物下册 第四单元 第六章 人体生命活动的调节第四节激素调节教学实录3 (新版)新人教版
- 小学防溺水公开课课件
- 养小兔子(教案)-2024-2025学年四年级劳动粤教版
- 陕西省石泉县七年级地理下册 第八章《东半球临近的国家和地区》备课教学实录 (新版)新人教版
- 安防警示教育课件下载网
- 各国医院管理模式
- 1少让父母为我担心(教学设计)-统编版(五四制)道德与法治四年级上册
- 2025届成都市2022级高中毕业班第二次诊断性检测语文试题及答案
- 骆驼祥子-(一)-剧本
- 《工程勘察设计收费标准》(2002年修订本)
- UASB反应器的设计计算
- 动火安全作业票
- 通用请假条Excel表格模板
- 四川省农村居住建筑抗震设计技术导则
- 电力施工工艺规范学习第四期(电缆排管接地装置施工)
- 游戏评测模板
- 我国造船工艺创新发展三十年
- 《岭南文化粤剧》PPT课件.ppt
评论
0/150
提交评论