2017中经-基础机构2zh讲义_第1页
2017中经-基础机构2zh讲义_第2页
2017中经-基础机构2zh讲义_第3页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四部分 统计第二十四章 描述统计考情分析:本章重点:集中趋势的测度指标:均值、中位数和众数。离散程度的测度指标:方差、标准差和离散系数。分布形态的测度:偏态系数、标准分数。变量相关关系的分类、散点图、相关系数。知识点一:集中趋势的测度1.均值。均值也叫做平均数,就是数据组中所有数值的总和除以该组数值的个数。设一组数据为 X1,X2,Xn,平均数X 的计算公式为:【注意 1】:均值主要适用于数值型数据,但不适用于分类和顺序数据。【注意 2】:均值容易受到值的影响,得均值对数据组的代表性减弱。值会使得均值向极大值或极小值方向倾斜,使2.中位数。把一组数据按从小到大或从大到小的顺序进行排列,位置居

2、中的数值叫做中位数,用 Me 表示:【注意 1】:中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。【注意 2】:中位数的优点是不受值的影响,性强。3.众数:指一组数据中出现次数(频数)最多的变量值。适用于描述分类数据和顺序数据,不 适用于定量数据。【注意】:有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势。总结:均值 VS 中位数 VS 众数:【例题单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。A.中位数B.均值指标适用特点均值定量变量利用全部信息,受值影响明显值,则代表性差中位数顺序变量和定量变量没有充分利用全部信息,不

3、受值影响适用于分布不对称的数据众数分类变量和顺序变量没有充分利用全部信息,不受值影响适用于分布明显呈偏态的数据年份单选题多选题合计2016 年2 题 2 分2 题 4 分6 分2015 年4 题 4 分2 题 4 分8 分C.标准差正确D.方差A本题考查中位数。中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受数据。值的影响,性强,尤其适用于收入这类偏斜分布的数值型【例题单选题】(2015 年)下列统计量中,适于描述分类数据集中趋势的是( )。A.均值 B.众数 C.中位数D.变异系数正确B本题考查集中趋势的测度。众数适于描述分类数据和顺序数据的集中趋势,不适用于定量

4、数据。【例题单选题】在某企业中随机抽取 7 名员工来了解该企业 2013 年上半年职工请假情况,这7 名员工 2013 年上半年请假天数分别为 1、5、3、10、0、7、2,这组数据中的位数是( )。A.3正确B.10C.4AD.0本题考查中位数。首先要排序,由小到大排序后的数据是 0、1、2、3、5、7、10中位数直观观察即可知道是“3”。知识点二:离散程度的测度(一)方差和标准差集中趋势对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。1.方差。方差是数据组中各数值与其均值离差平方的平均数,它能较好地

5、反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。总体数据,常用的方差计算公式有两种:样本数据,常用的方差计算公式:2.标准差。标准差即方差的平方根。(二)离散系数名称:变异系数或标准差系数;公式:标准差/均值:CVs/X应用:不同类别数据离散程度的比较,消除了测度和观测值水平不同的影响。【示例】某学校学生的平均为 20 岁,标准差为 3 岁;该校教师的平均为 38 岁,标准差为 3 岁。比较该校学生和教师的离散程度。 学生教师的离散系数3/200.15 的离散系数3/380.0789结论:学生的离散程度更大。【例题多选题】(

6、2015 年)下列统计量中,容易受值影响的有( )。A.均值 C.众数 E.标准差正确影响。B.方差D.中位数ABE本题考查集中趋势和离散程度的测度指标。均值、方差、标准差容易受值的【例题单选题】(2015 年)根据 2014 年某城市金融业和制造业各 1000 人的年薪样本数据来比较这两个行业从业年薪的离散程度,应采用的统计量是( )。A.标准分数B.相关系数C.变异系数D.偏态系数正确C本题考查离散系数。离散系数也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。知识点三:分布形态的测度(一)偏态系数(SK):1.偏态系数:测度数据分布偏度的指标;偏度指数

7、据分布的偏斜方向和程度,描述的是数据分布对称程度。(单选)2.应用:偏态系数的绝对值越大,数据分布偏斜程度越大。SK0:数据分布是对称的;SK0:数据分布右偏;00.5(轻度)0.51(中度)大于 1(严重)(3)SK0:数据分布;0-0.5(轻度)-0.5-1(中度)大于-1(严重)【例题多选题】(2016 年)在某上,商品甲得到 6 个评价得分,分别是 1、4、4、55、5;商品乙得到 5 个评分,分别是 3、3、3、4、4。关于这两组数据的说法,正确的有( )。A.商品甲的评分中位数高于商品乙B.商品甲的评分均值低于商品乙 C.商品甲的评分众数高于商品乙D.商品甲的评分分布离散程度大于商

8、品乙E.商品甲的评分分布是的正确ACDE本题考查集中趋势、离散程度的测度。商品甲:评分中位数(45)/24.5,众数5,均值(144555)/64,标准差1.55,离散系数1.55/40.3875,偏态系数-2.09。商品乙:评分中位数3,众数3,均值3.4,标准差0.55,离散系数0.55/3.40.16【例题多选题】(2015 年)某企业员工年收入数据分布的偏态系数为 3.0,则该组数据的分布形态为( )。A.右偏 B.C.严重偏斜 D.轻度偏斜E.中度偏斜正确AC本题考查偏态系数。偏态系数为 0,说明数据的分布是对称的。为正,说明分布是右偏的:取值在 00.5 之间说明轻度右偏;取值在

9、0.51 之间,说明中度右偏;取值大于1 说明严重右偏。为负,说明分布为:取值在 00.5 之间,说明轻度;取值在0.51 之间,说明中度偏。;取值小于1,说明严重。本题中,偏态系数为 3,说明严重右(二)标准分数标准分数也称 Z 分数,是统计学上常用的一种标准化方法。标准分数可以给出数值距离均值的相对位置,用于比较不同分布的变量值。(单选)公式:标准分数 Z(数值均值)标准差结果:标准分数 Z 越大越好。【示例】:某班期末。语文全班平均成绩 73 分,标准差 7 分,甲得了 78 分;数学考试全班平均成绩 80 分,标准差 6.5 分,甲得了 83 分。甲哪一门成绩更优秀?因为两科分布(均值

10、、标准差)不同,不能用原始数据直接比较,需要转换成标准分数,然后比较。Z(语文)(78-73)/70.71 Z(数学)(83-80)/6.50.46因此,甲的语文成绩更优秀。4.实际应用:当数据服从对称的数标准差之内的数据项所占比例。分布时,可以运用经验法则来判断与均值的距离在特定倍约有 68%的数据与平均数的距离在 1 个标准差之内,标准分数在-1,1范围内;约有 95%的数据与平均数的距离在 2 个标准差之内,标准分数在-2,2范围内;约有 99%的数据与平均数的距离在 3 个标准差之内,标准分数在-3,3范围内。【示例】语文全班平均成绩 73 分,标准差 7 分,则 95%的得分在 59

11、 和 87 之间。【例题多选题】(2016 年)某企业客户满意度数据服从对称的为 5。根据经验法则,关于该企业客户满意度的说法,正确的有( )。约有 68%的客户满意度在70,80范围内约有 68%的客户满意度在75,85范围内约有 95%的客户满意度在75,95范围内约有 95%的客户满意度在65,85范围内约有 99%的客户满意度在60,90范围内分布,均值为 75,标准差正确ADE本题考查标准分数。经验法则表明:约有 68%的数据与平均数的距离在 1 个标准差之内,约有 95%的数据与平均数的距离在 2 个标准差之内,约有 99%的数据与平均数的距离在3 个标准差之内。【例题单选题】(2

12、015 年)根据经验法则,服从对称分布的标准分数在-2,2范围内的概率是(A.95% C.68%正确)。B.50% D.99%A本题考查标准分数。对于服从对称的分布的标准分数,68%的标准分数在-11范围内,约有 95%的标准分数在-2,2范围之内,约有 99%的标准分数在-3,3范围之内。知识点四:变量间的相关分析(一)相关关系分类按相关的程度可分为:完全相关、不完全相关和不相关。按相关的方向可分为:正相关和负相关。按相关的形式可分为:线性相关和非线性相关。【注意】:相关关系并不等同于因果关系。(二)两变量的散点图:两个变量间的关系可以用散点图来展示。观测点分布无规律:不相关。观测点分布密集

13、在一条线周围:线性相关正相关:直线向右上倾斜负相关:直线向右下倾斜3.观测点呈现曲线模式:两个变量非线性相关。(三)相关系数的定义和计算Pearson 相关系数:度量的是两个变量之间的线性相关关系。Pearson 相关系数的取值范围:-1r1。0r1:变量 X 和 Y 之间存在正线性相关关系;-1r0:变量 X 和 Y 之间存在负线性相关关系;r1:变量 X 和Y 之间为完全正线性相关;r-1:变量 X 和 Y 之间为完全负线性相关。【注意】:Pearson 相关系数只适用于线性相关关系的判断。因此r0 只表示两个变量之间不 存性相关关系,并不说明变量之间没有任何关系,比如它们之间可能存在非线

14、性相关关系。相关程度:(1)|r|0.8:高度相关;(2)0.5|r|0.8:中度相关;(3)0.3|r|0.5:低度相关;(4)|r|0.3:说明两个变量之间的相关程度极弱,可视为无线性相关关系。【例题单选题】(2016 年)下列统计量中,适用于分析两个定量变量间相互关系的是( )A.离散系数 B.标准分数 C.相关系数 D.偏态系数正确C本题考查相关系数。相关系数是度量两个变量间相关关系的统计量。【例题单选题】(2016 年)根据下面的变量 X 和变量 Y 的散点图,可以看出这两个变量的 Pearson相关系数 r 的取值范围是( )。A.r-1 B.0r1 C.r1D.-1r0正确关系。D本题考查散点图与相关关系。若-1r0,表明变量 X 和 Y 之间存在负线性相关【例题单选题】(2015 年)2014 年某企业员工的工龄和月平均工资的散点图如下:根据以上散点图,工龄和月平均工资两个变量的相关关系是( )。A.正相关、线性相关 B.负相关、线性相关 C.正相关、非线性相关 D.负相关、非线性相关正确C本题考查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论