社会统计学集中趋势的量度平均_第1页
社会统计学集中趋势的量度平均_第2页
社会统计学集中趋势的量度平均_第3页
社会统计学集中趋势的量度平均_第4页
社会统计学集中趋势的量度平均_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学集中趋势的量度平均第1页,共44页,2023年,2月20日,星期一1、对于未分组资料

[例4.1.1]求74、85、69、9l、87、74、69这些数字的算术平均数。[解]

==78.4

第2页,共44页,2023年,2月20日,星期一2023/4/1422、分组资料在统计学中,凡对应于分组资料的计算式,都被称为加权式。

[例]求表所示数据的算术平均数

人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00第3页,共44页,2023年,2月20日,星期一2023/4/143对于组距数列,要用每一组的组中值权充该组统一的变量值。

[例]求下表所示数据的的算术平均数间距频数(f)组中值(X)148―152152―156156―160160―164164―168168―172172―176176―180180―184184―188188―192192―19612510192517125301150154158162166170174178182186190194合计100——第4页,共44页,2023年,2月20日,星期一2023/4/144练习4.11:八个登记游泳的家庭中每一家的儿童数分别是1,2,1,3,2,1,5,3。求均值。4.12求下列数据的均值第5页,共44页,2023年,2月20日,星期一2023/4/1451、各变量值与算术平均数的离差之和等于0。离差:2、各变量值对算术平均数的平方和,小于他们对任何他数偏差的平方和:“最小二乘方”,是平均差和标准差的基础。3、算术平均数受抽样变动影响较小。4、受极端值影响较大。5、分组资料如遇有开放组距时,不经特殊处理不能进行算术平均数的计算。3.算术平均数的性质第6页,共44页,2023年,2月20日,星期一2023/4/146假如对十名学生每天的零花钱进行调查,分别为:10、8、12、8、10、15、20、12、10、400第7页,共44页,2023年,2月20日,星期一2023/4/147张家收入一千万,邻居九个穷光蛋,平均起来算一算,个个都是张百万。凯特勒“averageman”——一个民族主要的生理和心理素质的统计指标的平均数,是除去个人差异后的典型和标准。第8页,共44页,2023年,2月20日,星期一2023/4/148第二节中位数(Median)Md在变量数列中,按大小顺序排列,处于正中间的那个变量值。一半数值比它大,一半数值比它小。可用于定序、定距、定比资料。样本中位数第9页,共44页,2023年,2月20日,星期一2023/4/1491、对未分组资料:

N为奇数(Odd):(N+1)/2N为偶数(Even):N/2与N/2+1值的平均值例1:求75,82,72,86,57这些数字的中位数。例2:75,82,72,55,86,57这些数字的中位数。第10页,共44页,2023年,2月20日,星期一2023/4/14102、对于分组资料:先找到中位数所在组,再求值。

单项式变量数列:根据N/2在累计频数分布中找到中位数所在组,该组变量值。

第11页,共44页,2023年,2月20日,星期一2023/4/1411组距式变量数列:先根据N/2在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,例3:某年级学生身高如下,求中位值第12页,共44页,2023年,2月20日,星期一2023/4/14121、各变量值对中位数之差的绝对值总和,小于它们对任何其他数的绝对值总和。2、中位数不受极端值的影响。3、分组资料有不确定组距时,仍可求得中位数。4、中位数受抽样变动的影响较算术平均数略大。

3.中位数的性质第13页,共44页,2023年,2月20日,星期一2023/4/14131.当一个群体中,只有极少数具有很高的收入,则衡量这个群体的平均收入水平,是用算术平均数好,还是中位数好?2.假定一个小公司雇用了8个人,每人每个月挣1500元~2500元,老板每个月付给自己15000元,他报告给他人说他的公司职员的平均工资是3400元。你认为这个数据的算法有问题吗?第14页,共44页,2023年,2月20日,星期一2023/4/1414四分位数

中位数所有单位被等分为两部分,因而被称为二分位数。类似于求中位数,我们还可求出四分位数、十分位数、百分位数。将总体中的各单位分割成相等的四部分,则这三个分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表第一、第二、第三四分位数。Q1、Q3的算法第15页,共44页,2023年,2月20日,星期一2023/4/1415请问下表中的第一四分位数和第三四分位数为?第16页,共44页,2023年,2月20日,星期一2023/4/1416求下表中的第一四分位数和第三四分为数第17页,共44页,2023年,2月20日,星期一2023/4/1417第三节众数(Mode)Mo次数最多的那个(些)变量值。只与次数有关,可以用于定类、定序、定距、定比资料。1、未分组:排序、观察71,75,83,75,61,68,8171,75,83,74,61,68,8171,75,83,75,83,68,81第18页,共44页,2023年,2月20日,星期一2023/4/14182、分组单项式——观察组距式:

众数组的次数与下一组的次数之差;

众数组的次数与上一组的次数之差.第19页,共44页,2023年,2月20日,星期一2023/4/1419人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00下表中的众数?第20页,共44页,2023年,2月20日,星期一2023/4/1420求下表中的众数第21页,共44页,2023年,2月20日,星期一2023/4/14211、众数仅受上下相邻两组频数大小的影响,不受极端值影响,对开口组仍可计算众数。2、受抽样变动影响大。3、众数不唯一确定。4、众数标示为其峰值所对应的变量值,能很容易区分出单峰、多峰。因而具有明显偏态集中趋势的频数分布,用众数最合适3.众数的性质第22页,共44页,2023年,2月20日,星期一2023/4/14224.1某报告称某社区居民2004年的平均年收入为5万元,你会怎样去理解这个数据?

假如说该社区年收入的算术平均数为5万元,你怎样理解?该社区年收入的中位数为5万元,你怎样理解?该社区年收入的众数为5万元,你怎样理解?第23页,共44页,2023年,2月20日,星期一2023/4/1423第四节几何平均数、调和平均数(了解)1.几何平均数(对数平均数)geometricmean

Mg:N个变量值连乘积的N次方根。(不能为0)适用:1、计算某种比率的平均数。

2、计算大致具有几何级数关系的一组数字的平均数:经济指标的平均发展速度。简单几何平均数:加权几何平均数:第24页,共44页,2023年,2月20日,星期一2023/4/1424例:1.求3,9,27,81,243这些数字的几何平均数。2.某笔银行存款存了十五年,年利率是按复利计算的,期间年利率有所波动。其中:有2年为5%,有3年为6%,有4年为8%,有6年为10%,求这笔存款的平均年利率。算术平均数不小于几何平均数第25页,共44页,2023年,2月20日,星期一2023/4/14252.调和平均数harmonicmeanMh(倒数平均数):N个变量值倒数算术平均数的倒数适用:掌握的情况是总体标志总量而缺少总体单位数的资料时简单调和平均数加权调和平均数第26页,共44页,2023年,2月20日,星期一2023/4/1426各种平均数的关系1.当总体呈正态分布时:2.当总体呈偏态分布时:中位数总在均数和众数之间正偏负偏3.皮尔逊,当偏态不太显著时:4.数值平均数第27页,共44页,2023年,2月20日,星期一2023/4/1427第28页,共44页,2023年,2月20日,星期一2023/4/14281.Definethemean,themedian,andthemode.Specifythepotentiallimitationsofeachone.2.Whyisitbettertocomputeallthreemeasures—themean,median,andmode—thantorelyonone?3.Supposeadistributionofageshasameanof55years,amodeof28years,andamedianof34years.Whatisthelikelyshapeofthefrequencydistributioncurveofthisvariable?第29页,共44页,2023年,2月20日,星期一2023/4/1429练习:1.按连续变量分组,其首组为开口组,上限为1000。已知相邻组的组中值为1200,则首组组中值为(

)。

A.800

B.1100

C.1050

D.9002.若某一变量数列中,有变量值为零,则不适宜计算的平均指标为(

)。

A.算术平均数

B.几何平均数

C.中位数

D.众数3.下列指标中,不受极端值的影响的是(

)。

A.调和平均数

B.中位数

C.算术平均数

D.几何平均数

第30页,共44页,2023年,2月20日,星期一2023/4/1430

判断:

1.连续变量只能编制组距变量数列,且相邻组的组限必须重合。(

)

2.全距是指上限与下限之差。(

)

3.各变量值的次数相同时,没有众数。(

)

4.当总体呈左偏态分布,算术平均数最小,中位数居中,众数最大。(

)

5.均数总是大于中位数。()第31页,共44页,2023年,2月20日,星期一2023/4/14311.某开发商在市场调研过程中,发现希望住房宽敞、舒服的人最多,占到35%,遂决定开发房屋面积以120~140方为主。2、在研究青少年犯罪问题时,发现在调查的500名犯罪少年中,有75%来自离异家庭,因此可以得出结论,离异家庭可能是导致青少年犯罪的原因。加:在大学里抽选了1000名大学生,其中有50%的学生来自农村。因此可以得出结论,农村和城市的学生在高等教育上有相等的入学机会。第32页,共44页,2023年,2月20日,星期一2023/4/14323.根据下列数据,请计算该数据的均数、中位数、众数。人口数(X)户数(f)频率(P)23456785816106410.100.160.320.200.120.080.02合计501.00第33页,共44页,2023年,2月20日,星期一2023/4/14334.在各国有关人口研究中,有衡量人口寿命的数据(mortality),即人们能活多久,一般在多大年纪时死亡。假如在A国,themodeageofmortalityis55,themedianis60,andthemeanis65.InnationB,themeanisalso65,butthemodeis75andthemedianis70.(1)请画出两个国家人口寿命的频数曲线。(2)比较两个国家的数据,哪个国家的人口显得更长寿?第34页,共44页,2023年,2月20日,星期一2023/4/14345.下列数据是经过统计后的有关趋势分布的数值,请绘出分布曲线形状并解释。变量MeanMdMo年龄(岁)303539家庭规模4.13.02.0工作年限1187第35页,共44页,2023年,2月20日,星期一2023/4/1435(补充)相对指标总量指标,相对指标,平均指标。相对指标又称统计相对数。它是两个有联系的现象数值的比率,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。相对指标可以反映现象之间的相互联系程度,说明总体现象的质量,经济效益和经济实力情况,利用相对指标可使原来不能直接对比的数量关系变为可比,有利于对所研究的事物进行比较分析。第36页,共44页,2023年,2月20日,星期一2023/4/1436新华社:2005年1月6日零点,我国第13亿个公民在北京妇产医院出生。出生人口性别比严重失调。出生婴儿性别比通常也称出生人口性别比,是反映婴儿出生时性别结构状况的统计指标:出生100个女婴时,男婴有多少个。世界一般为104~107,但中国2000年表明,119.92,偏离正常值(106)14个百分点。其中一胎性别比为107,二胎的性别比为151.9,三胎的性别比为159.4,海南省为135.64,居全国最高水平。第37页,共44页,2023年,2月20日,星期一2023/4/1437

相对指标数值的表现形式一、有名数由两个性质不同而又有联系的绝对数或平均数对比计算所得的相对数,多为复合计量单位。人/亿元、人/平方公里二、无名数由两个有联系的绝对数或平均数对比计算所得的相对数,只要没有单位的,都是无名数。系数、倍数、比重、比率、成数、百分数、千分数等。第38页,共44页,2023年,2月20日,星期一2023/4/14381.系数或倍数。把对比的基数抽象为1而计算的相对数。当分子分母的差别不大时,用系数;当分子分母的差别很大时,常用倍数表示。2.比重。是对结构相对数的表达。总体中某类单位数除以总单位数。比重的值不会大于1。3.比率。是相对数中最基本的概念,可以用任何被认为是方便的基数来表示。如增长率、利润率等。但有一些约定俗成的基数用法。4.成数。将对比的基数抽象为10计算的相对数。5.百分数。将对比的基数抽象为100而计算的相对数。第39页,共44页,2023年,2月20日,星期一2023/4/1439结构相对数

结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。事物内部各个不同部分的构成情况,决定着事物的特征和本质;用结构相对数进行对比分析,可使我们比较准确地把握事物的特征和本质。利用结构相对数可以衡量研究对象内部各部分间比例是否合理,协调。第40页,共44页,2023年,2月20日,星期一2023/4/1440

表12000年广东省外来人口的原居住地构成(%)

根据表中数据,把乡镇的村委会视为农村,82.6的外来人口来自农村,其中来自外省的外来人口接近90%来自农村。从广东省的情况可以看到农民的外流,同时也可以根据外来人口的职业变化知道,大部分外流人口通过人口迁移达到改变职业的目的。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论