第二章 描述统计:数量方法(课件)_第1页
第二章 描述统计:数量方法(课件)_第2页
第二章 描述统计:数量方法(课件)_第3页
第二章 描述统计:数量方法(课件)_第4页
第二章 描述统计:数量方法(课件)_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章描述统计:数量方法STAT统计实例

古埃及男性头骨样本的最大宽度均值:公元前4000年128.67(毫米)

公元150年133.33(毫米)离差:133.33–128.67=4.66(毫米)结论:1.智力水平的提高;2.古埃及人与来自其他地区的人们通婚的结果。公元前4000年公元150年131,119,138,125,129,126,131,132,126,128,128,131136,130,126,126,139,141,137,138,133,131,134,129第二章描述统计:数量方法STAT

大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允许的简化。

我们可以用“平均”、“差距”或百分比等来概括大量数字。

由于定性变量主要是计数,比较简单,常用的概括就是比例或百分比。下面主要介绍关于定量变量的数字描述。第二章描述统计:数量方法STAT第二节集中趋势与离中趋势一、概念

变量分布特征可从三方面加以描述:一是变量分布的集中趋势,反映变量分布中各变量值向中心值靠拢或聚集的程度;二是变量分布的离中趋势,反映变量分布中各变量值远离中心值的程度;三是变量分布的形状,反映变量分布的偏斜程度和尖陡程度。1.集中趋势:越靠近中间水平,出现的频数越多,反之亦反。2.离中趋势:离开并分散在中间水平两侧的趋势。按年龄分组(岁)人数(人)38394041421030704020合计170第二章描述统计:数量方法STAT二、生活中的均值理念与思维■生活:减肥;饮食平衡;阴阳互补。■为人处世:中庸之道(居安思危,得理让人三分,不卑不亢,不偏不激)。■冶理国家:培养中产阶级,反对两极分化;为大多数人谋利益;■政治:既反“左”也反“右”。■企业经营:有赔有赚,平均利润。三、均值(平均指标)的定义第二章描述统计:数量方法STAT

1.定义:反映总体一般水平的代表值。??均值反映了数据的数量集中的特征,是数据偶然性、随机性特征相互抵消后的稳定数值,反映了一些数据必然的特点。

2.特点(1)消除离差;(2)找出中心。第二章描述统计:数量方法STAT四、均值的种类第二章描述统计:数量方法STAT第三节计算平均数一、算术平均数(Mean,均值)※1.含义:数据的重心测度。

[例]10人年龄:15,16,16,17,17,17,18,18,18,18。求平均年龄。2.计算公式

(1)资料未分组:第二章描述统计:数量方法STAT(2)分组资料--单项数列:第二章描述统计:数量方法STAT(3)分组资料--组距数列:

[例]11人年龄:15,17,19,20,22,22,23,23,25,26,30。求平均年龄。结论:以组中值代替x尔后计算。第二章描述统计:数量方法STAT2.注意的问题

■权数:权衡轻重的数“f或f/f”学术权威;行政首长权力

[例]“十一”期间10名同学的旅游地点选择:黄山5人,武夷山2人,泰山2人,老福山1人。

综合评价中权数的运用第二章描述统计:数量方法STAT

■是非标志(成数、比率)的平均数第二章描述统计:数量方法STAT■算术平均数的影响因素■算术平均数的数学性质第二章描述统计:数量方法STAT3.评价(1)测度数据的重心位置。3637383940年龄(x)人数(f)363738394011111(2)■Mean=38离差:2+1=1+2■Mean=38.3333离差:2.3333+1.3333+0.3333=0.6667+1.66672(2)受极值影响很大。36,37,38,39,40,80Mean=46第二章描述统计:数量方法STAT

[例]2000年哈佛大学研究生部6个最大专业录取情况如下:第二章描述统计:数量方法STAT二、调和平均数

1.定义:变量值①倒数②的算术平均数③的倒数④

2.公式推导第二章描述统计:数量方法STAT

[例]某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),某人早、中、晚各买1元,求平均价格。

[原型公式]平均价格=总金额/总数量

→?第二章描述统计:数量方法STAT

3.加权调和平均数金额(m=xf)5(m1)1(m2)1(m3)7第二章描述统计:数量方法STAT

4.H是Mean的变形

当m=xf时,问:当m1=m2==mn时,简单H与加权H计算的结果相等否?令m1=m2==mn=A第二章描述统计:数量方法STAT

[例]某企业的月工资资料如下,试计算其月平均工资。工资等级月工资(x)工资总额(m)123456008001000120016003000040000500004800016000合计184000第二章描述统计:数量方法STAT三、几何平均数

1.定义:n个变量值(比率)乘积的n次方根。

2.公式

加权

式见教材

[例]某厂由三个流水作业的车间构成,已知第一车间加工合格率为95%,第二车间为90%,第三车间为98%,求该厂三个车间平均加工合格率。第二章描述统计:数量方法STAT四、算术平均数、调和平均数、几何平均数的数学关系三者都是幂平均数的一种。幂平均数的定义是:

当t=1时,幂平均数就是算术平均数;当t=-1时,幂平均数就是调和平均数;当t趋向0时,幂平均数的极限形式就是几何平均数。由于幂平均数是单调递增函数,所以t值越大幂平均数越大。因此单从数学意义上看,三者的大小关系是:

H≤G≤Mean

但实际应用中这样的比较往往没有意义。因为任何一个计算对象一般都只适合采用一种方法来计算平均数,即不同的平均数计算方法适合于不同的计算条件,必须加以正确的选择。第二章描述统计:数量方法STAT

[例]两名同学的三门功课考试成绩如下,请问应录取谁?A同学:85,75,90;B同学:50,100,100。

总成绩标准:A250分;B250分。

平均数标准:第二章描述统计:数量方法STAT五、位置平均数(一)中位数(Median)

1.定义:中间位置对应的那个数Me测度数据的中心。

[例]某科室9人年龄:24,25,25,26,26,27,28,29,55

排序:X1,X2,X3,X4,X5,X6,X7,X8,X9

2.计算(1)资料未分组时,中位=(n+1)/2;

当n为偶数时?[例]9人年龄:24,25,25,26,26,27,28,29,55Mean=29.44岁[例]9人年龄:10,24,25,25,26,26,27,28,29Mean=24.44岁

结论:Mean不稳健(很灵敏)。第二章描述统计:数量方法STAT(2)资料为单项式数列时中位=(f+1)/2=12.5;24个人年龄的Me=17(岁)年龄人数(f)向上累计向下累计15(下)16171819(上)249632(第1~2)6(第3~6)15212424221893合计24(f)————第二章描述统计:数量方法STAT(3)组距式数列中位=f/2??第二章描述统计:数量方法STAT

506070(L)80(U)90100

103060110150180xy第90个人Me=L+x=U-y(Sm-1)Me组变量值呈均匀分布50人/10分=5人/分第二章描述统计:数量方法STAT

3.注意的问题

[例]两组数据为:A.1,2,3,4,5;B.1,2,3,4,18。

A.Me=3,Mean=3;B.Me=3,Mean=5.6■比较稳健;■利用信息不充分;

■在有极值的情况下,中位数更能反映数据的一般水平。

[例]2000年美国较富裕三州的个人平均收入(Mean)及收入中位数(Me)位次资料如下。请解释为何纽约州的收入中位数比其它州低许多。州个人平均收入个人收入Me康涅狄格新泽西纽约第1位第2位第4位第7位第2位第29位第二章描述统计:数量方法STAT

[例]在一项城市住房问题的研究中,研究人员对某市抽样调查了300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”Me=“一般”说明中心和重心的不同。类别户数(f)向上累计非常不满意不满意一般满意非常满意2410893453024132225270300合计300(f)——第二章描述统计:数量方法STAT(二)众数(Mode)

1.定义:出现次数最多的那个数Mo(1)20,15,18,20,20,22,20,23;(2)20,20,15,19,19,20,19,25;(3)10,11,13,16,15,25,8,12;

2.计算

找位置:确定Mo组;

确定众数:Mo=40码;表述:170双售出鞋子鞋码的Mo为40码。特点:峰顶对应的变量值。第二章描述统计:数量方法STAT[图示]383940414280604020第二章描述统计:数量方法STAT(2)组距式数列找峰顶:确定Mo组;70<Mo<80

符号含义:L为Mo组的下限,U为上限;i=U–L;

1=fm–fm-1;2=fm–

fm+1。第二章描述统计:数量方法STAT成绩4050607080901005040302010人数AGFLUMo=L+x=U-yBCEDOxy第二章描述统计:数量方法STAT405060708090100成绩5040302010人数LUMo=L+x=U-yAGFOBCEDxy第二章描述统计:数量方法STAT

3.注意的问题[例]两组数据资料如下:A.20,15,18,20,20,22,20,23;B.20,15,18,20,20,22,20,57;■比较稳健;■信息利用不充分;■可用于反映质量变量的集中趋势。

[例]血型:ABOAB人数:215122N=40

[美国统计资料]当代美国的平均人是女性,平均每个女性有2.1个孩子,这些女性住在平均价值为8万美元的住宅中。第二章描述统计:数量方法STAT[例]在一项城市住房问题的研究中,研究人员对某市抽样调查了300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”

Me=“一般”Mo=“不满意”应以哪种平均数作为决策依据?类别户数(f)向上累计非常不满意不满意一般满意非常满意2410893453024132225270300合计300(f)——第二章描述统计:数量方法STAT六、Mean、Me和Mo之间的关系

Me和Mo“中位和峰顶”位置平均数;Mean“重心”计算平均数。(一)数量关系

1.对称分布第二章描述统计:数量方法STAT

2.偏态分布

Mo=12Me=13Mean=13.05(1)右(正)偏:Mo<Me<Mean第二章描述统计:数量方法STAT(2)左(负)偏Mo=12Me=11Mean=10.95Mean<Me<Mo第二章描述统计:数量方法STAT

3.

卡尔•皮尔逊经验公式:适度偏斜情况下,Mo与Me之间的距离,大约为Me到Mean之间距离的两倍。第二章描述统计:数量方法STAT[例]某工厂需招聘一名工人,甲前往应征。他被告知厂里平均薪金每周300元。然而,当甲工作几天后,竟然没有发现一个工人的工资超过每周100元,那么平均工资怎么可能是每周300元呢?第二章描述统计:数量方法STAT第四节变异程度的测度一、概念与作用(一)离中趋势测度:反映各变量值差异程度的测度。在很多情况下,人们更关心各变量值与平均数之间的离差。[例]1999年某市声称其人均住房面积达到10平方米的水平。

[例]统计学家:舒适的平均体温。第二章描述统计:数量方法STAT(二)作用1.衡量平均数代表性的大小。2.反映变量值分布的离中趋势和分散程度。小组成绩ABC70,70,70,7065,68,72,7534,51,95,100Mean707070离差0,0,0,05,2,2,536,19,25,30平均离差03.527.53.反映现象发展的均衡性和稳定性。第二章描述统计:数量方法STAT二、变异测度方法(一)全距(极差,Range)

R=Xmax–Xmin小组成绩(分)MeanR(分)ABC70,70,70,7065,68,72,7534,51,95,10070707001066A.24,25,25,26,26,27,28,29,55Mean=29.44岁,RA=31岁B.11,17,19,20,38,39,39,41,41Mean=29.44岁,RB=30岁第二章描述统计:数量方法STAT(二)平均差(meandeviationA.D)

1.定义:变量值与其Mean的平均离差。姓名成绩x人数fABCD656872751111合计280452250522514第二章描述统计:数量方法STAT[例]成绩x人数f656872752583合计185.612.611.394.39——5.612=11.222.615=13.051.398=11.224.393=13.1748.66第二章描述统计:数量方法STAT

2.判定准则小组成绩(分)MeanA.D(分)AB65,68,72,7534,51,95,10070703.527.5(1)比较全面、灵敏。A.65,68,72,76Mean=70.25分,A.D=3.75分;B.65,68,72,90Mean=73.75分,A.D=8.125分。(2)绝对值运算给数学处理带来不便。第二章描述统计:数量方法STAT(四)方差(variance)与标准差(standarddeviation)※

1.方差2:离差平方的Mean;2.标准差:平均离差。姓名年龄x人数fABCD151822251111合计8045岁225025岁2442558第二章描述统计:数量方法STAT[例]

成绩人数f60以下60~7070~8080~9090以上2816104合计40

x5565758595

xf11052012008503803060-21.5-11.5-1.58.518.5924.5105836722.51369 4110第二章描述统计:数量方法STAT

2.公式归纳:离差平方的平均数2。第二章描述统计:数量方法STAT

3.判定准则小组成绩(分)Mean(分)AB65,68,72,7534,51,95,10070703.8128.20第二章描述统计:数量方法STAT[例]第二章描述统计:数量方法STAT[例]用计算器统计键计算(1)ON/C2ndFSTAT(2)数据录入4510DATA(屏幕:10)5520DATA(屏幕:30)6540DATA(屏幕:70)…………9530DATA(屏幕:190)第二章描述统计:数量方法STAT

4.是非标志(成数、比率)的方差与标准差[例]试据以下资料计算某班考试成绩及格率的Mean与2。标准化是非变量10成数(比率)P=N1/N=0.6Q=N0/N=0.41第二章描述统计:数量方法STAT

5.方差加法定理(※)(1)总方差=组间方差+平均组内方差(2)总方差:变量值与其总体Mean所计算的方差。[例]11人日产量(件)如下:15、17、19、20、22、22、23、23、25、26、30。试求其总方差。第二章描述统计:数量方法STAT第二章描述统计:数量方法STAT(4)平均组内方差:各组内方差的平均数。第二章描述统计:数量方法STAT[例]11人日产量(件)如下15,17,19,20,22,22,23,23,25,26,30。第二章描述统计:数量方法STAT[例]甲、乙两班同考一门课,甲班用百分制计分,乙班用五分制计分,资料如下。试据此计算有关指标以说明哪个班学生的成绩更整齐。第二章描述统计:数量方法STAT(五)变异系数(coefficientofvariation)1.R、A.D、绝对或平均离差;

2.当两组平均数相同时才可使用数据同重心才可直接对比其离散程度。

6568707275

34517095100成绩(分)MeanRA.D65,68,72,7534,51,95,100707010663.527.53.8128.20第二章描述统计:数量方法STAT

3.计算公式总体Mean(Kg)(Kg)/Mean50只羊20头牛1030041040%3.33%个体体重举重举重/体重某人某蚂蚁120斤1克60斤6克50%600%第二章描述统计:数量方法STAT[例]已知下列资料,试比较哪组数据更集中(整齐)。第二章描述统计:数量方法STAT第四节相对位置的测度和异常值的检测一、Z分数(z-score,标准分数)[问题的提出]从10个人中抽取一人A,从10只蚂蚁中抽取一只B,请问谁的体重相对更重?样本平均体重标准差个体10个人10只蚂蚁65公斤5克4公斤0.5克A:68公斤B:6克第二章描述统计:数量方法STAT

1.公式[例]三人成绩为:2,3,4。其Mean=3分,σ=0.8165分。第二章描述统计:数量方法STAT[例]A、B两位学生六门课程高考成绩及全部考生相应的平均分数和标准差如下(单位:分)第二章描述统计:数量方法STAT二、切比雪夫定理(Chebyshev’theorem)1.定理:在任何数据集中,出现在均值左右Z倍标准差范围之内的数据比例至少为(1–1/Z2)。2.作用:比例推断。[例]有一组顾客购物付款时等候时间的资料,已知等候时间的均值为4分钟,标准差为0.9分钟,则Z区间(分钟)数据出现比例1234()=(3.1,4.9)(

2)=(2.2,5.8)(

3)=(1.3,6.7)(

4)=(0.4,7.6)至少为0%至少为75%至少为89%至少为94%第二章描述统计:数量方法STAT三、经验法则(empiricalrule)

当数据呈钟形分布时,有-3-2-1123Z区间数据出现比例1236(

)(

2)(

3)(

6)68.27%95.45%99.73%99.9999998%第二章描述统计:数量方法STAT[应用]质量管理。规格界限合格品出现比例(%)不合格品出现比例699.7399.9999998万分之2710亿分之2[医学处方]3管理允许2万张处方中有一张错误;6管理允许25年的处方中有一起错误。[新生儿护理]3管理允许每1万五千新生儿中,有一例出生时失手跌落到地面;6管理则允许为100年3例。[可视电话]3管理允许每周有10分钟的差错(声音与画面不符、图像模糊等);6管理则100年仅有6秒钟的差错。[外科手术]3管理允许每周有500例医疗事故;6管理为每20年才有一起医疗事故。第二章课外阅读案例STAT

护士们对工作的满意程度分析

对于此案例,首先应通过抽样调查获取护士对工作、工资、升职机会的满意程度的数据(略)。由于护士们对工作、工资、升职机会的满意程度的评分标准不尽相同,我们可采用以下几种方法进行分析:一、利用描述统计指标概括样本数据的特点1.平均数指标:X(工作)=79.8X(工资)=54.46X(升职机会)=59.08■从平均数指标来看,可以认为,护士们对她们所从事的“护士”这份职业相对来说是最满意的,而对工资却不尽满意,第二章课外阅读案例STAT对于升职机会,一般满意。2.全距:R(工作)=32;R(工资)=65;R(升职机会)=763.平均差:A.D(工作)=7.328;A.D(工资)=11.4016;A.D(升职机会)=12.684.方差:2(工作)=68.69388;2(工资)=217.478

2(升职机会)=266.03435.标准差:

(工作)=8.2882;(工资)=14.7471;

(升职机会)=16.3106第二章课外阅读案例STAT6.标准差系数:

V(工作)=0.10386;V(工资)=0.2703;V(升职机会)=0.2761■从变异指标来看,护士们对她们从事职业的满意程度可归纳为:对护士这份工作是最满意的,其次是工资,最后对升职机会是最不满意的。第二章课外阅读案例STAT二、利用散点图描述各指标

■对工作满意程度的评分

第二章课外阅读案例STAT■对工资满意程度的评分第二章课外阅读案例STAT■对升职机会满意程度的评分

■综合上面3个散点图,可以看出:护士们对于护士这份工作的满意程度是最高的,因其分布比较集中;其次是升职机会;最后是工资。第二章课外阅读案例STAT三、满意程度分析

对于三种标量,按满意程度分值分成几个等级:对工作满意程度评分分值满意程度比重%60—70满意870—85比较满意5685—95非常满意36第二章课外阅读案例STAT对工资满意程度评分分值满意程度比重%40以下很不满意1840—50不满意2050—60一般2860—75满意2475以上很满意10第二章课外阅读案例STAT对升职机会评分分组满意程度比重%40分以下很不满意1040——60不满意4060——70满意2670——80很满意1480分以上非常满意10第二章课外阅读案例STAT这样分组不一定合理,但从各个分值还是可以看出护士们对于她们工作的满意程度:首先,对于“护士”这个职业来说,她们是最满意的,即就其工作性质来说,她们觉得自己胜任这份工作。我们可以认为她们至少不讨厌这份工作。其次,从样本数据看,最不满意的是工资,评分在60以上的只占34%,而对于升职机会来说,却占到了50%。因此可以认为,她们最不满意的是从事这份职业所拿到的工资。(一)对工作满意的原因首先应该是这份职业本身的性质:护士属于服务性行业,且需要有一定的专业知识,具有很强的专业性,还要求这些医务人员有较强的责任心,有爱心,有时候甚至需要忘我的牺牲第二章课外阅读案例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论