(5.1.15)-第五讲 正态分布社会调查研究方法_第1页
(5.1.15)-第五讲 正态分布社会调查研究方法_第2页
(5.1.15)-第五讲 正态分布社会调查研究方法_第3页
(5.1.15)-第五讲 正态分布社会调查研究方法_第4页
(5.1.15)-第五讲 正态分布社会调查研究方法_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第五讲:正态分布2学习目标掌握正态分布的特性;正态分布曲线下面积的含义;标准分的计算和应用;利用标准正态分布表计算概率。理解大数定理和中心极限定理3一、什么是正态分布?4从“分布”说起5☆直方图——用长条的面积来表示频次或相对频次;☆折线图——用直线连接直方图中条形顶端的中点;当组距逐渐减小时,折线将逐渐平滑为曲线。6峰点(Peak)研究单峰多峰7几种常见的频数分布曲线对称分布右偏分布左偏分布正J型分布反J型分布U型分布8一、正态分布曲线

xφ(x)91.1什么是正态分布?1、由德国数学家高斯提出,也叫高斯分布;2、自然界、社会经济生活中大量存在的分布规律,如人们的身高、体重、智商等都比较接近正态分布;3、经典统计推断的基础;4、在所有的分布中,正态分布居于首要位置,由正态分布出发,可以导出一系列重要的抽样分布,如T分布、X2分布、F分布等;xf(x)101.2正态分布的基本特征特征一:一个高峰特征二:一条对称轴特征三:一条渐近线xf(x)M0=Md=μ

众值=中位值=均值111.3正态分布的数学表达式φ(x)=随机变量X的频次(概率密度)=总体标准差;

=总体方差;

=总体均值(圆周率)=3.14159;e(自然对数的底)=2.71828x=随机变量的取值(-

<x<

)通过数学推导,可得X的数学期望E(X)=u,方差D(X)=

121.4两个参数的影响(μ,σ)位置参数均值μ标准差σ

形状参数131.4.1μ对正态曲线的影响μ1

μ2

μ3μ1

<μ2<

μ3141.4.2

对正态曲线的影响xφ(x)CAB曲线A和B的比较16正态曲线的位置由均值μ决定;正态曲线的形状“高,矮,胖,瘦”的特点由标准差σ决定;

当σ较小时,曲线“高”且“瘦”;当σ较大时,曲线“矮”且“胖”。因此,当随机变量x服从正态分布,习惯上又记作:X-N(u,σ).由公式,可推出正态分布具有如下特性:(1)正态曲线是单峰\对称的,即它的众数\中位数和均值是相等的,换言之,图形中均值u同时也是众数和中位数;(2)X与均值的差异(|x-u|)越大,对应的f(x)就越小,但不会等于零,即曲线两端呈现逐渐下降的趋势,但不会完全接触底线(横轴);(3)u决定图形式的位置,σ决定图形陡峭平缓(或高耸扁平)程度.在σ一定的情况下,若u增大,图形右移,若u减小,图形左移,但整个图形形状不变.在u不变的情况下,σ越小,对应的图形越陡峭;σ越大,对应的图形越平缓.18二、正态曲线下的面积192.1正态曲线下面积的涵义随机变量的频次总和;位于正态曲线和横轴之间的总面积可以表示一个单位的整体,即包含了总体中的全部(100%)的个案.正态曲线下包含的每一块面积,可以表示对应的个案数占总数的比例的大小.一般把正态曲线下的总面积约等于1,这时一定区间内的频次分布表现为概率分布。对于正态分布曲线下的任一面积,如a<x<b所对应的面积为:212.2正态曲线的一个重要性质

无论正态曲线具有哪种均值和标准差,在均值和横坐标某一点的距离内(用标准差来表示)曲线下的面积是常数。

下图说明此意。22正态曲线下的面积(图)

-2

+2

2.3%2.3%

-

+

95.44%68.26%232.3几个典型取值区间的概率值P(

-≤ξ≤

+)=0.6826;P(

-2≤ξ≤

+2)=0.9544;P(

-3≤ξ≤

+3)=0.9974;24三、标准正态分布253.1什么是标准正态分布——以标准差为单位的正态分布一般称为标准正态分布(standardizednormaldistribution)263.2标准正态分布的重要性

——简化统计分析▲一般的正态分布取决于均值

和标准差;

▲计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的;▲若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表.273.3标准分(Standardscores)公式:Z值代表每个X值在标准正态分布上的数值。283.4标准正态分布的表达式正态分布的表达式为:N(,

)标准正态分布的表达式为:N(0,1)标准正态分布是一般正态分布的特例,即=0,

=1的正态分布。293.5标准分的实际意义各总体之间可以通过标准分进行合理的比较不同总体间综合指标的比较如:甲城市居民月收入的均值为3000元,标准差为500元;乙城市居民月收入的均值为4500元,标准差为1000元。若甲城市的居民A的月收入为4000元,乙城市居民B的月收入为5500元。看起来B的收入比A的高,但与本地其他居民相比较,结果可能有所不同。这时候就需要把A与B的收入都转换成标准值,进行更加直观的比较。结果是?303.6标准分的应用例题:李明参加了全校新生入学摸底考试,数学得了90分,英语得了75分。假定全校新生数学成绩的均值

=85分,标准差=10分;全校新生英语成绩的均值=60分,标准差=5。这次考试李明哪门科目考试考得好一些?313.7标准正态分布的面积P(-1≤Z≤

1)=0.6826;P(-2≤Z≤

2)=0.9544;P(-3≤Z≤

3)=0.9974;由于标准正态分布N(0,1)的图形是唯一的,因此使用标准正态分布无须自己计算,只需要学会查表就行了。由于正态分布是对称的,因而标准正态分布表只给出了标准值的绝对值.只要数值相同,无论是正值还是负值,所表示的面积大小都是相同的.当标准值为正数时,所对应的面积在均值的右边;当标准值为负数时,所对应的面积在均值的左边.又由于整个正态曲线包含的面积为1个单位,所以均均值右边的总面积与均值左边的总面积都等于0.5.33四、标准正态分布表的使用344.1标准正态分布表的介绍见教材P369——附录B(不对)卢淑华书P485,附录4标准正态分布表.doc354.2标准正态分布的计算【例5】已知ξ服从标准正态分布N(0,1),求P(ξ

≤1.3)=?解:因为ξ服从标准正态分布N(0,1),可直接查附表B,根据z=1.3,有P(ξ≤1.3)=

1.3=0.9032Xi:大写Ξ,小写ξ读作:克西

36【例6】:已知ξ服从标准正态分布N(0,1),求P(ξ≥1.3)=?解:因为

∞=1,而

∞=P(ξ<1.3)+P(ξ≥1.3)=1因此有P(ξ≥1.3)=1-P(ξ<1.3)=1-

1.3=0.096837【例7】已知ξ服从标准正态分布N(0,1),求P(ξ≤-1.3)=?解:附表四中没有给出Z≤0的

Z

值。根据标准正态分布图形是以Z=0为对称的原理,P(ξ≤-1.3)=1-

1.3=0.096838【例8】已知ξ服从标准正态分布N(0,1),求P(1.3≤ξ≤2.3)=?解:P(1.3≤ξ≤2.3)=

2.3-

1.3

=0.9893-0.9032=0.086139【例9】根据统计,北京市初婚年龄服从正态分布。其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人,其百分比为多少?解:1.年龄换为标准分:Z1=,Z2=2.查表得

Z1=0.50,

Z2=0.8413

Z2-

Z1=0.3413,所以25岁到30岁之间结婚的人,百分数为34.13%.404.3标准正态分布表的使用1.通过标准分公式,将一般正态分布转换为标准正态分布;2.计算概率时,查标准正态分布表;3.对于负的x,可由

(-x)

x

得到;4.对于标准正态分布,即X~N(0,1),有P(aXb)

b

a

P(|X|a)2

a141常用的标准值Z≥1.65,概率P为0.05;Z≥1.96,概率P为0.025;Z≥2.58,概率P为0.005;42五、大数定理和中心极限定理435.1极限定理

简单讲,凡是采用极限的方法(例如,观察次数n趋于无限)所得出的一系列定理统称极限定理。极限定理分为两类:大数定理(Lawoflargenumbers)中心极限定理(Centrallimittheorem)

445.2大数定理【例子】从扑克牌盒中取出一张牌,出现牌“K”的概率是1/13,在取的次数比较少时,出现“K”的频率可能与1/13相差得很大,但是在取的次数很多时,出现“K”的频率接近1/13几乎是必然的。455.2大数定理

这些例子说明,在大量随机现象中,不仅看到了随机事件频率的稳定性,而且还看到平均结果的稳定性。这就是概率论中大数定理的概念。阐明大量随机现象平均结果的稳定性的一系列定理。著名的大数定理:贝努里大数定理和切贝谢夫大数定理

465.2.1贝努里大数定理

多次重复试验,随机事件的频率日趋稳定,具有接近概率的趋势。

475.2.2切贝谢夫大数定理

多次重复试验,随机变量的平均值接近数学期望(即总体均值)。

485.3中心极限定理

任何变量,不管其原有分布如何,如果把它们n个加在一起,只要n足够大,其和的分布必然接近正态分布,均值的分布也接近正态分布。

49

为什么社会经济生活、自然界存在许多随机变量的分布都服从正态分布?请结合中心极限定理来解释。50如果一个现实的量是由大量独立偶然的因素的影响叠加而得,且其中每一个偶然因素的影响又是均匀地微小的话,可以断定这个量将近似地服从正态分布。这就解释了为什么在自然、社会、经济领域里大量存在服从正态分布的随机变量。例如,身高、体重、智商、婚龄等等,因为影响它们的因素都是大量的。

六.运用SPSS检验正态分布1.直方图2.P-P图练习题1.一个正态分布N(120,302)中,有300个变量值在130至150之间,求有多少变量值在130至145之间.2.已知一个正态分布的标准差为6.0,随机抽取一个变量超过45.0的概率是0.02,求:(1)该分布的均值;(2)某一变量值,使95%的变量值都比它大.3.对某大学的学生进行调查发现,平均缺课天数为3.5,标准差为1.2.领导假设该大学的缺课情况服从正态分布,求:(1)一名学生缺课3.5天到5天的概率;(2)一名学生缺课5天

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论