社会统计学-6参数估计1大数定律、中心极限定理和抽样分布_第1页
社会统计学-6参数估计1大数定律、中心极限定理和抽样分布_第2页
社会统计学-6参数估计1大数定律、中心极限定理和抽样分布_第3页
社会统计学-6参数估计1大数定律、中心极限定理和抽样分布_第4页
社会统计学-6参数估计1大数定律、中心极限定理和抽样分布_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6讲

参数估计本讲概要大数定律、中心极限定理和抽样分布参数估计样本容量的确定1.大数定律、中心极限定理和抽样分布要研究随机现象的规律性,必须做大量的观察或试验。对于随机现象而言,的表现纯属偶然,但通过大量的观察或试验,可以发现随机现象表现出一定的规律性。这种规律性的出现是由于在大量观察或试验的过程中,随机现象的各种偶然性在一定程度上相互抵消、相互补偿。因此,大量观察或试验的结果表现出来的规律性会非常稳定。(1)大数定律大数定律:设m是在n次独立观察中事件A出现的次数,p是事件A在一次观察中出现的概率,则对于任意正数ε,有当n足够大

件A出现的频率将无限接近于其发生的概率,即频率的稳定性。Law

of

Large

Numbers:

Comparing

Relative

versusAbsolute

Frequency

of

Coin

FlipsIf

you

wereto

flip

acoin

10,000

times,

you

would

expect

the

number

ofheads

tobeapproxima

y

equal

to

the

numberof

tailswhenusing

afair

coin.

Theabsolute

difference

plot

can

show

qui

arge

differences

in

absolute

terms,

,

asthe

number

of

tosses

increases.

In

comparison,

the

relative

difference

plot

showsthat

in

relative

terms,

,

the

differenceconverges

to

zero.This

Demonstration

showcases

the

law

of

large

numbers,

a

key

theorem

inprobability

theory,

that

describes

the

result

of

performing

the

same

experiment

alarge

number

of

times.

According

to

the

law,

the

average

of

the

results

obtainedfrom

a

large

number

of

trials

should

be

close

to

the

expected

value,

and

will

tendto e

closer

as

more

trials

are

performed.

For

this

Demonstration,

thinkaboutthe

simple

case

of

tossing

a

fair

coin.

If

each

flip

is

independent

of

the

next(so

that

the

result

of

one

flip

does

not

change

the

probabilities

of

seeing

heads

ortails

on

the

next

flip),

then

the

proportion

of

heads

in

tosses

should

get

close

to0.5

as

gets

large.(2)中心极限定理大数定律和切比雪夫大数定律说明了在大量观察的情况下,随

量特征值的稳定性,即频率稳定率,均值稳定于数学期望。中心极限定理则说明了在大量观察的情况下,随的特征值在分布上所表现的稳定性。具体到抽样量来说,只要样本量足够大,不管总体的分布如何,样本均值的分布都将是已知的,即服从正态分布。这就为通过样本来研究未知总体奠定了理论基础。共有10名工作人员,他们的工作年限分别为:6789101112131415随机抽取3人,则样本均值的分布特征可以表示为右图。(3)抽样分布抽样分布是所有样本指标(如均值、比例、方差等)形成的分布。它是根据概率原则而成立的理论性分布,显示由同一总体中反复抽取样本时,各个可能出现的样本统计量的分布情况。抽样分布的概念要点:①抽样分布是一种理论概论分布;②

抽样分布中的随 量是样本统计量,如样本均值、样本成数等;③结果来自容量相同的所有可能样本。例:共有10名

,他们的工作年限分别为:6

7

8

9

10

11

1213

1415随机抽取3人,计算均值的抽样分布。2.参数估计推论统计:根据局部资料(样本资料)对总体的特征进行推断。统计推论具有两方面的特点:一方面由于局部资料来源于总体,因此局部资料的特性在某种程度上能反映总体的特性;但另-方面由于社会资料的随机性,即抽样的结果不是唯一的,又使得一次抽样结果不能恰好就等于总体的结果。推论统计可分为两大类别:①参数估计:根据一个随机样本的统计值来估计总体的参数值;②假设检验:首先对总体参数作出某种假设,然后以一个随机样本的统计值来检验这个假设是否成立。(1)点估计点估计:也称点值估计,是从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。如果估计量具有无偏性、一致性和有效性,就可以认为这种统计量是总体参数的合理估计或最佳估计。1)求点估计值的标准①无偏性:要求统计量抽样分布的均值恰好等于被估计的参数值。换句话说,从最终的结果来看,估计量的数学期望就是参数本身。注意,这里所说的并不是任何一个特定样本结果的值。根据这一定义,随机样本的就是总体均值μ的无偏估计量,因为的抽样分布的均值或期望值就是μ,即

,然而这并不意味着,的任何一个特定值都等于μ。②有效性:要求估计值的抽样分布有较小的分散性,即选择抽样分布的标准差较小的统计量作为估计量,因为,才能保证一次抽样的结果就能以较高的概率接近待估的总体参数。③一致性:要求统计量随着样本容量n的增大以更大的概率接近被估计参数。2)点估计值的计算①总体均值的点估计使用样本均值:②总体方差的点估计使用样本方差:(2)区间估计点估计是用一个数值估计总体参数的值,它没有给出估计值接近总体未知参数程度的信息,所以无法判断误差的大小。区间估计则对此进行了改进,它是根据样本的观察值给出总体参数的估计范围,同时给出总体参数值落在这一区间的概率。有关区间估计的几个概念:①置信水平:总体参数落在某区间内的概率。②置信区间:为了增加参数被估计到的信心而在点估计两边设置的估计区间。③显著性水平:总体参数未落在置信区间内的概率,它是用置信区间来估计的不可靠程度,用α表示。置信区间与置信水平的关系:置信水平愈高,则相应的置信区间也愈宽。④抽样平均误差(标准误)抽样平均误差:样本均值抽样分布的标准差,它反映在参数周围抽样平均值的平均变异程度。它的值等于总体标准差除以样本大小的平方根,即:1)

单个总体

的情况为总体设已给定置信水平为1-α,并设的样本,

分别为样本均值和样本方差。①

已知,则在1-α的置信水平上,总体均值μ的置信区间为:例:想要了解某班学生的从中随机抽取一个样本,好友数量,假设满足正态分布,,若已知总体方差为25的情况下,求显著性水平为0.05时的置信区间。所求置信区间=② 未知,则无法使用①中的方法,因其中含有未知参数

。考虑到

的无偏估计,且有可得:→置信水平为1-α时,μ的置信区间为:例:想要了解某班学生的从中随机抽取一个样本,好友数量,假设满足正态分布,,求显著性水平为0.05时的置信区间。所求置信区间=③方差

的置信区间(选学)由,可得→置信水平为1-α时,方差的置信区间为:2)两个总体

的情况①

均为已知时,两个总体均值差的置信区间由

可知,置信水平为1-

α时两个总体均值差

的置信区间为:②但为未知时,两个总体均值差的置信区间由可知,置信水平为1-α时两个总体均值差的置信区间为:例:为了比较两所学校的学生身高,随机抽取甲校10名学生,其均值为167cm,标准差为12cm;随机抽取乙校15名学生,其均值为166cm,标准差为10cm。假设两校学生的身高都近似服从正态分布,且方差相等。求置信水平为0.95时的两校学生身高均值之差的置信区间。3)总体成数的估计①总体成数p的点估计如果在样本容量为n的简单随机抽样中,对于所要研究的事件A共出现m次,则样本成数

为总体中A的成数p的点估计值,且有:②大样本总体成数p的区间估计区间估计公式:在1-α的置信水平下,大样本总体成数p的置信区间为:在p未知时,可用代替p。例:某高校100人抽样,60人使用

,求该校学生中使用的成数p的置信区间(α

=

0.05)。所求置信区间=4.抽样误差样本容量的确定1)抽样误差由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。我们平时想像的抽样误差可能是针对某个具体的样本的检测结果与总体真实结果的差异而言的,然后统计学上的抽样误差描述的是所有样本可能的结果与总体真值之间的平均性差异。影响抽样误差的因素:①抽样单位的数目:数目越大,样本越接近总体。②总体被研究标志的变异程度:抽样误差和总体标志的变异程度成正比变化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论