社会统计学-参数估计_第1页
社会统计学-参数估计_第2页
社会统计学-参数估计_第3页
社会统计学-参数估计_第4页
社会统计学-参数估计_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章参数估计统计推论基本概念抽样分布点估计区间估计大样本区间估计6.1统计推论统计推论是根据局部资料(样本资料)对总体的特征进行推断。属于归纳推理的范畴。统计推论的特点:(1)局部反映总体;(2)抽样结果总是存在随机性。统计推论的内容:(1)参数估计(parameter’sestimation)(2)假设检验(Hypothesistest)6.2基本概念总体(Population):是研究对象的全体。可以看作是一个研究对象的集合,又可以看作是所研究的变量的一个分布。例如家庭和家庭收入。总体由个体(调查单位)构成。样本(Sample):从总体中按一定方式将要调查的个体抽出来,就组成一个样本。其中包含的个体数目n称为样本大小或样本容量。简单随机样本:样本中个体的抽取是独立的,且和总体同分布,由此形成的样本即简单随机样本。要研究的总体的特征叫做参数值。要研究的样本的特征叫做统计量。根据样本观测值得到的统计数字叫做统计量的观测值。有时也把它们看作是统计量的本身。统计量的分布即抽样分布。6.3抽样分布总体分布(populationdistribution)是变量X的所有取值形成的分布。但我们在分析中往往不能知道总体分布的情况。1、样本均值的分布(1)总体正态分布,方差已知

反映了统计量围绕总体均值(μ)的分散程度,或者说反映了抽样均值与μ的平均误差水平。所以它又称作抽样均值的平均误差或标准误差。

是由抽样引起的,其大小可以反映统计量的可靠性程度。其标准化后也得到标准正态分布。(2)总体正态分布,方差未知用样本方差作为总体方差的估计值;统计量服从t分布。(3)任意总体,大样本情况在社会现象的研究中,可以不考虑总体分布如何,只要n足够大(≥50),样本均值的分布将确定为一个近似的正态分布。2、样本方差S2的分布样本方差是随机变量,当总体为正态分布时,S2的分布与分布相联系。~

2023/2/57

分布回顾该分布是指一些相互独立、服从标准正态分布的随机变量平方和的分布。即从正态分布总体中抽取出来的样本,经过标准化后,它的平方和服从分布。~(n-1)常用于列联表检验。2023/2/586.4点估计点估计:是以一个最适当的样本统计值来代表总体参数值。具体说,用样本均值作为总体均值的点估计值。用样本方差作为总体方式差的点估计值。估计量如果具有无偏性、一致性和有效性,就可以认为这种统计量是总体参数的合理估计或最佳估计。6.4.1求点估计值的标准无偏性:要求统计量抽样分布的均值恰好等于被估计的参数之值。比如,中心极限定理告诉我们,样本均值抽样分布的均值恰好等于总体均值,因此用样本均值估计总体均值就满足这个标准。但绝不是说任何的值将等于μ。一致性:当样本容量逐渐增加时,统计量越来越接近总体参数。要求统计量随着样本容量n的增大以更大的概率接近被估计参数。有效性:是指统计量的抽样分布集中在真实参数周围的程度。要求估计值的抽样分布有较小的分散性,即选择抽样分布的标准差较小的统计量作为估计量。6.4.2点估计值的计算总体均值的点估计总体方差的点估计值在统计学中,常常用符号“”来表示无偏估计量。数学上可以证明,对于随机样本而言,才是总体方差的无偏估计量,它称为修正样本方差。当Xi表示的是变量,其取值是0和1。如果A类(X=1)出现了m次,我们用样本的成数P作为总体的估计值。[例]工会为了了解春游期间需用几辆公共汽车,在全厂10000名职工中进行了共100人的简单随机抽样调查。统计结果,其中有20名愿意外出春游。假设每辆车可载乘客50名,问估计要预租多少辆公共汽车?用样本成数来估计。[例]研究者要调查某社区居民家庭收入分布的差异情况,现随机抽查了10户,得到样本方差为=200(元2)。试以此资料估计总体家庭收入分布的差异情况。

[解]因为样本容量较小,宜用修正样本方差作为总体方差点估计量。即

===222.26.5区间估计(Intervalestimation)区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。可靠性和精确性(即信度和效度)在区间估计中是相互矛盾的两个方面。

6.5.1有关区间估计的几个概念置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。区分精确性与可靠性显著性水平

α:表示用置信区间来估计的不可靠的概率。置信度(水平)1-α:表示置信区间估计的可靠性(把握度)。例如置信水平取0.90。抽样平均误差与概率度

Z抽样平均误差:样本均值抽样分布的标准差。反映在参数周围抽样平均值的平均变异程度。越大,样本均值越分散。概率度:Z在参数估计中被称为概率度,其大小由

α决定.

显著性水平、置信水平、概率度之间的关系:

α

=0.10时,1-

α

=0.90,Zα/2=1.65

α=0.05时,1-

α

=0.95,Zα/2=1.96

α=0.01时,1-

α

=0.99,Zα/2=2.582023/2/5186.5.2区间估计的做法从点估计值开始,向两侧展开一定倍数的抽样平均误差,并估计总体参数很可能就包含在这个区间之内。置信区间的大小主要由和Z这两个量所决定,并且是2Z。所以参数μ的区间估计就归结为计算这两个量(即就各种抽样分布计算概率度和就各种抽样方式计算抽样平均误差)。

的大小对设置置信区间的范围起着很重要的作用。在同等置信度的情况下,抽样平均误差小,估计区间就缩小了,从而获得对参数较为有效的估计(决定效度的关键因素)。Z则与信度相联系。对参数μ的区间估计的步骤:

1.首先从总体抽取一个样本,根据收集的样本资料求出它的均值。

2.根据合乎实际的置信水平查表求得概率度

3.根据总体标准差和样本容量求出抽样平均误差

4.以均值为基准,向两侧展开Z倍抽样平均误差的区间。根据总体方差是否知道,估计分两种情况。(1)已知(2)未知,用S代替6.5.3大样本,总体均值的区间估计[例]设某工厂妇女从事家务劳动服从正态分布N

,0.662],根据36人的随机抽样调查,样本每天平均从事家务劳动的时间为2.65小时,求μ的置信区间(置信度1-α

=0.95)。

[解]按题意,此为大样本,且总体方差已知,又

n=36,=2.65,=0.66,1-α=0.95。查表得Z=1.96,代入公式有=2.65±1.96=2.65±0.22

因此,有95%的把握,该厂妇女平均从事家务劳动的时间在2.87~2.43小时之间。[例]从某校随机地抽取100名男学生,测得平均身高为170厘米,标准差为7.5厘米,试求该校学生平均身高95%的置信区间。

[解]按题意,此为大样本,且总体方差未知,又n=100,=170,S=7.5,1—α=0.95.查表得=1.96,代入公式有

=170±1.96=170±1.47因此,有95%的把握,该校学生的平均身高在168.5~171.5厘米之间。[习题]从来自“白领犯罪与罪犯生涯:一些初步研究结果”的一项研究报告的数据表明,白领犯罪可能是年纪较大者,并且显示比街头罪犯有较低的犯罪率。给出数据为:白领犯罪发作平均年龄为54岁,n

=100,标准差被估计为7.5岁。建立真实平均年龄的90%置信区间。采用t分布6.5.4小样本,正态总体均值区间估计[例]在一个正态总体中抽取一个容量为25的样本,其均值为52,标准差为12,求置信水平为95%的总体均值的置信区间。

[解]根据题意,总体方差未知,且为小样本,故用t分布统计量。由95%置信水平查t分布表得概率度=(24)=2.064

代入公式得

=52±2.064=52±4.95因此,置信水平95%的总体均值的置信区间是从47.05到56.95。从总体的均值估计过渡到总体的成数估计,其方法和思路完全相同,只要用代替,用代替。6.5.5大样本总体成数的估计[例]假若从某社区抽取一个由200个家庭组成的样本,发现其中有36%的家庭由丈夫在家庭开支上作决定的次数超过半数。试问家庭开支的半数以上由丈夫决定的家庭的置信区间是多少?(置信水平99%)[例]假若从某社区抽取一个由200个家庭组成的样本,发现其中有36%的家庭由丈夫在家庭开支上作决定的次数超过半数。试问家庭开支的半数以上由丈夫决定的家庭的置信区间是多少?(置信水平99%)

[解法一][解法二]2023/2/530n1≥50n2≥50现在从两总体独立地各抽取一个随机样本:只要样本都大于或等于50,则两个样本均值的抽样分布都服从正态分布,根据正态随机变量线性组合的随机变量仍然服从正态分布的原理,则均值差也服从正态分布。6.5.5大样本二总体均值差的估计若总体方差未知,则用样本方差代替总体方差。在大样本的情况下置信度为1-a的(μ1-μ2)的区间估计为:2023/2/533

与单样本成数的区间估计一样,成数差区间估计可以被看作均值差的特例来处理(但它适用于各种量度层次)。即对给定的置信水平(1―α),得两总体成数差(p1―p2)之估计区间为

6.5.5大样本成数差的区间估计2023/2/534

[例]有一个大学生的随机样本,按照性格“外向”和“内向”,把他们分成两类。结果发现,新生中有73%属于“外向”类,四年级学生中有58%属于“外向”类。样本中新生有171名,四年级学生有117名。试在99%的置信水平上,求新生、老生性性格“外向”的成数差的置信区间。2023/2/535

[解]据题意,

新生组的抽样结果为:=0.73,

=027,

n1=171(人)

四年级学生组的抽样结果为:

=0.58,

=0.42,n2=117(人)

由(1―α)=0.99,得Zα/2=Z0.005=2.58,代入上式得

得在99%置信水平上,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论