抽样理论及总体参数估计_第1页
抽样理论及总体参数估计_第2页
抽样理论及总体参数估计_第3页
抽样理论及总体参数估计_第4页
抽样理论及总体参数估计_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样理论及总体参数估计12一、随机抽样的基本概念与方法(一)随机抽样的基本概念

随机抽样是指依据随机性原则和方法,从总体中随机抽取对总体有充分代表性的样本。

随机性原则:A、总体中每个个体相互独立;B、每个个体被抽到的机会均等。

总体和样本

参数和统计量:

;Sr。(二)随机抽样方法1、简单随机抽样

简单随机抽样是完全按照偶然机会抽取一部分个体构成样本。A、抽签;B、随机数码表。3

2、机械抽样

机械抽样也称等距抽样,按一个与研究问题的性质没有直接关系的标志把总体内每一个个体进行编号排序,然后按固定的距离抽取一部分个体构成样本的抽样方法。间隔距离的大小视所需样本容量与总体中个体数目的比率而定。

优点:比简单随机抽样代表性强;

缺点:当总体中不同特性的分布不均匀或呈一定周期性时,机械抽样可能产生系统性偏差。

3、分层抽样

分层抽样也称分类抽样。先按与研究内容有关的因素将总体各单位(或个体)分为不同的等级或类型,即层,然后按比例或不按比例从每一层中再用简单随机抽样或机械抽样的方法抽取一定数量的个体构成样本。

优点:抽样误差小,代表性强。

分层原则:层内个体差异越小越好;层间差异越大越好。44、整群抽样

整群抽样是指从总体中一个群体一个群体地抽取研究对象的抽样方法。

优点:容易组织;

缺点:代表性不强,抽样误差大。

抽样方法的综合运用。二、抽样分布(一)抽样分布的基本概念1、抽样分布及标准误

抽样分布是指样本统计量的概率分布。它是统计推断的理论基础。(平均数的抽样分布、标准差的抽样分布、相关系数的抽样分布等)5

描述所有可能个样本统计量参差不齐程度的量数称为标准误,即抽样误差。也就是某种统计量在抽样分布上的标准差。标准误用符号SE表示。标准误越小,说明样本统计量与总体参数间的差异越小,样本对总体的代表性越强,用样本统计量推断总体参数的可靠性越强。2、自由度

自由度是指可以自由取值的数据的个数,即不受任何约束可以自由变动的变量的个数,一般用符号df表示。

在总体层面上,每个变量在统计层面上没有任何约束,故总体的自由度是N;在样本层面上,对于n个数值构成的样本,它的自由度为:n-1。

原因:

自由度失去的多少取决于计算统计量时实际受约束条件的多少,要据实际条件来决定。6(二)样本平均数的抽样分布1、平均数抽样分布的形态

正态总体:抽样分布服从正态分布;

非正态总体下的大样本:抽样分布接近正态分布。2、平均数抽样分布的平均数

3、平均数抽样分布的标准差(即平均数的标准误)

平均数标准误的求解:A、总体正态分布,总体标准差已知7

依据正态分布理论,我们可以推知样本平均数在多大概率上落在

的范围之内。

B、总体正态分布,总体标准差未知

①对于大样本

可以直接用样本标准差代替总体标准差,即

②对于小样本

所有可能样本的平均数以总体平均数为中心,服从df=n-1的t分布,此时样本平均数的标准误

其中,8

C、总体非正态分布,但样本容量n≥30

对于总体非正态分布,原则上不能使用参数推断的方法进行推论,但对于大样本,尽管总体非正态分布,但样本平均数抽样分布的形态与正态分布差异较小,所以,在大样本情况下,无论总体是否正态分布,也无论总体标准差是否已知,我们都可以认为平均数的抽样分布为近似服从正态,求平均数的标准误都可用公式

三、总体参数的估计(一)点估计

点估计就是用某一样本统计量的值来估计相应的总体参数值。9

好的估计量的基本要求:

无偏性——即没有系统偏差,指若用统一估计量估计多次,其平均值应恰好等于预估计的总体参数值,即偏差之和为0。

有效性——当总体参数的无偏估计值不止一个时,其中统计量的一切可能值方差最小者有效性最高。

一致性——指当样本容量无限增大时,估计值应越来越接近它所估计的总体参数值。(二)区间估计

区间估计是指以一定的概率去说明总体参数落在某一区间的可能性。

描述样本平均数与总体平均数之间的差异用标准误为单位,即

。10

要求按某一可靠度去估计总体平均数的取值区间时,可靠度称为置信水平,区间的界限称为置信界限,置信界限内的区间称为置信区间。

研究中,常以95%和99%的可靠度估计总体参数的置信区间。具体计算如下:

1、总体平均数的区间估计

A、总体正态分布,总体标准差已知时总体平均数的区间估计

此时,样本平均数与总体平均数之间的差异,即样本平均数在所有抽样中的位置可以表示为

当置信度为95%时,即11

当置信度为99%时,

即其置信区间为

例:某小学10岁全体女童的身高呈正态分布,其标准差为6.25厘米,现从该校随机抽取27名10岁女童,测得平均身高为134.2厘米,试估计该校10岁全体女童平均身高的95%和99%的置信区间。

练习:从某正态总体中随机抽取一个样本容量为25的样本,其平均数为42,已知总体的标准差为6,试估计总体平均数的置信度为95%和99%的置信区间。12

B、总体正态分布,总体标准差未知时总体平均数的区间估计

(1)总体标准差未知的大样本,可用

代替总体标准差

总体平均数的置信度为95%的置信区间为

置信度为99%的置信区间为

如果设置信度为

为一小概率(常取值为0.05和0.01,统计推断时称为显著性水平)。当总体标准差已知,或总体标准差未知但为大样本时,其置信区间的一般公式为13

(2)总体标准差未知的小样本,用

代替总体标准差

,由于此时样本平均数的抽样分布为t分布,所以某一置信度下总体平均数的区间估计要依据t分布来进行,此时,总体平均数的置信度为

的置信区间为

例:某小学三年级学生阅读能力服从正态分布,现从中随机抽取12名学生,其阅读能力的得分为28、32、36、22、34、30、33、25、31、33、29、26,试估计该校三年级阅读能力总体平均数95%和99%的置信区间。

练习:从某区小学五年级学生的数学推理测试成绩中随机抽取26个,求得其平均数为86分,标准差为7分。已知全区五年级学生的成绩服从正态分布,请在0.05显著水平上估计该区五年级学生数学推理测试成绩的置信区间。14

2、总体比率的区间估计(一般用于较大样本的情况)

如果从总体中抽取容量为n的样本,以p表示具有某种属性的个体占总体的比率,其标准误为

当总体比率p未知时,样本比率和分别是总体比率p和q的估计值,标准误为

(

中的较小者)时,样本比率近似服从正态分布,此时总体比率的置信度为的置信区间为15

例:随机抽取某校小学二年级学生40名,用韦氏智力测验量表测量其智力水平,结果智商成绩在110分以上的有25名,试以95%的可靠性估计全校二年级学生智力测验分数总体在110分以上者占总体比例的置信区间。

练习:从某县三年级学生中随机抽取200人,测得他们社会科学习成绩为A等的有85人。试估计该校三年级学生社会科学习成绩获A等的人数占全县三年级总人数比率的95%和99%的置信区间。四、样本容量的确定(一)确定样本大小的基本原则

在尽量节省人力、经费和时间的条件下,确保用样本推断总体达到预定的可靠度及准确性。16(二)由样本平均数估计总体平均数时样本容量的确定

A、总体标准差已知

n为一定精确度要求下应抽取的样本容量;

为允许的最大误差;

为总体标准差;

为某可靠性下的双尾临界值。

例:拟估计上海市高校四级英语考试的总体平均分数,根据历次考试成绩的标准差为13分,这次的估计最大允许误差2分,可信度为95%,问应当抽多少人?17

练习:已知某小学六年级数学成绩的标准差为10分。现从该校随机抽取一部分学生,要求有95%的把握用这部分学生的数学成绩估计全校六年级学生平均成绩的差异不超过2分,那么最低抽取多少学生才能满足这一要求?

B、总体正态分布,总体标准差未知

问题:

不是一个常数,随自由度df=n-1的变化而变化,而样本容量未知,则df无法确定,则

无法查出。

办法:逐步试差

步骤:

(1)设

,查表得

的值,代入公式

求出

;18

(2)令

,查t值表,查得

的值,代入公式计算出

(3)重复上述做法,直到连续两次算得的

相等,这时的

就是所要确定的样本容量n。

例:某地区进行六年级学生英语成绩抽样调查,已随机抽取了一部分学生的英语成绩,得到的总体标准差的估计值

=11.4分。现要了解六年级学生英语成绩的平均水平,在99%的可靠性下,最大允许误差为3分,问样本容量应为多少?

练习:某市要对今年全市小学四年级学生的外语平均分数进行估计,规定

,最大允许误差为2分。已知去年本校小学四年级学生外语成绩的标准差是12分,那么应当抽取多大样本进行调查才能符合估计的要求?19(三)用样本比率估计总体比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论