abl.抽样-是从整体中抽取样本的过程_第1页
abl.抽样-是从整体中抽取样本的过程_第2页
abl.抽样-是从整体中抽取样本的过程_第3页
abl.抽样-是从整体中抽取样本的过程_第4页
abl.抽样-是从整体中抽取样本的过程_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样-是从整体中抽取样本的过程样本:按照一定的抽样规则从整体中抽取的一部分单位的集合抽样方法:概率抽样(遵循随机化原则)和非概率抽样(不遵 循随机化原则)抽样误差差在抽样研研究中,只取总总体中的的一部分分作为直直接研究究的对象象,然后后根据样样本的结结果去推推算总体体的一般般情况,这样的的推算与与总体的的实际有有着偏差差,这种种偏差称称为抽样样误差简单随机机抽样(分为重重复抽样样和不重重复抽样样)在从总体体中抽取取n个单单位作为为样本时时,要使使得每一一个总体体单位都都有相同同的机会会(概率率)被抽抽中。简单随机机抽样的的方法:抽签法、查表法法、计算算机造数数法系统抽样样(等距距抽样)系统抽样

2、样方法实实际上是是等间隔隔法的机机械抽样样。它把总体体中所有有个体按按一定的的顺序编编号,然然后依固固定间隔隔取样,间隔大大小视所所需样本本容量与与总体中中个体数数目的比比率而定定,起始始数字必必须是随随即决定定的。等距抽样样又有直直线等距距抽样,对称等等距抽样样和循环环等距抽抽样三种种。步骤:(1)设设总体共共有N个个单位,现需要要从总体体中抽出出n个单单位做为为样本,先将总总体的N个单位位按与总总体特征征标志无无关的标标志进行行排队。(2)确确定取样样间隔:K=N/n(3)确确定起点点:N为为奇数,R=(K+1)/2;N为为偶数, R=(K+2)/2。(4)取取样,从从R开始始,RK,R(

3、n-1)K。例:现有有180名学生生,利用用系统抽抽样方法法从中抽取取15名名学生作作为研究究样本分层抽样样(类型型抽样)是把总体体按一定定标志分分成不同同类型或或层次,然后从从各种不不同类型型中随机机抽取若若干个单单位组成成样本。分层抽样样的具体体方法:设总体由由N个单单位组成成,现在在抽取出出一组容容量为n的样本本。(1)把把总体按按主要标标志划分分为R组组,使=N1+N2+NR(2)然然后从各各组中的的N1中中,用单单纯随机机抽样方方法抽取取ni个个单位构构成样本本,使得得n=n1+n2+nR;(3)n1/N1=n2/N2=nR/NR=n/N;(4)各各组的样样本数应应为ni=(n/N)

4、Ni例:某年年级学生生共有180人人,分为为四个班班,其中中甲班N1=40人,乙班班N2=50人人,丙班班N3=45人人,丁班班N4=45人人,现要抽取20%作作为样本本,则每每班应抽抽取的样样本数应应为多少?整群抽样样整群抽样样是先将将各单位位划分为为若干群群(组),然后后以群为为单位从从中随机机抽取一一些群,对抽中中的群的的所有单单位进行行调查。抽样分布布的概念念:由样本的的n个观观察值计计算的统统计量的的概率分分布例:设一一个总体体只有4个个体体,即总总体单位位个数N=4,取值分分别为x1=1,x2=2,x3=3,x4=4。具具体的可视为一一个黑布布袋中有有四个球球,分别别表明1,2,3

5、,4号号球,先先看总体体的分布布情况,如下图图所示:P(x)0.10.30.21234x可以看出出:总体体的分布布为均匀匀分布,即xi取每一个个值的概概率都相相同,p(x)=0.25,总体均均值=2.5总体方差差2=1.25若从该总总体中采采取重复复抽样方方法抽取取容量为为n=2的随机机样本,共有16个可可能样本本。样本编号样本中的单位样本均值x平均样本方差s2123456789101112131415161,11,213,1,42,12,22,32,43,13,23,33,44,14,24,34,41.01.52.02.51.52.02.53.02.02.53.03.52.53.03.54.

6、000.524.50.500.5220.500.54.520.50X平均取值X平均的个数X平均取值的概率P(x)1.01.52.02.53.03.54.012343211/162/163/164/163/162/161/16P(x)0.10.30.21.01.52.02.5x3.03.54.0总体N容量为n的所有有样本计算出每每一个x平均并并形成分分布P(x)X平均X平均的的抽样分分布0总体分布正态分布非正态分布大样本小样本正态分布大样本小样本正态分布非正态分布平均数抽抽样分布布的几个个定理(1)从从总体中中随机抽抽出容量量为n的的一切可可能样本本的平均均数之平平均数等等于总体体平均数数(2)

7、容容量为n的平均均数在抽抽样分布布上的标标准差,等于总总体标准准差除以以n的平平方根抽样分布布是统计计推断的的理论依依据。但但在实际际工作中中,不是是通过抽抽取一切切可能个个样本来来求总体体参数,而是抽抽取一个个随机样样本根据据一定的的概率来来推断总总体的参参数从正态总总体中随随机抽取取的容量量为n的的一切可可能样本本平均数数以总体体平均数数为中心心呈正态态分布。当总体体标准差差已知时时,一切切可能样样本平均均数与总总体平均均数的离离差统计计量呈标标准正态态分布。假设检验验的基本本原理当对某一一总体参参数进行行假设检检验时,首先从从该总体体中随机机抽取一一个样本本,计算算出统计计量的值值,并根

8、根据经验验对相应应总体参参数提出出一个假假设值,这个假假设是说说:这个个样本统统计量的的值是这这个假设设总体参参数值的的一个随随机样本本,即这这个样本本来自于于这个总总体,而而样本统统计量的的值与总总体参数数值之间间的差异异是由抽抽样误差差所致。根据这一一假设,可以认认为,像像这样的的一切可可能样本本统计量量的值,应当以以总体参参数值(假设的的)为中中心形成成该种统统计量的的一个抽抽样分布布,如果果这个随随机样本本统计量量的值在在抽样分分布上出出现的概概率较大大,这时时只好保保留这个个假设(承认该该样本来来自总体体),如如果随即即样本统统计量的的值在其其抽样分分布上出出现的概概率极小小(小概概

9、率事件件不可能能发生),则拒拒绝假设设。一、假设设(原假假设和备备择假设设)二、小概概率事件件三、显著著性水平平只要样本本统计量量的值在在抽样分分布上出出现的概率等于于或小于于0.05(或或0.01),即样本本统计量值落入入了拒绝绝区域,就认为为小概率率事件发发生,应拒拒绝原假假设.统统计学中中把拒绝绝零假设设的概率称为为显著性性水平,用表表示。例:某小小学历届届毕业生生汉语拼拼音测验验平均分分数为66分,标准差差为11.7。现以同同样的试试题测验验应届毕毕业生(假定应应届与历历届毕业业生条件件基本相相同),并从中中随机抽抽取18份试卷卷,算得得平均分分为69分,问问该校应应届与历历届毕业业生

10、汉语语拼音测测验成绩绩是否一一样?(2)选选择检验验统计量量并计算算其值学生汉语语拼音成成绩可以以假定是是从正态态总体中中抽出得得随机样样本,并并已知总总体标准准差11.7,无无论样本本容量大大小,样样本统计量的的标准记记分为:检验得步步骤:(1)提提出假设设H0:66H1:66(3)确确定检验验形式因为没有有资料说说明应届届毕业生生汉语成成绩高于于还是低低于历届届毕业生生,故采采用双测测检验(4)统统计决断断根据显著著性水平平查相应应的理论论概率分分布表,寻找临临界值。本例如果果在0.05显显著性水水平上作作判断,正态分分布两尾尾上的面面积各为为0.025,根据0.50.0250.475,则:将实际计计算出的的检验统统计量的的值与查查表寻找找出来的的临界值值相比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论