abl.抽样是从整体中抽取样本的过程_第1页
abl.抽样是从整体中抽取样本的过程_第2页
abl.抽样是从整体中抽取样本的过程_第3页
abl.抽样是从整体中抽取样本的过程_第4页
abl.抽样是从整体中抽取样本的过程_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样-是从整体中抽取样本的过程样本:按照一定的抽样规则从整体中抽取的一部分单位的集合抽样方法:概率抽样(遵循随机化原则)和非概率抽样(不遵循随机化原则)抽样误差在抽样研究中,只取总体中的一部分作为直接研究的对象,然后根据样本的结果去推算总体的一般情况,这样的推算与总体的实际有着偏差,这种偏差称为抽样误差简单随机抽样(分为重复抽样和不重复抽样)在从总体中抽取n个单位作为样本时,要使得每一个总体单位都有相同的机会(概率)被抽中。简单随机抽样的方法:抽签法、查表法、计算机造数法系统抽样(等距抽样)系统抽样方法实际上是等间隔法的机械抽样。它把总体中所有个体按一定的顺序编号,然后依固定间隔取样,间隔大小视所需样本容量与总体中个体数目的比率而定,起始数字必须是随即决定的。等距抽样又有直线等距抽样,对称等距抽样和循环等距抽样三种。步骤:(1)设总体共有N个单位,现需要从总体中抽出n个单位做为样本,先将总体的N个单位按与总体特征标志无关的标志进行排队。(2)确定取样间隔:K=N/n(3)确定起点:N为奇数,R=(K+1)/2;N为偶数,R=(K+2)/2。(4)取样,从R开始,R+K,…,R+(n-1)K。例:现有180名学生,利用系统抽样方法从中抽取15名学生作为研究样本分层抽样(类型抽样)是把总体按一定标志分成不同类型或层次,然后从各种不同类型中随机抽取若干个单位组成样本。分层抽样的具体方法:设总体由N个单位组成,现在抽取出一组容量为n的样本。(1)把总体按主要标志划分为R组,使=N1+N2+…+NR(2)然后从各组中的N1中,用单纯随机抽样方法抽取ni个单位构成样本,使得n=n1+n2+…nR;(3)n1/N1=n2/N2=…=nR/NR=n/N;(4)各组的样本数应为ni=(n/N)Ni例:某年级学生共有180人,分为四个班,其中甲班N1=40人,乙班N2=50人,丙班N3=45人,丁班N4=45人,现要抽取20%作为样本,则每班应抽取的样本数应为多少?整群抽样样整群抽样样是先将将各单位位划分为为若干群群(组)),然后后以群为为单位从从中随机机抽取一一些群,,对抽中中的群的的所有单单位进行行调查。。抽样分布布的概念念:由样本的的n个观观察值计计算的统统计量的的概率分分布例:设一一个总体体只有4个个体体,即总总体单位位个数N=4,,取值分分别为x1=1,x2=2,x3=3,x4=4。具具体的可视为一一个黑布布袋中有有四个球球,分别别表明1,2,,3,4号号球,先先看总体体的分布布情况,,如下图图所示::P(x)0.10.30.21234x可以看出出:总体体的分布布为均匀匀分布,,即xi取每一个个值的概概率都相相同,p(x))=0.25,,总体均均值μ=2.5总体方差差σ2=1.25若从该总总体中采采取重复复抽样方方法抽取取容量为为n=2的随机机样本,,共有16个可可能样本本。样本编号样本中的单位样本均值x平均样本方差s2123456789101112131415161,11,213,1,42,12,22,32,43,13,23,33,44,14,24,34,41.01.52.02.51.52.02.53.02.02.53.03.52.53.03.54.000.524.50.500.5220.500.54.520.50X平均取值X平均的个数X平均取值的概率P(x)1.01.52.02.53.03.54.012343211/162/163/164/163/162/161/16P(x)0.10.30.21.01.52.02.5x3.03.54.0总体N容量为n的所有有样本计算出每每一个x平均并并形成分分布P(x))X平均X平均的的抽样分分布0总体分布正态分布非正态分布大样本小样本正态分布大样本小样本正态分布非正态分布平均数抽抽样分布布的几个个定理(1)从从总体中中随机抽抽出容量量为n的的一切可可能样本本的平均均数之平平均数等等于总体体平均数数(2)容容量为n的平均均数在抽抽样分布布上的标标准差,,等于总总体标准准差除以以n的平平方根抽样分布布是统计计推断的的理论依依据。但但在实际际工作中中,不是是通过抽抽取一切切可能个个样本来来求总体体参数,,而是抽抽取一个个随机样样本根据据一定的的概率来来推断总总体的参参数从正态总总体中随随机抽取取的容量量为n的的一切可可能样本本平均数数以总体体平均数数为中心心呈正态态分布。。当总体体标准差差已知时时,一切切可能样样本平均均数与总总体平均均数的离离差统计计量呈标标准正态态分布。。假设检验验的基本本原理当对某一一总体参参数进行行假设检检验时,,首先从从该总体体中随机机抽取一一个样本本,计算算出统计计量的值值,并根根据经验验对相应应总体参参数提出出一个假假设值,,这个假假设是说说:这个个样本统统计量的的值是这这个假设设总体参参数值的的一个随随机样本本,即这这个样本本来自于于这个总总体,而而样本统统计量的的值与总总体参数数值之间间的差异异是由抽抽样误差差所致。。根据这一一假设,,可以认认为,像像这样的的一切可可能样本本统计量量的值,,应当以以总体参参数值((假设的的)为中中心形成成该种统统计量的的一个抽抽样分布布,如果果这个随随机样本本统计量量的值在在抽样分分布上出出现的概概率较大大,这时时只好保保留这个个假设((承认该该样本来来自总体体),如如果随即即样本统统计量的的值在其其抽样分分布上出出现的概概率极小小(小概概率事件件不可能能发生)),则拒拒绝假设设。一、假设设(原假假设和备备择假设设)二、小概概率事件件三、显著著性水平平只要样本本统计量量的值在在抽样分分布上出出现的概率等于于或小于于0.05(或或0.01),即样本本统计量值落入入了拒绝绝区域,就认为为小概率率事件发发生,应拒拒绝原假假设.统统计学中中把拒绝绝零假设设的概率称为为显著性性水平,用α表表示。例:某小小学历届届毕业生生汉语拼拼音测验验平均分分数为66分,,标准差差为11.7。。现以同同样的试试题测验验应届毕毕业生((假定应应届与历历届毕业业生条件件基本相相同),,并从中中随机抽抽取18份试卷卷,算得得平均分分为69分,问问该校应应届与历历届毕业业生汉语语拼音测测验成绩绩是否一一样?(2)选选择检验验统计量量并计算算其值学生汉语语拼音成成绩可以以假定是是从正态态总体中中抽出得得随机样样本,并并已知总总体标准准差σ==11.7,无无论样本本容量大大小,样样本统计量的的标准记记分为::检验得步步骤:(1)提提出假设设H0:μ=66H1:μ≠66(3)确确定检验验形式因为没有有资料说说明应届届毕业生生汉语成成绩高于于还是低低于历届届毕业生生,故采采用双测测检验(4)统统计决断断根据显著著性水平平查相应应的理论论概率分分布表,,寻找临临界值。。本例如果果在0.05显显著性水水平上作作判断,,正态分分布两尾尾上的面面积各为为0.025,,根据0.5--0.025==0.475,,则:将实际计计算出的的检验统统计量的的值与查查表寻找找出来的的临界值值相比较较,再根根据统计计决断规规则对H0作出保留留或拒绝绝的决断断|Z|与临界值的比较P值检验结果显著性|Z|<1.96=Z0.05Z0.05=1.96≤|Z|<2.58=Z0.01|Z|≥2.58=Z0.01P>0.050.01<P≤0.05P≤0.01保留H0,拒绝H1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论