心理与教育统计学课件张厚粲版ch14抽样设计_第1页
心理与教育统计学课件张厚粲版ch14抽样设计_第2页
心理与教育统计学课件张厚粲版ch14抽样设计_第3页
心理与教育统计学课件张厚粲版ch14抽样设计_第4页
心理与教育统计学课件张厚粲版ch14抽样设计_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理与教育统计学E-mail:1第二十二讲抽样设计2统计推断的可靠性与下列因素有关 1数据的质量样本对总体的代表性,既涉及到抽样方法,又涉及到样本的容量。2运用统计方法及数据处理的准确性3样本对总体的代表性在收集数据的过程中控制选择恰当的方法通过抽样设计控制3一抽样设计的意义及原则 1抽样设计的意义 使研究节省人力及费用; 使研究节省时间,提高时效性;保证研究结果的准确性。 42抽样设计的原则 抽样设计的要求是样本对研究总体有良好的代表性,即样本的构成与总体保持一致。为了保证这一点,抽样时必须遵循随机化(randomization)的基本原则。 所谓随机化原则,是指在抽样时,样本中的每一个体都

2、是按照随机的原理被抽取的,总体中每一个体被抽到的可能性是相等的。 5二几种重要的随机抽样方法 1简单随机抽样(simple random sampling)简单随机抽样就是按照随机原则直接从总体中抽取出若干个单位作为样本。简单随机抽样法能保证总体中的每一个对象都有同等的被抽取到的可能性,并且个体之间都相互独立。这是在总体异质性不是很大而且所抽取的样本较小时经常采用的一种形式。 6简单随机抽样法的局限是:当样本规模小时,样本的代表性较差。 简单随机取样有两种基本方式:抽签法(drawing lots) 随机数字表法(random number table) 72等距抽样 等距抽样(interva

3、l sampling)也称为机械抽样或系统抽样。实施时,先把总体中的所有个体按一定顺序编号,然后依固定的间隔取样。等距抽样可以保证样本的成分与总体一致,但随机性不如单纯随机抽样法。应用中可将两种方法结合使用。 83分层随机抽样 分层随机取样简称分层抽样(stratified sampling 或 hierarchical sampling),是进行大规模研究时常常使用的抽样方法。9分层抽样的方法:先将总体按照一定标准分为若干类型(统计上称为层),再根据各层对象的数量在总体数量中所占的比例,确定从每一种类型(层)中抽取样本的数量,然后按随机原则和所确定的各层取样的数量,从各层中取样。做好分层随机

4、取样的关键:分类的标准要科学,要符合实际情况。各层内的差别要小,而层与层之间的差异则越大越好。 10计算各层应抽样的个体数量的计算方法:按各层比例计算 公式中,ni为第i层中被抽取的个体数量 n为整个研究样本中个体的总数量 Ni为第i层中对象的数量 N为总体内个体的数量 (221)11例1:为了调查某区重点中学720名高一学生的视力,首先按视力的情况将他们分成好(108人)、中(360人)、差(252人)三种水平。若用分层抽样法抽取120人进行调查,问各层应抽多少人?12计算:13最佳配置法 最佳配置法不仅考虑各层的人数比例,而且考虑到了各层的标准差。当各层内的标准差已知,应该在标准差大的层内

5、多分配而在标准差小的层内少分配抽样数量。最佳配置法可以使得到的样本具有较好的异质性。 14在各层内应抽取个体数计算 公式中,ni表示从某一层所抽个体数 n表示样本容量 Ni表示某层个体总数 i表示某层标准差 (222)15当各个没有现成资料可以应用时,可以先从该层抽一个小样本,由这一小样本计算出的样本标准差S对进行估计。(223)16分层随机取样法的优点是代表性和推论的精确性较好。它适用于总体单位数量较多,并且内部差异较大的研究对象。分层随机取样法的局限性是要求对总体各单位的情况有较多的了解,否则就难以作出科学的分类。 174两阶段随机抽样 当总体容量很大时,直接以总体中的所有个体为对象,从中

6、进行抽样,在实际调查或研究中存在很大困难。采用分阶段的抽样方法,可以缩小实际抽样的范围,使实际抽样工作能够按研究设计的要求顺利进行。18两阶段随机抽样(two-stages random sampling)的一般过程是:先将总体分成个部分;第一阶段从这个部分中随机抽取m个部分作为第一阶段样本;第二阶段是分别从这m个部分中抽取一定数量(ni)的个体构成第二阶段样本。195整群抽样 整群随机抽样是先将总体各单位按一定的标准分成许多群(小组),然后按随机原则从这些群中抽取若干群作为样本。20整群随机取样法的优点是样本比较集中,适宜于某些特定的研究,尤其是在教育实验中常用此法。此外,在规模较大的调查研

7、究中,整群随机取样易于组织,可节省人力、物力和时间。整群随机抽样法的缺点是样本分布不均匀,代表性较差。 21三 样本容量的确定 1确定样本容量的意义在应用中应根据研究所要求的精确度及经费情况确定样本容量。如果样本容量过小,会影响样本对总体的代表性,增大抽样误差而降低研究推论的精确性;样本容量过大,虽然减小了抽样误差,但可能增大过失误差,并且增加不必要的人力物力资源的浪费。22样本容量与抽样误差并不是直线关系。确定容量的基本原则是:在尽量节省人力、经费和时间的条件下,确保用样本推断总体达到预定的可行度及准确性。232总体平均数估计样本容量的确定 总体已知 其中,最大允许误差为 ,可信度为1。 由

8、有(224)可以看到,当确定之后,总体标准差和最大允许误差d是决定样本容量的两个因素。24总体未知 由有当样本容量n 未确定时,t 值无法确定,因此一般采用尝试法。 (225)25尝试法求样本容量的过程.将df的 t 值代入公式求出n1,.将n1 的 t 值代入公式求出n2, .直至前后两次求出的n 相同为止。 也可据S/d查附表20求出样本容量 26例2:拟估计某市高校四级英语考试成绩的总体平均分数。以往考试成绩的标准差为13,这次的估计最大允许误差为2分,可信度为95%,问应抽取多大的样本?27例3:拟对某市初中升入高中入学考试语文成绩的总体平均数进行估计。根据以同等难度的试题对同等教育水

9、平的另一城市部分初中升入高中入学考试语文成绩算出的S=11.4。若要求估计的最大允许误差为d=3,可信度为99%,问样本容量应为多少?28计 算1.由t分布表查得 自由度df=时,t1=2.576 2.由t分布表查得 自由度df=96-1时,t2=2.629 293.由t分布表查得 自由度df=100-1时,t3=2.627 前后两次算出的样本容量相等,因此 n=100当估计出的样本容量比较大时,可以直接按公式(22.4)计算而不必采用尝试法。 302平均数显著性检验时样本容量的确定 总体已知在假设检验中,要同时考虑错误和错误,因此 31将以上两式相加为: 若令0,则 32单侧检验:双侧检验:

10、(226)(227)33式中的和由研究者预先确定,值要比值小。一般为0.05或0.01,而值一般确定为0.10、0.20或0.30。对同一个值,单侧和双侧时的Z临界值是不一样的。 当样本容量已知, 值及其他条件也已确定,则就是确定值。这时可以利用有关公式计算值,从而对检验的统计力作出评价。34可以看到,在平均数的假设检验中,当确定了和之后,样本的容量n取决于总体标准差和假设的总体差异。与参数估计相比,多考虑了一个因子,并且与参数估计中的具有不同的涵义。 35例4:某市高中入学考试数学平均分数历年来的标准差为8.6分。某校欲估计今年该校学生入学考试数学成绩是否与全市一致,希望可信度达到95%,估

11、计误差不超过2分,而为0.10,问需抽取多大的样本?3637总体未知 单侧检验:双侧检验:(228)(229)用尝试法求出n,也可查附表22求出样本容量。 383两平均数差异显著性检验时样本容量的确定 两独立样本 对两个独立样本平均数差异进行显著性检验时,两个相应总体标准差一般为未知,需要由样本的标准差进行估计。其联合方差的计算公式为39确定样本容量的公式为 单侧检验:双侧检验:(2210)(2211)用尝试法求出n。 40.两相关样本相关样本的数据是成对的,每一对数据之差记为d,则 d=X1-X2Sd即每一对数据之差的标准差,也是由样本数据对总体数据之差标准差的估计值。可以由同类的数据进行估计。41确定样本容量的公式为 单侧检验:双侧检验:(2212)(2213)用尝试法求出n。 42例5:在一个月之内每天进行半小时英语听力训练,为了考查其效果,拟对随机抽取的一组学生在训练前后用同一听力内容进行测验,并进行平均数差异的显著性检验。同类实验结果表明,实验前后成绩之差的标准差Sd=10,若确定可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论