版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样设计第1页,共56页,2022年,5月20日,14点34分,星期三2由样本对总体的相应特征进行统计推断。推断的可靠性与以下几种因素有关:1数据的质量;2运用统计方法及数据处理的准确性;3样本对总体的代表性。样本对总体的代表性,既涉及到抽样的方式,又涉及到样本的容量。第十四章 抽样设计第2页,共56页,2022年,5月20日,14点34分,星期三3第十四章 抽样设计第一节 抽样方法第二节 总体平均数统计推断时样本容量的确定第三节 总体比率统计推断及相关系数显著性检验时样本容量的确定第3页,共56页,2022年,5月20日,14点34分,星期三4第一节 抽样方法一、单纯随机抽样如果总体中每个个
2、体被抽到的机会是均等的(即抽样的随机性),并且在抽取一个个体之后总体内成份不变(抽样的独立性)。这种抽样方法称为单纯随机抽样。第4页,共56页,2022年,5月20日,14点34分,星期三5第一节 抽样方法一、单纯随机抽样有限总体根据抽样独立性原则,对于有限总体要用放回抽样方法,即将每一个从总体中抽出的个体,记录其结果之后,再放回总体之中,这样重复抽取n次就得到一组容量为n的样本。无限总体对于无限总体来说,由于抽出的个体放回与不放回并不改变总体的成分,因此抽样时并不要求放回。第5页,共56页,2022年,5月20日,14点34分,星期三6第一节 抽样方法一、单纯随机抽样在教育研究中,放回抽样往
3、往成为不可能。因此在应用时即使是有限总体,如果总体的个数大于500,而且总体内的个体数是样本中个体数的10-20倍,也可视为接近无限总体,实行不放回抽样。第6页,共56页,2022年,5月20日,14点34分,星期三7第一节 抽样方法二、机械抽样把总体中的所有个体按一定顺序编号,然后依固定的间隔取样(间隔的大小视所需样本容量与总体中个体数目的比率而定),这种抽样方法称为机械抽样。例如:为了了解某校大学一年级学生英语学习情况,拟从1500个大一学生中抽取1/10作为样本。先将这1500个学生的英语测验分数由低到高排列,并从1至1500编号,然后按1、11、21,号码的顺序和间隔抽取分数,并组成一
4、个样本。第7页,共56页,2022年,5月20日,14点34分,星期三8第一节 抽样方法二、机械抽样机械抽样比单纯随机抽样能保证抽到的个体在总体中的分布比较均匀,而单纯随机抽样比机械抽样的随机性强,因为单纯随机抽样可以由总体内所有的个体组成任何可能的样本,而机械抽样对上例来说,只有10个可能样本,即:1、11、21;2、12、22;10、20、30。第8页,共56页,2022年,5月20日,14点34分,星期三9第一节 抽样方法二、机械抽样机械抽样和单纯随机抽样两者也可以结合使用。如,上例先按机械抽样原则在1、2、10中抽取一个,至于抽哪一个可以用单纯随机抽样的办法确定。既可保持分布的均匀,又
5、扩大了各个个体随机组合的可能性。第9页,共56页,2022年,5月20日,14点34分,星期三10第一节 抽样方法三、分层抽样按与研究内容有关的因素或指标先将总体划分成几部分(即几个层),然后从各部分(即各层)中进行单纯随机抽样或机械随机抽样,这种抽样方法称为分层抽样。总体分层的基本原则:各层内部的差异要小,层与层之间的差异要大。第10页,共56页,2022年,5月20日,14点34分,星期三11第一节 抽样方法三、分层抽样各层分配个数的方法有:1、按各层的人数比率分配当总体未知时,从各层所抽的人数比率都应当等于样本的容量n与总体N之比。例如,对某校800个学生的品德情况进行了解,拟取40个学
6、生作为样本。那么,可先根据一定标准将800个学生分成优(160人)、良(320人)、中(240人)、差(80人)四部分,然后从各部分中用单纯随机抽样或机械随机抽样的方法,各抽40/800=1/20。第11页,共56页,2022年,5月20日,14点34分,星期三12第一节 抽样方法三、分层抽样各层分配个数的方法有:2、最优配置法在从各层抽取对象时,既考虑各层的人数比率,又考虑各层标准差的大小,这种从各层抽取的对象的方法称为最优配置法。从各层所抽取人数的计算公式为:nh从某一层所抽的人数n 样本的容量(即各层所抽人数之和)Nh某层的人数h某层的标准差第12页,共56页,2022年,5月20日,1
7、4点34分,星期三13第一节 抽样方法例如,要了解某市高等教育自学考试的数学成绩,拟采用最优配置分层抽样方法。首先将考试成绩分成上中下三层,各层人数分别为120、420、60,其总人数为600,各层标准差估计为11、9、13,假如样本容量n已确定为65(按理n的大小也应是根据各种条件计算出来的),将有关数据代入上式,于是上中下各层应抽取人数分别为:从各层所抽的人数比率为:由此可见,在标准差大的层里所抽的人数比率大 第13页,共56页,2022年,5月20日,14点34分,星期三14第一节 抽样方法四、整群抽样从总体中抽出来的研究对象,不是以个体作为单位,而是以整群为单位的抽样方法,称为整群抽样
8、。例如,要了解某市某年物理学科高考的成绩,可以以学校为单位进行抽样。为了增强样本对总体的代表性,弥补整群抽样的不均匀性,可以与分层抽样相结合。先按一定的标准把全市所有中学分成几部分,如市重点、区重点、普通中学三类,然后根据比率,从三类学校中抽取若干学校,组成整群样本。第14页,共56页,2022年,5月20日,14点34分,星期三15第二节 总体平均数统计推断时样本容量的确定 确定样本容量的基本原则在尽量节省人力、经费和时间的条件下,确保用样本推断总体达到预定的可靠度及准确性。统计推断的可靠度及准确性的提高与样本容量的增大不呈直线关系。样本容量增到一定程度,可靠度及准确性增高的速度开始放慢。第
9、15页,共56页,2022年,5月20日,14点34分,星期三16第二节 总体平均数统计推断时样本容量的确定 在实际教育研究中,一般样本容量不会太小,可将有限总体视为无限总体。确定样本容量的各抽样方式均由单纯随机抽样方式来代替。以下确定样本容量时即作如此处理。第16页,共56页,2022年,5月20日,14点34分,星期三17第二节 总体平均数统计推断时样本容量的确定 一、由样本平均数估计总体平均数时样本容量的确定1、总体已知的情况当总体标准差已知,样本平均数与总体平均数离差的统计量呈正态分布。其统计量为:第17页,共56页,2022年,5月20日,14点34分,星期三18第二节 总体平均数统
10、计推断时样本容量的确定 若由样本平均数估计总体平均数时,要求:最大允许误差为:可信度为1-,当=0.05,双侧临界值为Z0.05=1.96;当=0.01,双侧临界值为Z0.01=2.58。于是根据上式计算样本容量的公式为: (14.2)第18页,共56页,2022年,5月20日,14点34分,星期三19第二节 总体平均数统计推断时样本容量的确定 例如拟估计上海市高校四级英语考试的总体平均分数,根据历次考试成绩的标准差为13,这次的估计最大允许误差=2分,可信度为95%,问应当抽多少人?根据题意,是要由样本的平均数估计总体的平均数,总体的=13 ,=0.05,相应的Z0.05=1.96,=2,将
11、其代入上式,则应当抽取162人。第19页,共56页,2022年,5月20日,14点34分,星期三20第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况当总体标准差未知,样本平均数与总体平均数离差统计量呈t分布,其统计量为:于是根据上式计算样本容量的公式为: (14.3)第20页,共56页,2022年,5月20日,14点34分,星期三21第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况但t/2值不是一个常数,它随自由度df=n-1的大小而变化,当样本容量未确定之前,自由度无法确定,于是值也无法查出。一般采用尝试法:首先将自由度df=的t/2值代入上式,求出n1,然后将d
12、f=n1-1的t/2值再代入上式求出n2,再将df=n2-1的t/2值再代入上式求出n3,以此方法重复下去,直至先后连续两次所求得的n相等为止,这时n就是所要确定的样本容量。第21页,共56页,2022年,5月20日,14点34分,星期三22第二节 总体平均数统计推断时样本容量的确定 例如:拟对某市初中升高中入学考试语文成绩的总体平均数进行估计。根据以同等难度的试题,对同等教育水平的另一城市部分初中升高中入学考试语文成绩算出的S=11.4。若要求估计的最大允许误差=3,可信度为99%,问样本容量应为多少?因为本题总体未知,应用公式(14.3)计算。首先根据df=及=0.01(双侧),查t值表,
13、寻得t()0.01=2.5758,并将S=11.4,=3一并代入公式,于是第22页,共56页,2022年,5月20日,14点34分,星期三23第二节 总体平均数统计推断时样本容量的确定 然后根据df=96-1=95,查t值表,寻得双侧t(95)0.01=2.629,将其代入公式,则再根据df=100-1=99,查t值表,寻得双侧t(99)0.01=2.627,将其代入公式,则因为最后连续两次计算出的n相等,即n2=n3=100,故样本容量以n=100为宜。第23页,共56页,2022年,5月20日,14点34分,星期三24第二节 总体平均数统计推断时样本容量的确定 当估计计算出的样本容量可能会
14、大于或等于30时,虽然总体未知,一般也可用正态分布的统计量公式计算,因为此时这两个公式计算结果相差甚微。当估计样本容量可能会小于30时,以用t分布统计量公式的尝试法为宜。第24页,共56页,2022年,5月20日,14点34分,星期三25第二节 总体平均数统计推断时样本容量的确定 统计学家运用尝试法研制了由样本平均数估计总体平均数时所需样本容量表,表的左侧纵列表示总体标准差估计值S与最大允许误差之比S/的整数部分,上端横行表示S/值的一位小数值。可根据S/值及查表。第25页,共56页,2022年,5月20日,14点34分,星期三26第二节 总体平均数统计推断时样本容量的确定 二、样本平均数与总
15、体平均数差异显著性检验(要考虑、错误)时样本容量的确定1、总体已知的情况根据样本平均数对总体平均数进行差异显著性检验时,其假设为:H0:=0 ,H1:0H0是说,样本所来自的总体平均数就是0 ,H1是说,样本所来自的总体平均数不是0 。第26页,共56页,2022年,5月20日,14点34分,星期三27第二节 总体平均数统计推断时样本容量的确定 若H0为真,而遭拒绝,就会犯错误,则有若H1为真,而遭拒绝,就会犯错误,则有第27页,共56页,2022年,5月20日,14点34分,星期三28第二节 总体平均数统计推断时样本容量的确定 在假设中既要考虑又要考虑,将以上二式相加为: 若令=-0 ,则(
16、单侧) (14.4) (双侧) (14.5) n所需样本容量;Z值置于正态分布一端时相应的Z值Z/2值置于正态分布两端时相应的Z值Z与值相对应的正态分布Z值总体的标准差最大允许误差第28页,共56页,2022年,5月20日,14点34分,星期三29第二节 总体平均数统计推断时样本容量的确定 上式中及值是由研究者预先确定的,值要确定得比值小。值一般确定为0.05或0.01。值一般确定为0.10、0.20、0.30。在及值确定后,若进行双侧检验,值要分置于分布的两端;若进行单侧检验,值要置于分布的一端。于是同一个值,其单、双侧Z的临界值是不相同的。而对于值来说,无论进行单侧检验还是双侧检验,其值总
17、是置于分布的一端。第29页,共56页,2022年,5月20日,14点34分,星期三30第二节 总体平均数统计推断时样本容量的确定 例如:某区高三学能测验CEEB标准分数的平均数0=500,标准差=100,据高中教师的经验认为,高中连续三年参加体育运动对的学生,学能测验比平均数低23分()。为了检验这一经验的可靠性,确定=0.05,=0.20,问应从该区高中连续三年参加运动队的高三学生中随机抽取多少人?分析:根据题意,是要对样本平均数与总体平均数进行单侧的差异显著性检验。 第30页,共56页,2022年,5月20日,14点34分,星期三31第二节 总体平均数统计推断时样本容量的确定 单侧=0.0
18、5的Z0.05=1.65。在寻找=0.20相应的Z值(Z0.20)时,要根据0.5-0.20=0.30,从正态分布表的P列中找到与0.30最相近的Z0.20=0.84,再将总体的标准差=100,=23,一并代入公式,于是应随机抽取117名学生。第31页,共56页,2022年,5月20日,14点34分,星期三32第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况当总体未知,样本平均数与总体平均数的离差统计量呈t分布。当对样本平均数与总体平均数的差异进行显著性检验时,需用下式通过尝试来确定样本容量(单侧)(14.6) (双侧) (14.7) n所需样本容量;t值置于t分布一端时相应的t
19、值t/2值置于t分布两端时相应的t值t与值相对应的t值S总体的标准差的估计值最大允许误差第32页,共56页,2022年,5月20日,14点34分,星期三33第二节 总体平均数统计推断时样本容量的确定 例如某区各校初二劳技课内容之一,就是要到区劳技中心学习纺织一周,历届初二学生编织一只小篮子约需30分钟,总体标准差估计值S=4,为了检验应届学生编织一只小篮子所用平均时间与历届学生是否相同,确定=0.05,=0.10,=-0=1.6,问需从应届学生中抽取多少人?分析根据题意,是要对样本平均数与总体平均数进行差异显著性检验。由于总体标准差未知,并且没有资料说明应届比历届平均用时是高还是低,故要用双侧
20、检验的公式(14.7)进行尝试以确定样本容量。第33页,共56页,2022年,5月20日,14点34分,星期三34第二节 总体平均数统计推断时样本容量的确定 首先根据df=,=0.05,查t值表P(2),寻得双侧t()0.05=1.96,仍用t值表P(1)寻得df=,=0.10的t()0.10=1.2816,并将S=4,=1.6一并代入公式(14.7),则第34页,共56页,2022年,5月20日,14点34分,星期三35第二节 总体平均数统计推断时样本容量的确定 然后根据df=66-1=65,查t值表P(2),寻得双侧t(65)0.05=1.997,查t值表P(1),寻得=0.10的t(65
21、)0.10=1.295,仍代入公式,则再根据df=68-1=67,查t值表P(2),寻得双侧t(67)0.05=1.996,查t值表P(1),寻得=0.10的t(67)0.10=1.295,再代入公式,则因为最后连续两次计算出的n相等,即n2=n3=68,故样本容量以n=68为宜。第35页,共56页,2022年,5月20日,14点34分,星期三36第二节 总体平均数统计推断时样本容量的确定 该例可根据双侧=0.05,=0.10,/S=1.6/4=0.4,查样本平均数与总体平均数差异显著性检验所需样本容量表,寻得n=68,与用公式尝试法计算结果完全相同。(查表时注意:因为总体标准差未知,故用总体
22、标准差估计值S代替)第36页,共56页,2022年,5月20日,14点34分,星期三37第二节 总体平均数统计推断时样本容量的确定 三、两个样本平均数差异显著性检验时样本容量的确定1、两个独立样本平均数差异显著性检验时样本容量的确定对两个独立样本平均数差异进行显著性检验时,两个相应的总体标准差一般为未知,故确定样本容量的公式为:(单侧) (14.8) 第37页,共56页,2022年,5月20日,14点34分,星期三38第二节 总体平均数统计推断时样本容量的确定 (双侧) (14.9) n1和n2n1=n2时两个样本的容量;t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相
23、对应的t值S总体的标准差的估计值(假定S1=S2=S)最大允许误差第38页,共56页,2022年,5月20日,14点34分,星期三39第二节 总体平均数统计推断时样本容量的确定 例如拟考查重点中学在全市统一举行的计算机基础知识合格证书考试中平均分数是否高于一般中学8分(),确定=0.01,=0.10,根据经验,两类学校成绩的标准差相等,S1=S2=9,问样本容量应为多少?分析根据题意,需对重点中学及一般中学此次考试成绩进行单侧的独立样本平均数差异显著性检验。第39页,共56页,2022年,5月20日,14点34分,星期三40第二节 总体平均数统计推断时样本容量的确定 首先根据df=,=0.01
24、,查t值表P(1),寻得单侧t()0.01=2.3263,仍用t值表P(1)寻得df=,=0.10的t()0.10=1.2816,并将S=9,=8一并代入公式(14.8),则第40页,共56页,2022年,5月20日,14点34分,星期三41第二节 总体平均数统计推断时样本容量的确定 然后根据df=n1+n2-2=33+33-2=64,查t值表P(1),寻得单侧=0.01的t(64)0.01=2.386,查t值表P(1),寻得=0.10的t(64)0.10=1.295,仍代入公式,则再根据df=n1+n2-2=34+34-2=66,查t值表P(1),寻得单侧=0.01的t(66)0.01=2.
25、385,查t值表P(1),寻得=0.10的t(66)0.10=1.295,仍代入公式,则因为最后连续两次计算出的n1(2)=n2(2)= n1(3)=n2(3) =34,所以需从重点中学及一般中学各抽34人。第41页,共56页,2022年,5月20日,14点34分,星期三42第二节 总体平均数统计推断时样本容量的确定 该例也可根据单侧=0.01,=0.10,/S=8/9=0.89,查两个样本平均数差异显著性检验所需样本容量表,寻得n1=n2= 34.8,与用公式尝试法计算结果相近。(查表时注意:因为总体标准差未知,故用总体标准差估计值S代替)第42页,共56页,2022年,5月20日,14点3
26、4分,星期三43第二节 总体平均数统计推断时样本容量的确定 2、两个相关样本平均数差异显著性检验时样本容量的确定对于同一组对象实验前后在同一个测验上的两组分数,或者对于由于各中条件基本相同的原则匹配成对的两组对象,施以不同实验之后统一测验的两组分数,进行平均数差异显著性检验时所需样本容量的计算公式为:第43页,共56页,2022年,5月20日,14点34分,星期三44第二节 总体平均数统计推断时样本容量的确定 进行平均数差异显著性检验时所需样本容量的计算公式为:(双侧) (14.11) (单侧) (14.10) n所需样本容量(即前后测所针对的同一组对象的人数或匹配成对的对子数);t值置于t分
27、布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值Sd每对数据之差的总体标准差的估计值最大允许误差第44页,共56页,2022年,5月20日,14点34分,星期三45第二节 总体平均数统计推断时样本容量的确定 例如为了考查在一个月之内,每天进行半小时英语听力训练的效果,拟对随机抽取的一组学生训练前后同一听力内容的测验结果,进行平均数差异的显著性检验。根据同类实验结果表明,实验前后成绩之差的标准差Sd=10,若确定单侧=0.05,=0.10,最大允许误差=4.2,问应抽多少人?分析根据题意,需用公式(14.10)对自身对照的两组分数进行单侧的相关样本平均数差异显著性检验。第4
28、5页,共56页,2022年,5月20日,14点34分,星期三46第二节 总体平均数统计推断时样本容量的确定 首先根据df=,单侧=0.05,=0.10,查t值表P(1),寻得单侧t()0.05=1.6449,及=0.10的t()0.10=1.2816,并将Sd=10,=4.2一并代入公式(14.10),则然后根据df=n-1=49-1=48,查t值表P(1),寻得单侧=0.05的t(48)0.05=1.678,=0.10的t(48)0.10=1.300,代入公式(14.10),则第46页,共56页,2022年,5月20日,14点34分,星期三47第二节 总体平均数统计推断时样本容量的确定 再根
29、据df=50-1=49,查t值表P(1),寻得单侧=0.05的t(49)0.05=1.677,=0.10的t(49)0.10=1.299,再代入公式(14.10),则因为最后连续两次计算出的n相等,即n2=n3=50,故应以抽取50人为宜。第47页,共56页,2022年,5月20日,14点34分,星期三48第三节 总体比率统计推断及相关系数著性检验时样本容量的确定一、用样本比率估计总体比率时样本容量的确定当总体比率接近0.5,随n的增大,样本比率的抽样分布趋向正态,这时对总体比率可近似用下式进行估计。(14.12) n所需样本容量Z/2值置于正态分布两端时相应的Z值最大允许误差p可能出现的样本
30、比率中最靠近50%的值第48页,共56页,2022年,5月20日,14点34分,星期三49第三节 总体比率统计推断及相关系数著性检验时样本容量的确定当总体比率越接近0或1,样本比率的抽样分布就越偏离正态分布此时从理论上说,应对 作反正弦的转换。而实际上转换与未转换的结果相差甚微,故也可以不转换,直接用公式(14.12)计算。第49页,共56页,2022年,5月20日,14点34分,星期三50第三节 总体比率统计推断及相关系数著性检验时样本容量的确定例如某县一所高中,历届高考升学率为0.55,拟估计应届高考升学率,要求误差不超过3%,估计的可信度为95%,问需抽多少人?分析根据题意是要对该校应届
31、高考总体升学率作估计。其p=0.55,=0.03,=0.05,其Z/2=1.96,将之代入上式,则若根据p=0.55,=0.03,=0.05,查由样本比率估计总体比率所需样本容量表,寻得n=1056,与计算结果完全相同。第50页,共56页,2022年,5月20日,14点34分,星期三51第三节 总体比率统计推断及相关系数著性检验时样本容量的确定二、两个样本比率差异显著性检验时样本容量的确定对两个样本比率进行差异显著性检验时,样本容量的确定首先需要用 的反正弦转换表将两个样本比率转换成然后根据下式计算样本容量。第51页,共56页,2022年,5月20日,14点34分,星期三52第三节 总体比率统计推断及相关系数著性检验时样本容量的确定(单侧) (14.13) (双侧) (14.14) n1和n2n1=n2时两个样本的容量;Z值置于正态分布一端时相应的Z值Z/2值分置于正态分布两端时相应的Z值Z与值相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 济宁学院《国际商务合同》2021-2022学年第一学期期末试卷
- 2024年大兴安岭客运从业资格证考试题库
- 福建省泉港一中2024届高三双基测试数学试题
- 植物基饲料原料的开发与利用
- 经济学案例展示课程设计
- 高中政治生活课程设计
- 模具课程设计模型教案
- 2024-2030年中国聚醋酸乙烯合成乳液行业运行动态及投资规划研究报告
- 2024-2030年中国糖蜜行业销售态势及消费趋势预测研究报告
- 2024-2030年中国电动洗扫车行业竞争动态与应用趋势预测报告
- 附件:东莞市机动车停放保管服务收费标准一、商场、娱乐场所
- 设备润滑记录
- 研发费用仪器、设备、无形资产的分配说明
- 议论文阅读-2016-2021河北语文中考真题汇编
- 校企合作资源共享管理制度
- 胫骨平台骨折手术治疗及术后PPT课件
- 心理应激与心身疾病-PPT课件
- 第5章金融资产ppt课件
- 原油电脱水处理技术(行业知识)
- 廉洁校园你我共塑PPT课件(带内容)
- 园林空间教学课件
评论
0/150
提交评论