版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1由样本对总体的相应特征进行统计推断。推断的可靠性与以下几种因素有关:1数据的质量;2运用统计方法及数据处理的准确性;3样本对总体的代表性。样本对总体的代表性,既涉及到抽样的方式,又涉及到样本的容量。第十四章 抽样设计第1页/共57页2第十四章 抽样设计第一节 抽样方法第二节 总体平均数统计推断时样本容量的确定第三节 总体比率统计推断及相关系数显著性检验时样本容量的确定第2页/共57页3第一节 抽样方法一、单纯随机抽样如果总体中每个个体被抽到的机会是均等的(即抽样的随机性),并且在抽取一个个体之后总体内成份不变(抽样的独立性)。这种抽样方法称为单纯随机抽样。第3页/共57页4第一节 抽样方法一
2、、单纯随机抽样有限总体根据抽样独立性原则,对于有限总体要用放回抽样方法,即将每一个从总体中抽出的个体,记录其结果之后,再放回总体之中,这样重复抽取n次就得到一组容量为n的样本。无限总体对于无限总体来说,由于抽出的个体放回与不放回并不改变总体的成分,因此抽样时并不要求放回。第4页/共57页5第一节 抽样方法一、单纯随机抽样在教育研究中,放回抽样往往成为不可能。因此在应用时即使是有限总体,如果总体的个数大于500,而且总体内的个体数是样本中个体数的10-20倍,也可视为接近无限总体,实行不放回抽样。第5页/共57页6第一节 抽样方法二、机械抽样把总体中的所有个体按一定顺序编号,然后依固定的间隔取样
3、(间隔的大小视所需样本容量与总体中个体数目的比率而定),这种抽样方法称为机械抽样。例如:为了了解某校大学一年级学生英语学习情况,拟从1500个大一学生中抽取1/10作为样本。先将这1500个学生的英语测验分数由低到高排列,并从1至1500编号,然后按1、11、21,号码的顺序和间隔抽取分数,并组成一个样本。第6页/共57页7第一节 抽样方法二、机械抽样机械抽样比单纯随机抽样能保证抽到的个体在总体中的分布比较均匀,而单纯随机抽样比机械抽样的随机性强,因为单纯随机抽样可以由总体内所有的个体组成任何可能的样本,而机械抽样对上例来说,只有10个可能样本,即:1、11、21;2、12、22;10、20、
4、30。第7页/共57页8第一节 抽样方法二、机械抽样机械抽样和单纯随机抽样两者也可以结合使用。如,上例先按机械抽样原则在1、2、10中抽取一个,至于抽哪一个可以用单纯随机抽样的办法确定。既可保持分布的均匀,又扩大了各个个体随机组合的可能性。第8页/共57页9第一节 抽样方法三、分层抽样按与研究内容有关的因素或指标先将总体划分成几部分(即几个层),然后从各部分(即各层)中进行单纯随机抽样或机械随机抽样,这种抽样方法称为分层抽样。总体分层的基本原则:各层内部的差异要小,层与层之间的差异要大。第9页/共57页10第一节 抽样方法三、分层抽样各层分配个数的方法有:1、按各层的人数比率分配当总体未知时,
5、从各层所抽的人数比率都应当等于样本的容量n与总体N之比。例如,对某校800个学生的品德情况进行了解,拟取40个学生作为样本。那么,可先根据一定标准将800个学生分成优(160人)、良(320人)、中(240人)、差(80人)四部分,然后从各部分中用单纯随机抽样或机械随机抽样的方法,各抽40/800=1/20。第10页/共57页11第一节 抽样方法三、分层抽样各层分配个数的方法有:2、最优配置法在从各层抽取对象时,既考虑各层的人数比率,又考虑各层标准差的大小,这种从各层抽取的对象的方法称为最优配置法。从各层所抽取人数的计算公式为:hhhhhNNnnnh从某一层所抽的人数n 样本的容量(即各层所抽
6、人数之和)Nh某层的人数h某层的标准差第11页/共57页12第一节 抽样方法例如,要了解某市高等教育自学考试的数学成绩,拟采用最优配置分层抽样方法。首先将考试成绩分成上中下三层,各层人数分别为120、420、60,其总人数为600,各层标准差估计为11、9、13,假如样本容量n已确定为65(按理n的大小也应是根据各种条件计算出来的),将有关数据代入上式,于是上中下各层应抽取人数分别为:155880132065136094201112011120651n4258809420651n958801360651n从各层所抽的人数比率为:125. 01201511Nn10. 04204222Nn15.
7、060933Nn由此可见,在标准差大的层里所抽的人数比率大 第12页/共57页13第一节 抽样方法四、整群抽样从总体中抽出来的研究对象,不是以个体作为单位,而是以整群为单位的抽样方法,称为整群抽样。例如,要了解某市某年物理学科高考的成绩,可以以学校为单位进行抽样。为了增强样本对总体的代表性,弥补整群抽样的不均匀性,可以与分层抽样相结合。先按一定的标准把全市所有中学分成几部分,如市重点、区重点、普通中学三类,然后根据比率,从三类学校中抽取若干学校,组成整群样本。第13页/共57页14第二节 总体平均数统计推断时样本容量的确定 确定样本容量的基本原则在尽量节省人力、经费和时间的条件下,确保用样本推
8、断总体达到预定的可靠度及准确性。统计推断的可靠度及准确性的提高与样本容量的增大不呈直线关系。样本容量增到一定程度,可靠度及准确性增高的速度开始放慢。第14页/共57页15第二节 总体平均数统计推断时样本容量的确定 在实际教育研究中,一般样本容量不会太小,可将有限总体视为无限总体。确定样本容量的各抽样方式均由单纯随机抽样方式来代替。以下确定样本容量时即作如此处理。第15页/共57页16第二节 总体平均数统计推断时样本容量的确定 一、由样本平均数估计总体平均数时样本容量的确定1、总体已知的情况当总体标准差已知,样本平均数与总体平均数离差的统计量呈正态分布。其统计量为:nXZ2/第16页/共57页1
9、7第二节 总体平均数统计推断时样本容量的确定 若由样本平均数估计总体平均数时,要求:最大允许误差为:可信度为1-,当=0.05,双侧临界值为Z0.05=1.96;当=0.01,双侧临界值为Z0.01=2.58。于是根据上式计算样本容量的公式为: (14.2)X22/Zn第17页/共57页18第二节 总体平均数统计推断时样本容量的确定 例如拟估计上海市高校四级英语考试的总体平均分数,根据历次考试成绩的标准差为13,这次的估计最大允许误差=2分,可信度为95%,问应当抽多少人?根据题意,是要由样本的平均数估计总体的平均数,总体的=13 ,=0.05,相应的Z0.05=1.96,=2,将其代入上式,
10、则1623 .16221396. 12n应当抽取162人。第18页/共57页19第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况当总体标准差未知,样本平均数与总体平均数离差统计量呈t分布,其统计量为:于是根据上式计算样本容量的公式为: (14.3)nSXt2/22/Stn第19页/共57页20第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况但t/2值不是一个常数,它随自由度df=n-1的大小而变化,当样本容量未确定之前,自由度无法确定,于是值也无法查出。一般采用尝试法:首先将自由度df=的t/2值代入上式,求出n1,然后将df=n1-1的t/2值再代入上式求出n2,
11、再将df=n2-1的t/2值再代入上式求出n3,以此方法重复下去,直至先后连续两次所求得的n相等为止,这时n就是所要确定的样本容量。第20页/共57页21第二节 总体平均数统计推断时样本容量的确定 例如:拟对某市初中升高中入学考试语文成绩的总体平均数进行估计。根据以同等难度的试题,对同等教育水平的另一城市部分初中升高中入学考试语文成绩算出的S=11.4。若要求估计的最大允许误差=3,可信度为99%,问样本容量应为多少?因为本题总体未知,应用公式(14.3)计算。首先根据df=及=0.01(双侧),查t值表,寻得t()0.01=2.5758,并将S=11.4,=3一并代入公式,于是968 .95
12、34 .115758. 221n第21页/共57页22第二节 总体平均数统计推断时样本容量的确定 然后根据df=96-1=95,查t值表,寻得双侧t(95)0.01=2.629,将其代入公式,则再根据df=100-1=99,查t值表,寻得双侧t(99)0.01=2.627,将其代入公式,则因为最后连续两次计算出的n相等,即n2=n3=100,故样本容量以n=100为宜。1008 .9934 .11629. 222n1007 .9934 .11627. 223n第22页/共57页23第二节 总体平均数统计推断时样本容量的确定 当估计计算出的样本容量可能会大于或等于30时,虽然总体未知,一般也可用
13、正态分布的统计量公式计算,因为此时这两个公式计算结果相差甚微。当估计样本容量可能会小于30时,以用t分布统计量公式的尝试法为宜。第23页/共57页24第二节 总体平均数统计推断时样本容量的确定 统计学家运用尝试法研制了由样本平均数估计总体平均数时所需样本容量表,表的左侧纵列表示总体标准差估计值S与最大允许误差之比S/的整数部分,上端横行表示S/值的一位小数值。可根据S/值及查表。第24页/共57页25第二节 总体平均数统计推断时样本容量的确定 二、样本平均数与总体平均数差异显著性检验(要考虑、错误)时样本容量的确定1、总体已知的情况根据样本平均数对总体平均数进行差异显著性检验时,其假设为:H0
14、:=0 ,H1:0H0是说,样本所来自的总体平均数就是0 ,H1是说,样本所来自的总体平均数不是0 。第25页/共57页26第二节 总体平均数统计推断时样本容量的确定 若H0为真,而遭拒绝,就会犯错误,则有2/0ZnX若H1为真,而遭拒绝,就会犯错误,则有ZnX第26页/共57页27第二节 总体平均数统计推断时样本容量的确定 在假设中既要考虑又要考虑,将以上二式相加为: ZZn2/0若令=-0 ,则2ZZn(单侧) (14.4) 22/ZZn(双侧) (14.5) n所需样本容量;Z值置于正态分布一端时相应的Z值Z/2值置于正态分布两端时相应的Z值Z与值相对应的正态分布Z值总体的标准差最大允许
15、误差第27页/共57页28第二节 总体平均数统计推断时样本容量的确定 上式中及值是由研究者预先确定的,值要确定得比值小。值一般确定为0.05或0.01。值一般确定为0.10、0.20、0.30。在及值确定后,若进行双侧检验,值要分置于分布的两端;若进行单侧检验,值要置于分布的一端。于是同一个值,其单、双侧Z的临界值是不相同的。而对于值来说,无论进行单侧检验还是双侧检验,其值总是置于分布的一端。第28页/共57页29第二节 总体平均数统计推断时样本容量的确定 例如:某区高三学能测验CEEB标准分数的平均数0=500,标准差=100,据高中教师的经验认为,高中连续三年参加体育运动对的学生,学能测验
16、比平均数低23分()。为了检验这一经验的可靠性,确定=0.05,=0.20,问应从该区高中连续三年参加运动队的高三学生中随机抽取多少人?分析:根据题意,是要对样本平均数与总体平均数进行单侧的差异显著性检验。 第29页/共57页30第二节 总体平均数统计推断时样本容量的确定 单侧=0.05的Z0.05=1.65。在寻找=0.20相应的Z值(Z0.20)时,要根据0.5-0.20=0.30,从正态分布表的P列中找到与0.30最相近的Z0.20=0.84,再将总体的标准差=100,=23,一并代入公式,于是1172 .1172310084. 065. 12n应随机抽取117名学生。第30页/共57页
17、31第二节 总体平均数统计推断时样本容量的确定 2、总体未知的情况当总体未知,样本平均数与总体平均数的离差统计量呈t分布。当对样本平均数与总体平均数的差异进行显著性检验时,需用下式通过尝试来确定样本容量2Sttn(单侧)(14.6) 22/Sttn(双侧) (14.7) n所需样本容量;t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值S总体的标准差的估计值最大允许误差第31页/共57页32第二节 总体平均数统计推断时样本容量的确定 例如某区各校初二劳技课内容之一,就是要到区劳技中心学习纺织一周,历届初二学生编织一只小篮子约需30分钟,总体标准差估计值S=4,为
18、了检验应届学生编织一只小篮子所用平均时间与历届学生是否相同,确定=0.05,=0.10,=-0=1.6,问需从应届学生中抽取多少人?分析根据题意,是要对样本平均数与总体平均数进行差异显著性检验。由于总体标准差未知,并且没有资料说明应届比历届平均用时是高还是低,故要用双侧检验的公式(14.7)进行尝试以确定样本容量。第32页/共57页33第二节 总体平均数统计推断时样本容量的确定 首先根据df=,=0.05,查t值表P(2),寻得双侧t()0.05=1.96,仍用t值表P(1)寻得df=,=0.10的t()0.10=1.2816,并将S=4,=1.6一并代入公式(14.7),则667 .656
19、. 142816. 196. 12n第33页/共57页34第二节 总体平均数统计推断时样本容量的确定 然后根据df=66-1=65,查t值表P(2),寻得双侧t(65)0.05=1.997,查t值表P(1),寻得=0.10的t(65)0.10=1.295,仍代入公式,则687 .676 . 14295. 1997. 12n再根据df=68-1=67,查t值表P(2),寻得双侧t(67)0.05=1.996,查t值表P(1),寻得=0.10的t(67)0.10=1.295,再代入公式,则687 .676 . 14295. 1996. 12n因为最后连续两次计算出的n相等,即n2=n3=68,故样
20、本容量以n=68为宜。第34页/共57页35第二节 总体平均数统计推断时样本容量的确定 该例可根据双侧=0.05,=0.10,/S=1.6/4=0.4,查样本平均数与总体平均数差异显著性检验所需样本容量表,寻得n=68,与用公式尝试法计算结果完全相同。(查表时注意:因为总体标准差未知,故用总体标准差估计值S代替)第35页/共57页36第二节 总体平均数统计推断时样本容量的确定 三、两个样本平均数差异显著性检验时样本容量的确定1、两个独立样本平均数差异显著性检验时样本容量的确定对两个独立样本平均数差异进行显著性检验时,两个相应的总体标准差一般为未知,故确定样本容量的公式为:2212Sttnn(单
21、侧) (14.8) 第36页/共57页37第二节 总体平均数统计推断时样本容量的确定 (双侧) (14.9) 22/212Sttnnn1和n2n1=n2时两个样本的容量;t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值S总体的标准差的估计值(假定S1=S2=S)最大允许误差第37页/共57页38第二节 总体平均数统计推断时样本容量的确定 例如拟考查重点中学在全市统一举行的计算机基础知识合格证书考试中平均分数是否高于一般中学8分(),确定=0.01,=0.10,根据经验,两类学校成绩的标准差相等,S1=S2=9,问样本容量应为多少?分析根据题意,需对重点中学及一
22、般中学此次考试成绩进行单侧的独立样本平均数差异显著性检验。第38页/共57页39第二节 总体平均数统计推断时样本容量的确定 首先根据df=,=0.01,查t值表P(1),寻得单侧t()0.01=2.3263,仍用t值表P(1)寻得df=,=0.10的t()0.10=1.2816,并将S=9,=8一并代入公式(14.8),则339 .32892816. 13263. 222)1(2)1(1 nn第39页/共57页40第二节 总体平均数统计推断时样本容量的确定 然后根据df=n1+n2-2=33+33-2=64,查t值表P(1),寻得单侧=0.01的t(64)0.01=2.386,查t值表P(1)
23、,寻得=0.10的t(64)0.10=1.295,仍代入公式,则343 .3489295. 1386. 222)2(2)2(1 nn再根据df=n1+n2-2=34+34-2=66,查t值表P(1),寻得单侧=0.01的t(66)0.01=2.385,查t值表P(1),寻得=0.10的t(66)0.10=1.295,仍代入公式,则343 .3489295. 1385. 222)3(2)3(1 nn因为最后连续两次计算出的n1(2)=n2(2)= n1(3)=n2(3) =34,所以需从重点中学及一般中学各抽34人。第40页/共57页41第二节 总体平均数统计推断时样本容量的确定 该例也可根据单
24、侧=0.01,=0.10,/S=8/9=0.89,查两个样本平均数差异显著性检验所需样本容量表,寻得n1=n2= 34.8,与用公式尝试法计算结果相近。(查表时注意:因为总体标准差未知,故用总体标准差估计值S代替)第41页/共57页42第二节 总体平均数统计推断时样本容量的确定 2、两个相关样本平均数差异显著性检验时样本容量的确定对于同一组对象实验前后在同一个测验上的两组分数,或者对于由于各中条件基本相同的原则匹配成对的两组对象,施以不同实验之后统一测验的两组分数,进行平均数差异显著性检验时所需样本容量的计算公式为:第42页/共57页43第二节 总体平均数统计推断时样本容量的确定 进行平均数差
25、异显著性检验时所需样本容量的计算公式为:2dSttn22/dSttn(双侧) (14.11) (单侧) (14.10) n所需样本容量(即前后测所针对的同一组对象的人数或匹配成对的对子数);t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值Sd每对数据之差的总体标准差的估计值最大允许误差第43页/共57页44第二节 总体平均数统计推断时样本容量的确定 例如为了考查在一个月之内,每天进行半小时英语听力训练的效果,拟对随机抽取的一组学生训练前后同一听力内容的测验结果,进行平均数差异的显著性检验。根据同类实验结果表明,实验前后成绩之差的标准差Sd=10,若确定单侧=0
26、.05,=0.10,最大允许误差=4.2,问应抽多少人?分析根据题意,需用公式(14.10)对自身对照的两组分数进行单侧的相关样本平均数差异显著性检验。第44页/共57页45第二节 总体平均数统计推断时样本容量的确定 首先根据df=,单侧=0.05,=0.10,查t值表P(1),寻得单侧t()0.05=1.6449,及=0.10的t()0.10=1.2816,并将Sd=10,=4.2一并代入公式(14.10),则496 .482 . 4102816. 16449. 121n然后根据df=n-1=49-1=48,查t值表P(1),寻得单侧=0.05的t(48)0.05=1.678,=0.10的t
27、(48)0.10=1.300,代入公式(14.10),则503 .502 . 410300. 1678. 122n第45页/共57页46第二节 总体平均数统计推断时样本容量的确定 再根据df=50-1=49,查t值表P(1),寻得单侧=0.05的t(49)0.05=1.677,=0.10的t(49)0.10=1.299,再代入公式(14.10),则502 .502 . 410299. 1677. 123n因为最后连续两次计算出的n相等,即n2=n3=50,故应以抽取50人为宜。第46页/共57页47第三节 总体比率统计推断及相关系数著性检验时样本容量的确定一、用样本比率估计总体比率时样本容量的
28、确定当总体比率接近0.5,随n的增大,样本比率的抽样分布趋向正态,这时对总体比率可近似用下式进行估计。ppZppZn1122/22/(14.12) n所需样本容量Z/2值置于正态分布两端时相应的Z值最大允许误差p可能出现的样本比率中最靠近50%的值第47页/共57页48第三节 总体比率统计推断及相关系数著性检验时样本容量的确定当总体比率越接近0或1,样本比率的抽样分布就越偏离正态分布此时从理论上说,应对 作反正弦的转换。而实际上转换与未转换的结果相差甚微,故也可以不转换,直接用公式(14.12)计算。p第48页/共57页49第三节 总体比率统计推断及相关系数著性检验时样本容量的确定例如某县一所
29、高中,历届高考升学率为0.55,拟估计应届高考升学率,要求误差不超过3%,估计的可信度为95%,问需抽多少人?分析根据题意是要对该校应届高考总体升学率作估计。其p=0.55,=0.03,=0.05,其Z/2=1.96,将之代入上式,则10564 .105655. 0155. 003. 096. 11222/ppZn若根据p=0.55,=0.03,=0.05,查由样本比率估计总体比率所需样本容量表,寻得n=1056,与计算结果完全相同。第49页/共57页50第三节 总体比率统计推断及相关系数著性检验时样本容量的确定二、两个样本比率差异显著性检验时样本容量的确定对两个样本比率进行差异显著性检验时,样本容量的确定首先需要用 的反正弦转换表将两个样本比率转换成然后根据下式计算样本容量。pparcsin2第50页/共57页51第三节 总体比率统计推断及相关系数著性检验时样本容量的确定221212ZZnn2212/212ZZnn(单侧) (14.13) (双侧) (14.14) n1和n2n1=n2时两个样本的容量;Z值置于正态分布一端时相应的Z值Z/2值分置于正态分布两端时相应的Z值Z与值相对应的正态分布的Z值11arcsin2p22arcsin2p第51页/共57页5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卷1-备战2022年中考生物【名校地市好题必刷】全真模拟卷(全国2024)·第一辑(解析版)
- 安全教育:打雷下雨时怎办
- 金融员工法律知识
- 气体钢瓶安全操作规程
- 家庭住宅木地板安装合同
- 学区房二手房买卖合同模板
- 建筑设计退休设计师聘用协议
- 水电站后勤保障合同
- 美食广场餐饮服务人员培训计划
- 钢筋施工拓展协议
- 药店连锁加盟协议书(完整版)
- 高中地理知识体系的建构
- 高压真空断路器及成套设备型式试验的项目参数及试验方法
- 连接器领域:立讯精密企业组织架构及部门职责
- 汉语拼音书写纸(打印版).
- 手铐使用技术
- 高一物理必修一课程纲要Word版
- 设备单机试运转记录
- 人教版小学数学三年级下册《年 月 日》的认识-文档资料
- 全风险全流程外包概述
- 培养研究生的一点经验和体会.PPT
评论
0/150
提交评论