试议抽样调查中的概率论_第1页
试议抽样调查中的概率论_第2页
试议抽样调查中的概率论_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试议抽样调查中的概率论武昇发表于?石河子科技? 2021年第3期概率论最根本的概念,是在社会和自然界中某一类事件在相同的条件下可能发生也可能不发生,它的发生具有偶然性, 这类事件称为随机事件或偶然事件,不同的随机事件发生的可能性大小是不同的。 也就是说概率是用来表示随机事件发生的可能大小的一个量。很自然的把必然发生的事件的概率规定为1即肯定;并把不可能发生的事件的概率规定为0,即否认。而实际上一般随机事件的概率不是绝对的肯定或绝对的否认,而是介于1和0之间的一个数,即可分出多个层次。概率越大表示事件发生的可能性也越大。在统计学中,对应该全部调查的对象称为总体,而随机抽取的假设干个体称为总体的样

2、本。用全部调查的结果虽然能够准确的反映事物的真实数目,但它的缺乏之处在于工作量大、花费人力、物力多,时间也拖的过长,且在许多特定条件下也是不可能的。只能采取抽样调查其中的一局部,获得事物的某些数据指标,进而推算总体,即用概率论的研究成果,通过样 本来分析和判断总体。这就是抽样调查方法。由于各种偶然因素的影响是随机的,因此,在调查时的抽样也必须是随机的。只有这样, 才能比拟有效地消除正负两方面偶然因素的影响,提高统计值的准确性。调查的数量越多, 偶然因素之间的相互抵消的就越彻底,总体的在规律也就表现的越充分,这也是客观世界的一个普遍规律。归纳起来,随机抽样调查方法有两个显著的特点:一是从原那么上

3、讲完全排斥了人民有意义的选择,不掺杂任何调查者的主观判断。也就是说,抽中和抽不中完全是偶然的,每一个单位被抽取的时机是均等的。二是在缺少资料的情况下, 通过对局部单位的调查研究,获得某些数据,计算统计指标,即可对事物的总体情况作出相当可靠的推算。现在我们举一应用实例,来阐述整个抽样调查的全过程。兵团播送电视大学系统在我校 评估时,曾对某专业同一年级94名学生的学习成绩进行了抽样调查,是按整群非重复抽样样本分数偏差偏差的平方编号(Xi)(Xi-X )( Xi - X )18539277-525380-244842458200688636778-416刀574样本的数字特征有:方法,抽取7名学生作

4、为样本的。其考试成绩列入下表,并推算有关指标。样本平均数X。可表示样本各数的集中位置,它是代替总体指标一般水平的统计指标。假设样本为X1,X2,、Xn时。按式1 计算。将数代入得:-1 nX=Xi= 82 分n i i样本方差S2样本标准差S。可表示样本中各数与集中位置的偏离程度。在抽样调查中占有 很重要的位置。当 nW 30时为小样本,按式2 3计算。将数代入得:S2=1n -1Xi-X) 2=15.67S=;n-1i1(XX) =3.96(3)式中:n 抽取样本的个数 Xi 样本个体分数值ni 1x 样本个体分数值之和n-1 t分布的自由度。与时为大样本。N比拟大时,n与n-1的差异是很小

5、的,为简便起见,可将n近似的代替式中的 n-1。nXi - X 2样本个体偏差的平方和i 1抽样调查是一种非全面的调查,其数量特征同它的总体不完全相同,不同的样本将是不同的样本的指标。所以,各样本平均指标之间存在着差异,与总体平均指标之间也存在着不同程度的差异,这就是抽样误差。平均指标的抽样误差,是指所有的样本指标和总体指标的平均离差,可按式4计算。非重复抽样是将从总体单位中已随机抽取出来的样本单位除去,只从剩下的总体单位中再抽取。即每个总体单位多只能被抽中一次, 代表性就大,所以,平均指标的抽样误差就小, 精度就高。将数代入:S2/Nn S n、Ux()(1 M) =1.487n n 1,

6、n N当N很大时,N-5与N-1差异是很小的,为简便起见,可将N近似的代替式中 N-1。区间估计是根据样本指标和平均指标的抽样误差计算总体指标所在的围,表示的是一个非绝对准确的围,即推断总体指标在这个围的判断不是十分肯定的,只有一定的把握概率。那么,对的平均指标的抽样误差来说,总体指标落在估计区间的把握概率究竟有多大呢? 一般比拟常用的是以95%的把握概率作为区间估计,即t的取值为1.96,区间估计的把握程度概率按式5计算。x -t U x X = X + t U x将数代入得:82-1.96 x 1.487 x 82+1.96 X 1.487 79 x 85式中:T平均指标的抽样误差个数X总

7、体指标平均数因此,我们可以得出这样的结论,某专业同一级的学生平均考试分数在82分左右,并有95%的把握概率推断总体平均考试分数在79 85之间。不难看出,扩大平均指标的抽样误差,可以提高推断的把握程度概率;反之,那么降低推断的把握程度概率。即平均指标的抽样误差围的变化和作推断的把握程度概率之间是有着一定数量关系的。搞抽样调查时抽取的样本单位应该大致是多少?这是调查者在制定方案时首先需要考虑的问题。抽取的样本单位如果太少,估计值就可能不太准确,达不到所要求的精度;抽取的样本单位过多,也有很多缺乏之处。因此,科学地抽取样本单位是很必要的。假设,调查者认为总体学生平均考试分数推断结果近似为82 3分

8、,即平均指标的抽样误差为1.48时,已到达了所要求的精度,那么,就证明从总体94各学生中抽取7名作为样本是合理的;又如,调查者认为平均指标的抽样误差尚未到达精度要求,而是总体学生平均考试分数区间估计精度还要提高。设将总体学生平均考试分数区间估计控制在82 2分之间时,那么,平均指标的抽样误差那么为,按式6计算所需抽取的学生人数。将数代入得:Nt2S2NLf t2s236 人式中:N 总体学生人数。94人LX 平均指标的允许抽样误差,1.02用同样方法也可推断出要求降低区间指标的估计精度。所需抽取的学生人数。从以上计算结果看出,假设从总体学生平均考试分数区间估计在82 3 分之间的精度提高到82 2分之间的精度时,虽然平均指标的抽样允许误差由1.4817降到1.02,降低了31.4%。但所需抽取的学生人数却由7人增加到36人,提高了 414.3%。这就说明,它们之间的变动副值是不成比例的。所以,在区间指标估计精度控制上需要慎之又慎,绝不可盲目的追求高精度,否那么将会造成极大的浪费。再者t的取值与相应的概率取值关系甚密,t究竟采用何值最好,要根据工作实际的需要而定。实践证明,抽样调查方法产生的平均指标抽样误差,主要来自于三个方面:一是受样本个体数量的影响。样本个体数量大代表性就强,误差就小;反之,代表性就差,误差就大。二是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论