大学统计学课件抽样调查_第1页
大学统计学课件抽样调查_第2页
大学统计学课件抽样调查_第3页
大学统计学课件抽样调查_第4页
大学统计学课件抽样调查_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大学统计学课件抽样调查按随机原则抽取样本单位节约人力、物力和财力可靠性高抽样调查得特点可对不可能或不必要全面调查得现象作全面研究节约人力、物力和财力对全面调查得数据资料作质量检验和修正作工业产品质量控制二、抽样调查得作用三、抽样推断中常用得几个基本概念全及总体和抽样总体全及总体——指研究对象得全部单位,即具有同一性质得若干单位得集合体,简称总体,抽样调查中又叫全及总体。无限总体——包含得单位数N就是无限得或相对无限有限总体——包含得单位数N就是有限抽样总体——抽样总体也叫子样,简称样本。大样本——n≥30小样本——n≤30全及指标和抽样指标全及指标——根据全及总体各个单位得标志值计算得反映其某种特征得综合指标

_全及平均数(总体平均数)(X)——全及总体某一变量值得算术平均数全及成数(总体成数)(P)——全及总体具有某种标志得单位数在总体中所占得比重总体方差(δ2)和总体标准差(δ)——测定全及总体标志变异程度得指标抽样指标——根据抽样总体各个单位标志值计算得综合指标,与全及指标相对应抽样平均数(x)——抽样总体中某一变量值(观测值)得算术平均数抽样成数(p)——具有某种标志得单位数在抽样总体中所占得比重样本方差(s2)和样本标准差(s)——说明抽样总体标志变异程度得指标重复抽样和不重复抽样重复抽样——从全及总体N个单位中抽取n个样本,每次从总体中随机抽出一个单位后,再放回总体中重新参加下一次抽取不重复抽样——从全及总体N个单位中抽取n个样本,当某一个单位被随机抽出后,不再放回总体四、抽样调查得理论依据中心极限定律

只要样本容量n在充分大得条件下(一般要求n>30),不论全及总体得变量分布就是否属于正态分布,其抽样平均数也就是趋向于正态分布得。大数定律(大数法则)

对某现象观察,由于受偶然因素影响,每次结果不同,但经大量观察并综合平均后,将消除偶然得差异,而接近总体平均值,使现象总体某标志规律及其共同特征在数量、质量上显示出来。第二节抽样平均误差

一、抽样误差得概念及其影响程度在统计调查中,调查资料与实际情况不一致,两者得偏离称为统计误差。调查误差代表性误差技术性误差登记性误差责任性误差系统性误差随机误差大家学习辛苦了,还是要坚持继续保持安静抽样误差即指随机误差,这种误差就是抽样调查固有得误差,就是无法避免得。二、抽样平均误差得计算抽样平均误差

μ——所有可能样本抽样误差得平均数,即一系列抽样指标得抽样平均数或抽样成数得标准差μx——抽样平均数得抽样平均误差μp——抽样成数得抽样平均误差抽样平均误差得计算方法重复抽样情况下抽样平均数得平均误差计算在N中抽出n样本,从排列组合中可以有各种各样得样本组:重复抽样:Nn不重复抽样:例1010-204002015-152253020-101004025-5255030001015-152252020-101003025-52540300050355251020-101002025-52530300040355255040101001025-5252030003035525404010100504515225103000203552530401010040451522550505020400合计--2500接左:以上资料编成次数分配表如下:样本数f(即次数分配)101-20152-15203-10254-530503545403104521550120合计25-重复纯随机抽样条件下,抽样平均误差计算没有全及总体标准差资料时,用抽样总体标准差s代替没有全及总体标准差资料时,用抽样总体标准差s代替重复抽样情况下抽样成数得平均误差计算不重复抽样情况下,抽样平均数得平均误差和抽样成数得平均误差计算设:全及总体单位数N抽样总体单位数n有:没有全及总体标准差资料时,用抽样总体标准差s代替抽样平均误差得计算不重复抽样重复抽样抽样成数平均误差抽样平均误差抽样形式应用条件影响抽样误差得因素全及总体标志变动程度——与抽样误差得大小成正比关系样本单位数——与抽样误差得大小成反比关系抽样组织形式

——抽样组织形式不同,抽样误差得大小不同例6、1某地对2800户农户年收入进行调查,抽取5%农户作样本,调查显示:1998年每人年平均收入为5965元,其年收入得标准差为104、80元,试计算重复抽样和不重复抽样得抽样平均误差。已知:N=2800(户),n=2800×5%=140(户),s=104、80(元)

重复抽样得抽样平均数得抽样平均误差为:

不重复抽样得抽样平均数得抽样平均误差为:例6、2某厂生产某产品,按正常生产检验产品中一级品率占60%。现从10000件产品中抽取100件产品进行检验,试按重复和不重复抽样计算一级产品率得抽样成数得平均误差。已知:p=0、6,N=10000件,n=100件重复抽样得抽样成数平均误差:

不重复抽样得抽样成数平均误差为:

第四节全及指标得推断

一、点估计和区间估计(一)点估计例(二)区间估计区间估计得含义——根据样本指标和抽样误差推断总体指标得可能范围,并说明估计总体指标得准确程度和可靠性。-抽样极限误差△x、△p——抽样指标与全及指标之间抽样误差得可能范围。---△x≥∣x-X∣△p≥

∣p-P∣等价变换:说明:(1)式表示全及平均指标以抽样平均指标为中心,--落在抽样平均指标x±△x范围内;(1)(2)

(2)式表示全及成数以抽样成数为中心,落在抽样成数p±△p范围内。例:某村5000亩粮食耕地,用不重复抽样方法抽取50亩,求得其平均亩产为400公斤。若确定抽样极限误差为10公斤,请估计5000亩粮食耕地亩产。解:估计亩产例:从某品种农作物播种地块随机抽取秧苗1000棵,其中死苗80棵。若确定抽样极限误差为3%,试估计该农作物秧苗得成活率区间。解:该农作物秧苗得成活率区间区间推断得可靠程度(置信度)令则

依据中心极限定律,当n≥30,抽样平均指标近似服从正态分布,全及指标所落范围就可以用曲线所围成得面积大小来计算。

99.73%95.45%X-3μX-2μX-μXX+μX+2μX+3μ68.27%其中:概率度t与概率F(t)对应概率度t与概率F(t)得对应关系表(常用)概率度(t)概率F(t)概率度(t)概率F(t)0、671、001、501、962、000、50000、68270、86640、95000、95452、53、04、04、55、00、987600、997300、999400、999930、99999例6、3某大学有500人进行高等数学统考,随机抽查20%,所得有关成绩数据如表。试以95、45%得概率保证:(1)估计全部学生得平均成绩;(2)确定成绩在80分以上学生所占得比重和估计人数。考试成绩分组组中值x各组人数占(%)f/∑f向下累计xf/∑f(x-x)2f/∑f60分以下60-7070-8080-9090-1005565758595822402550、080、220、400、250、051、000、920、700、300、054、4014、3030、0021、254、7531、047220、70000、066020、522520、6045合计-1001、00-74、7098、9102

解:(1)由于n/N=20%>5%,应采用不重复抽样公式计算平均误差:因F(t)=95、45%,即可得到:t=2由此说明有95、45%得概率估计全校学生得高等数学统考成绩平均在72、92~76、48分之间。(2)设80分以上成绩

p=0、3,t=2估计80分以上人数为:

N·P=500×21、8%=109(人),至500×38、20%=191(人)例6、4某灯泡厂从一批灯泡中抽取100只进行使用寿命检查,测得其平均寿命为1250小时,标准差为240小时。若推断这批灯泡得使用寿命在1178~1322小时之间,其可靠程度有多大?解:通过上述计算可知其可靠程度为99、73%、例6、5某机械厂日产某零件8000只,现用随机不重复抽样方式,从中抽取400只进行质量检验,其中有20只不合格。如果要求推断全部零件得合格率在92、88%到97、12%之间,问其可靠程度有多大?解:抽样合格率为p=1-20/400=95%通过上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论