数学抽样方法和总体分布的估计_第1页
数学抽样方法和总体分布的估计_第2页
数学抽样方法和总体分布的估计_第3页
数学抽样方法和总体分布的估计_第4页
数学抽样方法和总体分布的估计_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学抽样方法和总体分布的估计随机抽样考纲要求:①理解随机抽样的必要性和重要性;②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.简单随机抽样1.定义:设一个总体的个数为N,如果___________________从中抽取一个样本,且每次抽取时各个个体_________________,称这样的抽取为简单随机抽样.通过逐个被抽到的概率相等抽签法随机数表法(1)

.(2)

.2.简单随机抽样的常用方法:抽取的方法随机数表法的步骤(1)编号;(如00,01,02,…60)(2)在随机数表中任选一个数作为开始.(如从第8行第8列开始)(3)从选定的数开始按一个方向(如向右)读下去,读到(1)中的编号则取出,直到取够样本为止.系统抽样1.定义:当总体的个体数N较大时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本.这种抽样叫做系统抽样。

2.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(分段数等于样本容量)(3)在第一段中用简单随机抽样确定起始的个体编号;(4)抽取样本.分层抽样1.定义:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.2.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样.例题分析1.(09’湖南)一个总体分为A,B两层,其个体数之比为4:1,用分层抽样方法从总体中抽取一个容量为10的样本,已知B层中甲、乙都被抽到的概率为则总体中的个体数为_____.402.(09’广东文)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是____.若用分层抽样方法,则40岁以下年龄段应抽取______人.3.(05’湖北)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,27 0.系统、分层分层A.②③都不能为系统抽样 B.②④都不能为分层抽样C.①④都可能为系统抽样 D.①③都可能为分层抽样系统、分层不是系统、不是分层4.(2010’湖北)将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8,B.25,17,8C.25,16,9D.24,17,95.(2010’安徽)某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收人家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是_______.(百分比)三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样系统抽样分层抽样从总体中逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取抽样过程中每个个体被抽取的概率相等将主体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成总体估计(1)①了解分布的意义和作用,会列频率分布表,会画频率分布直方图,频率折线图,茎叶图,理解它们各自的特点.②会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.③会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.④利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.用样本的频率分布估计总体分布①列样本的频率分布表②绘制频率直方图.列频率分布表的步骤1、计算数据中最大值与最小值的差(称极差).(即这组数据变动的范围有多大)2、决定组数与组距.(数据越多,分的组数越多)3、决定分点.4、列频率分布表.(分组、频数、频率、累积频率)绘制频率分布直方图的步骤1、以横轴表示总体分组,以纵轴表示频率与组距的比值;2、以每个组距为底,以各频率与组距的比为高,分别画成矩形.例题分析例、为了了解中学生的身高情况,对某中学同龄的50名男学生的身体进行了测量,结果如下(单位:cm)175168170176167181162173171177171171174173174175177166163160166166163169174165175165170158167174172166172176172175161173167170172165157172173166177169列样本的频率分布表,画频率分布直方图.解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成6组.根据题意列出样本的频率分布表如下:分组频数频率累积频率合计341213144500.060.080.240.260.280.081.000.060.140.380.640.921.00[157,161)[161,165)[165,169)[169,173)[173,177)[177,181]身高(cm)频率组距频率分布直方图0.0150.020.060.0651571651731811611691770.07(07’山东)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,右图是频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A.0.9,35 B.0.9,45C.0.1,35 D.0.1,45013141516171819秒频率/组距0.360.340.180.060.040.02A(09’山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是().A.90B.75C.60D.4596981001021041060.1500.1250.1000.0750.050克频率/组距(07’湖北)在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:(I)在答题卡上完成频率分布表,并在给定的坐标系中画出频率分布直方图;分组频数频率4253029102合计1000.040.250.300.290.100.021.00样本数据1.301.341.381.421.461.501.54频率组距(II)估计纤度落在[1.38,1.50)中的概率及纤度小于1.40的概率是多少?(III)统计方法中,同一组数据常用该组区间的中点值(例如区间[1.30,1.34)的中点值是1.32)作为代表.据此,估计纤度的期望.绘制频率分布折线图

连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.157165173181频率组距0.0150.020.060.0650.03161169177身高(cm)······频率分布与相应的总体分布的关系

频率分布是随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会变成一条光滑曲线——总体密度曲线(反映总体分布的概率).正态函数的定义

若总体密度曲线具有“中间高,两头低”的特征,像这种类型的总体密度曲线,一般就是或近似地是以下一个特殊函数的图象:

式中的实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差.函数f(x)称为正态函数。正态分布与正态曲线

若总体密度曲线就是或近似地是函数

的图象,则其分布叫正态分布.正态分布由参数μ,σ唯一确定,常记作N(μ,σ2).

f(x)

的图象称为正态曲线。观察图象、归纳性质

x=-1xyo-1μ=-1,σ=0.5oxyx=0μ=0,σ=1oxyx=1μ=1,σ=2正态曲线的性质①曲线在x轴的上方,与x轴不相交.②对称性:关于直线x=μ对称,且在x=μ时位于最高点.③单调性:先增后减,以x轴为渐近线.④当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.

⑤曲线与x轴之间的面积为1.A(08’安徽,10)设两个正态分布和的密度函数图像如图所示。则有()例题分析1.若随机变量ξ~N(μ,σ2),且P(ξ≤c)=P(ξ>c),则c的值为

.μ2.若随机变量ξ~N(2,22),则D(0.5ξ)=____.13.若随机变量ξ~N(0,1),η~N(μ,σ2),则η=()A.σξ-μB.σξ+μC.σ(ξ+μ)B(2010’广东,7)已知随机变量X服从正态分布N(3,1),且P(2

≤X

≤4)=0.6826,则P(X>4)=()A.0.1588B.0.1587C.0.1586D.0.1585(08’湖南,4)设随机变量服从正态分布若则c=()A.1 B.2 C.3 D.4B

若则X在以下三个特殊区间内取值的概率值为:例1.在正态总体中,数值落在(-∞,-1)∪(1,+∞)里的概率为________.例2.若则P(6<X<7)=________.总体估计(2)①理解样本数据标准差的意义和作用,会计算数据标准差.②能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.相关的概念:①众数:②中位数:③平均数:若样本容量n为偶数,则中位数为若样本容量n为奇数,则中位数为若样本从小到大为:x1,x2,…,xn④标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论