随机抽样、用样本估计总体、正态分布_第1页
随机抽样、用样本估计总体、正态分布_第2页
随机抽样、用样本估计总体、正态分布_第3页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11.6 随机抽样用样本估计总体正态分布教材细梳理- 知识点一 . 随机抽样1. 简单随机抽样(1).定义:一个总体含有N个个体,从中逐个_地抽取 n 个个体作为样本 ( n N) ,如果每次抽取时总体内的各个个体被抽到的机会_ _,就把这种抽样方法叫做简单随机抽样(2).最常用的简单随机抽样方法有两种_ _法和 _ 法(3).适用于的情况 .2. 系统抽样(1).定义:将总体分成的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样.(2).系统抽样步骤:假设要从容量为N的总体中抽取容量为n 的样本a.先将总体的N个个体有时可直接利用个体自

2、身所带的号码,门牌号等;(编号的位数要一样).如学号、准考证号、NNb.确定,对编号进行分段当n( n 是样本容量) 是整数时,取k n;c.在第 1 段用 _确定第一个个体编号d.按照一定的规则抽取样本通常是将l?l ( l k) ;得到第 2 个个体编号( l k) ,再加k 得(3).到第 3 个个体编号系统抽样适用于?( l 2k)依次进行下去,直到获取整个样本的情况 .3. 分层抽样(1).定义:当总体由 ?组成时, 为了使抽取的样本更好地反映总体的情况, 可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占?进行简单随机抽样或系统抽样,这

3、种抽样方法叫做分层抽样.(2).分层抽样适用于总体由差别明显的几部分组成的情况.二 . 样本估计总体有关概念和知识点1通常我们对总体作出的估计一般分成两种一种是用样本的布另一种是用样本的估计总体的数字特征._估计总体的分2. 频率分布直方图画法(1) 求极差(最大值 - 最小值 =极差) .(2) 决定组距与组数 .(3) 确定分点,将数据分组 .(4) 统计频数,计算频率,制成表格.频率(5) 以为Y 轴,以数据为X 轴,画出频率分布直方图.组距3在频率分布直方图中,纵轴表示_ ,数据落在各小组内的频率用各小长方形的 _表示各小长方形的面积总和_.4连接频率分布直方图中各小长方形上端的,就得

4、到频率分布折线图随着样本容量的增加,作图时所分的组数增加,减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线, 统计中称之为总体密度曲线, 它能够更加精细的反映出总体在各个范围内取值的百分比 .5. 茎叶图以数据的高位为茎,放中间,低位为叶放两边,它的优点是:( 1)保留了原始数据,没有损失样本信息.( 2)数据可以随时记录、添加或修改.6. 用样本的数字特征估计总体的数字特征(1)众数定义:在一组数据中,出现次数的数据叫做这组数据的众数(2)中位数定义:将一组数据按大小依次排列,把处在_ 位置的一个数据 ( 或最中间两个数据的平均数) 叫做这组数据的中位数 .(3)平均数定义:样本数据

5、的算术平均数即x _.(4)频率分布直方图中中的特征数把最高小长方形底边 ?的横坐标作为众数;中位数左边和右边的直方图的?应该相等;平均数等于频率分布直方图中每个小长方形?乘以小长方形底边 ?之和 .(5) . 样本方差,标准差公公式方差 s2(x1 x)2( x2 x) 2( xn x) 2.n标准差 s( x1 x)2(x2x)2( xnx)2n.平均数反映了数据的整体情况,受极值影响较大。 标准差是反映总体波动大小的特征数.7. 平均数、方差计算公式的推论若数据 x1,x2, , xn 的平均数为 x ,方差为 s2,则: x1b, x2 b, , xn b 的平均数是 x b,方差是

6、s2; ax1,ax2, , axn 的平均数是 a x ,方差是 a2 s2 ; ax1b, ax2 b, , axn b 的平均数是 a x b,方差是三 、正态分布有关概念及知识点1. 正态曲线定义定义:像总体密度曲线那样,具有1( x) 2, ( x )e222, x ( ,) , 其中实数和称为正态分布密度曲线,简称2. 正态曲线的特点(1) 曲线在 x 轴的 _ _,与 x 轴不相交(2) 曲线关于直线 x _ 对称1(3) 曲线在 X= 处达到峰值 2a2 s2 .的特征的函数近似表示为(0) 为参数,它的图象(4) 曲线与 x 轴间的面积为.(5) 当 X 时,曲线上升 ( 增

7、函数 ) ;当 X 时,曲线下降 ( 减函数 ) 并且当曲线向左、右两边无限延伸时,以X 轴为渐近线,向它无限靠近( 6)当 一定时,曲线的位置由 确定,曲线随着X= 的变化而沿x 轴平移( 7) 一定时,曲线的形状由 确定 越大,曲线越,总体分布越分散; 越小,曲线越总体分布越集中3. 正态分布定义及表示b( 1)定义:对于任何实数ab ,随机变量 X 满足 P(aXb),( x)dx ,则称随机a变量 X 服从正态分布记作,其中参数是总体的,参数是总体的4. 3 原则( 1)定义:如果X N (,2 ) ,通常认为随机变量X 的取值落在区间,内称之为 3 原则( 2)三个特殊区件概率P(X

8、)?;P(2X2)?;P(3X3)?教材细梳理答案一:不放回; 相同 ; 抽签法 ; 随机数表法 ; 总体个数较少均衡 ; 系统抽样 ; 编号 ; 分段间隔k; 简单随机抽样; ? 加上间隔k; ? 总体中的个体数较多; ? 瘦高 ; ? 比例频率二:频率分布; 数字特征 ; 组距; 面积 ; 1; 中点 ; 组距 ; 最多 ;中间 ; x1x2.n; ? 中点 ; ? 面积 ; ? 面积 ; ? 中点横坐标;n三:两头低、中间高、左右对称; 正态曲线 ; 上方 ; ; 1; 矮胖 ; 瘦高 ;X N( ,2);期望 ;标准差 ;?0.6826;? 0.9544; ?0.9974 ;考点精解析

9、 - 方法问题一:随机抽样问题例 12014 湖南卷 对一个容量为 N的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则 ()A123B231C13p2D12p3ppppppppp p点拨与解析 : 随机抽样中,每个个体被抽到的机会是均等的.解:不管是简单随机抽样、系统抽样还是分层抽样,它们都是等概率抽样,每个个体被抽中n的概率均为 N. 所以选 D.例 2. 2014 天津卷 某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法, 从该校四个年级的本科生中抽取一个容量为300 的样

10、本进行调查 已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取 _名学生点拨与解析 :由于总体各部分差别比较明显,所以采取分层抽样即按比例抽取.4解:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300 4 5 5 6 60.例 3. 已知某商场新进3 000 袋奶粉,为检查某维生素是否达标,现采用系统抽样的方法从中抽取 150 袋检查,若第 1 组抽出的号码是 11,则第 61 组抽出的号码为 _ 点拨与解析 :系统抽样是抽多少个个体,把总体均分成多少组,每组抽取一个,间隔相等3 000解:150 20,需把3 000袋奶粉按0,1,2,3, ,

11、2 999编号,然后分成150 组,每组 20 个号码第61 组抽出的号码为11 (61 1) 20 1 211.答案: 1 211思维方法小结:1、三种抽样方法中,每个个体被抽到的概率是相同的.2简单随机抽样是系统抽样和分层抽样的基础,是一种等可能的抽样,由定义应抓住以下特点:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回抽样3系统抽样又称等距抽样,号码序列一确定,样本即确定了,第一组的抽取的个体必须是随机抽取的,分段间隔必须为整数,当分段间隔不是整数,应先从整体中随机剔除几个个体 .4、分层抽样又称按比例抽取. 按照每层在总体中占有的比例抽取个体数.5抽样方法经常交叉使用,比如

12、系统抽样中的第一均衡部分,可采用简单随机抽样分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样进行分层抽样时,每层抽样应采用简单随机抽样或系统抽样的方法进行抽样.问题 2:频率分布直方图的计算问题例 42014 山东卷 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据 ( 单位: kPa) 的分组区间为 12 ,13) ,13 ,14) ,14 ,15) ,15 ,16) ,16 ,17 ,将其按从左到右的顺序分别编号为第一组,第二组, ,第五组下图11.6 -1是根据试验数据制成的频率分布直方图已知第一组与第二组共有20 人,第三组中没有疗效的有 6 人,则第

13、三组中有疗效的人数为()图 11.6 -1A. 6B. 8C. 12D. 18点拨与解析: 所有小长方形的面积之和为1. 在各组之间,小长方形面积比=高比 =频率比 =频数比解:因为第一组与第二组一共有20 人,并且根据图像知第一组与第二组的人数比是0.24 0.1632,所以第一组有20 3 12.又因为第一组与第三组的人数比是50.24 0.36 23,所以第三组一共有212 3 18. 因为第三组中没有疗效的有6 人,所以第三组中有疗效的人数是18 6 12.思维方法小结:有关频率分布直方图计算问题处理方法.处理有关频率分布直方图计算问题,关键掌握正确理解图表中各个量的意义.主要掌握以下

14、几点 .每组频数,表示各组数据在总体中所占的比例.(1). 频率 =样本容量( 2) . 每个个小长方形的面积等于样本数据落在对应组的频率.( 3) . 所有小长方形的面积之和为1.( 4) . 在各组之间,小长方形面积比=高比 =频率比 =频数比问题 3:样本的数字特征估计总体的特征例 52014 陕西卷 设样本数据 x1, x2, , x10 的均值和方差分别为 1 和 4,若 yi xi a( a 为非零常数, i 1,2, , 10) ,则 y1 ,y2, , y10的均值和方差分别为 ()A 1a, 4 B 1 a,4 aC 1,4 D 1, 4 a点拨与解析: 利用方差和平均数的推

15、论x1 x2x3 x10解:由题意可知101,( x1 x2 x3 x10) 10a同时增加一个定值,方差故 y 1 a. 数据 x1, x2, , x1010不变故选 A.例 6甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图11.6 - 2 所示,若甲、乙两人的平均成绩分别是x 甲 , x 乙,则下列叙述正确的是 ()A x 甲 x 乙;乙比甲成绩稳定B x 甲 x 乙;甲比乙成绩稳定C x 甲 x 乙;乙比甲成绩稳定D x 甲 x 乙;甲比乙成绩稳定图 11.6- 2点拨与解析: 直接利用平均数方差公式 或者观察茎叶图茎的大小比较平均数,叶的分散、集中情况,比较方差点拨x1 x2.

16、n2( x1 x)2(x2 x) 2( xnx) 21:利用 由 xn, 和 sn分别计算甲、乙的的平均数和方差11解: 由题意可知, x 甲 (72 77 78 86 92) 81, x 乙 (78 88 88 91 90) 55212(81222287. 又由方差公式可得 s甲 (81 72) 77) (81 78) (81 86) (8192) 5 50.4 ,212 88)222(87222s乙 (87 78) (87 (87 88) (87 91)90) 21.6 ,因为 s乙 s甲,5故乙的成绩波动较小,乙的成绩比甲稳定故选C.点拨 2: 通过茎叶图的数据分布、集中、分散情况来估计

17、解:从茎叶图上可以看出,甲数据的大部分茎比较小,数据比较分散,而乙数据的茎大部分比较大,并且数据比较集中,所以,甲的平均成绩小于乙的平均数,并且乙比甲成绩稳定,故选 C.例 7. 从高三抽出50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图11.6 - 3由于一些数据丢失,试利用频率分布直方图求:图 11.6-3(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩点拨与解析:利用频率分布直方图中,众数、中位数、平均数的计算方法解: (1) 由众数的概念可知,众数是出现次数最多的数在直方图中高度最高的小矩形框的中间值的横坐标即为所求 , 所以众数应为 75.在频率

18、分布直方图中, 中位数的左右两边频数应相等, 即频率也相等, 从而小矩形的面积和相等因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求 0.004 10 0.006 10 0.02 100.3 ,前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03 10 0.3,0.30.3 0.5 ,中位数应位于第四个小矩形内,设其底边为x,高为 0.03 ,令 0.03 x 0.2 ,得 x 6.7 ,故中位数应为706.7 76.7.(2) 样本平均值应是频率分布直方图的 “重心”,即所有数据的平均值, 取每个小矩形底边的中点值乘以每个小矩形的面积即可平均成

19、绩为 45 (0.004 10) 55 (0.006 10) 65 (0.02 10) 75 (0.03 10) 85 (0.024 10) 95 (0.016 10) 76.2.综上, (1) 众数是 75,中位数约为76.7 ; (2) 平均成绩为76思维方法小结:解决样本的数字特征估计总体的特征的问题常用以下方法1. 利用平均数和方差的推论x1 x2 .n2( x1 x)2(x2 x)2( xn x) 2( 1) xsnn( 2)若数据 x1, x2, , xn 的平均数为 x ,方差为 s2,则: x1b, x2 b, , xn b 的平均数是 x b,方差是 s2; ax1,ax2,

20、 , axn 的平均数是 a x ,方差是 a2 s2 ; ax1b, ax2 b, , axn b 的平均数是 a x b,方差是 a2 s2.2.利用茎叶图的茎大大小比较平均数,利用数据分散、集中比较方差.3.利用用频率分布直方图估计众数、中位数、平均数.(1)众数:取最高小长方形底边中点的横坐标作为众数(2)中位数:在频率分布直方图中, 把频率分布直方图划分左右两个面积相等的分界线与x 轴交点的横坐标称为中位数(3) 平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和考点精解析方法问题 1: 正态分布下的概率计算及3 原则实际应用

21、例 8. ( 2010 山东卷理)已知随机变量服从正态分布N( 0,2 ),若 P( 2) =0.023 。则 P( -2 2) =( A) 0.477(B) 0.628(C) 0.954(D) 0.977点拨与解析: 利用正态曲线关于 x=0 对称,且和 x 轴围成的面积为1解:因为随机变量服从正态分布 N(0,2 ) , 所以正态曲线关于直线x=0 对称 ,又 P( 2)=0.023, 所以 P( 2)-P( -2)= =1-20.023=0.954, 故选 C.例 9. 某年级的一次信息技术测验成绩近似服从正态分布N(70,102),如果规定低于60 分的学生为不及格学生(1) 成绩不及

22、格的人数占多少?(2) 成绩在 80 90 之间的学生占多少?点拨与解析:根据题意求出 , 的值,然后利用图象对称性和3 原则求解2在 60 到 80 之间的学生占的比为 P(70 10a)= 1- P( X)=P( Xc 1) P( x 乙,甲比乙成绩稳定B x 甲 x 乙 ,乙比甲成绩稳定C x 甲 x 乙 ,甲比乙成绩稳定D x 甲 4)=.14某同学5 次三级跳远成绩( 单位:米 ) 分别为x, y, 10,11,9 ,已知这五次成绩的平均数为 10,方差为 2,则 | xy| 的值为 _.三、解答题: (每题 10 分,共 30 分)解答应写出文字说明、证明过程或演算步骤.15某中学

23、团委组织了“我对祖国知多少”的知识竞赛,从参加考试的学生中抽出60 名学生,将其成绩( 均为整数 ) 分成六组 40,50), 50,60), , 90,100,其部分频率分布直方图如图所示观察图形,回答下列问题(1) 求成绩在 70,80) 的频率,并补全这个频率分布直方图;(2) 估计这次考试的及格率 (60 分及以上为及格 ) 和平均分;(3) 从成绩在 40,50) 和 90,100 的学生中选两人,求他们在同一分数段的概率16为了调查甲、乙两个网站受欢迎的程度,随机选取了14 天,统计上午间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题(1) 甲、乙两个网站点击量的极差分别是多少?(2) 甲网站点击量在 10,40 间的频率是多少?(3) 甲、乙两网站哪个更受欢迎?并说明理由17某厂生产的圆柱形零件的外直径X( 单位: cm)服从正态分布N(4,0.5 2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论