版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
随机抽样第九章统计随机抽样第九章统计了解用样本平均数估计总体平均数2、掌握全面调查与抽样调查3、理解分层抽样的步骤探索新知探索新知一、随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽
取的那部分个体称为样本,
样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
二、简单的随机抽样
一般地,设一个总体含有N
(N为正整数)个个体,从中逐个抽取n
(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.1、抽签法(1)概念先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,知道抽足样本所需要的个数(2)优缺点优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平2、随机数法(1)概念对总体中的N个个体编号,用随机数工具产生编号范围内的整体随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,知道抽足样本所需要的个数,如果生产的随机数有重复,即统一编号被多次抽到,可以剔除重复的编号并产生随机数,直到产生的不同编号个数等于样本所需要的个数(2)优缺点优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题缺点:当总体较大时,需要的样本容量较大时,不太方便概念辨析一般地,总体中有N个个体,它们的变量值分别为,,
.,,则称
==
为总体均值,又称总体平均数,如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记
为,,
...,其中;出现的频数:
(i=1,
2,
....k),则总体均值还可以写成加权平均数的形式
=
如果从总体中抽取-一个容量为n的样本,它们的变量值分别
为,,...
,则称
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
三、分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.概念辨析思考1思考1
1.某学校共有1000名学生参加知识竞赛,其中男生400人,为了解该校学生在知识竞赛中的情况,采取分层抽样随机抽取了100名学生进行调查,分数分布在450∼950分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示:将分数不低于750分的学生称为“高分选手”.(参考公式:K2=nP(k(1)求a的值,并估计该校学生分数的平均数、中位数和众数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从分数落在[550,650),[750,850)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量X,求X的分布列及数学期望;(3)若样本中属于“高分选手”的女生有10人,完成下列2×2列联表,并判断是否有%%的把握认为该校学生属于“高分选手”与“性别”有关?
属于“高分选手”不属于“高分选手”合计男生
女生
合计
【答案】(1)解:由题意知100×(0.0015+a+0.0025+0.0015+0.001)=1,解得a=0.0035,样本平均数为x=500×0.15+600×0.35+700×0.25+800×0.15+900×0.10=670中位数650,众数600(2)解:由题意,从[550,650)中抽取7人,从[750,850)中抽取3人,随机变量x的所有可能取值有0,1,2,3.P(x=k)=C所以随机变量X的分布列为:P0123X3563211随机变量X的数学期望E(X)=(3)解:由题可知,样本中男生40人,女姓60人,属于“高分选手”的25人,其中女姓10人;得出以下2×2列联表;
属于“高分选手”不属于“高分选手”合计男生152540女生105060合计2575100K2所以有%%的把握认为该校学生属于“高分选手”与性别有关【考点】众数、中位数、平均数【解析】(1)由已知条件结合平均数、中位数以及众数的公式代入数值计算出结果即可。
(2)由题意,从[550,650)中抽取7人,从[750,850)中抽取3人,随机变量X服从超几何分布,确定X的取值,求对应概率即可得到分布列,求出期望即可;
(3)由题可知,样本中男生40人,女生60人属于“高消费群”的25人,其中女生10人,列出列联表计算出K2=查临界值表判断即可.思考2思考22.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:kg),并绘制频率分布直方图如下:(1)请根据频率分布直方图估计该水果店苹果日销售量的众数和平均数;(同一组中的数据以这组数据所在区间中点的值作代表)(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位).【答案】(1)解:如图示:区间[80,90)频率最大,所以众数为85,平均数为:x=(65×0.0025+75×0.01+85×0.04+95×0.035+105×0.01+115×0.0025)×10=89.75.(2)解:日销售量[60,90)的频率为0.525<0.8,日销量[60,100)的频率为0.875>0.8,故所求的量位于[90,100).由0.8-0.025-0.1-0.4=0.275,得90+0.275故每天应该进98千克苹果【考点】频率分布直方图,众数、中位数、平均数,随机抽样和样本估计总体的实际应用【解析】(1)利用已知条件结合频率分布直方图估计出众数和平均数。
(2)利用已知条件结合频率分布直方图中各小组的矩形的面积等于各小组的频率,得出日销售量[60,90)的频率为0.525<0.8,日销量[60,100)的频率为0.875>0.8,故所求的量位于[90,100),由0.8-0.025-0.1-0.4=0.275,得出每天应该进的苹果的重量。思考3思考3
3.为了树立和践行绿水青山就是金山银山的理念,加强环境的治理和生态的修复,某市在其辖区内某一个县的27个行政村中各随机选择农田土壤样本一份,对样本中的铅、锦、铭等重金属的含量进行了检测,并按照国家土壤重金属污染评价级标准(清洁、尚清洁、轻度污染、中度污染、重度污染)进行分级,绘制了如图所示的条形图(1)从轻度污染以上(包括轻度污染)的行政村中按分层抽样的方法抽取6个,求在轻度、中度、重度污染的行政村中分别抽取的个数;(2)规定:轻度污染记污染度为1,中度污染记污染度为2,重度污染记污染度为3.从(1)中抽取的6个行政村中任选3个,污染度的得分之和记为X,求X的数学期望.【答案】(1)解:轻度污染以上(包括轻度污染)的行政村共9+6+3=18个,所以从轻度污染的行政村中抽取618×9=3个,从中度污染的行政村中抽取618(2)解:X的所有可能取值为3,4,5,6,7.P(X=3)=CP(X=4)=CP(X=5)=CP(X=6)=CP(X=7)=C所以X的分布列为X34567P120310310310120所以E(X)=3×1【考点】分层抽样方法,离散型随机变量及其分布列,离散型随机变量的期望与方差【解析】(1)由分层抽样的定义代入数值计算出结果即可。
(2)根据题意即可得出X的取值,再由概率的公式求出对应的X的概率由此得到X的分布列,结合数学期望公式计算出答案即可。思考4思考44.一机构随机调查了某小区100人的月收入情况,将所得数据按[1000,2000),[2000,3000),[3000,4000),(1)根据频率分布直方图估计样本数据的中位数;(2)根据题目分组情况,按分层抽样的方法在[1000,2000),[5000,6000),【答案】(1)解:设数据在[2000,3000m=1-1000×(0.0001+0.00025+0.00025+0.00015+0.00005)=0.2
易知中位数在[3000,4000设中位数为x,则0.0001×1000+0.0002×1000+0.00025×(x-3000)=0.5,解得x=3800.(2)解:收入在[1000,2000),[5000,6000所以按分层抽样的方法在各组抽取的人数分别2,3,1.记收入在[1000,2000)的2人分别为a1,a2,收入在[5000,6000)的3人分别为b1,b通过列举法可得从这6人中抽取2人的取法有(a1,a2),(a1,b1),(a1,b2),(a1,b3其中至少有一人收入在[5000,6000)的取法有(a1,b1),(a1,b2),(a1,b3所以至少有一人收在[5000,6000)概率为【考点】频率分布直方图,众数、中位数、平均数,列举法计算基本事件数及事件发生的概率【解析】(1)设数据在
[2000,3000m=1-1000×(0.0001+0.00025+0.00025+0.00015+0.00005)=0.2,即可求出中位数;
(2)通过列举法求出概率。
1.中国数学奥林匹克由中国数学会主办,是全国中学生级别最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,则该集训队考试成绩的众数与中位数分别为(
)A.
85,75
B.
85,76
C.
74,76
D.
75,772.在如图所示的茎叶图中,若甲组数据的众数为16,则乙组数据的平均数为(
)A.
12
B.
10
C.
8
D.
63.原油作为“工业血液”、“黑色黄金”,其价格的波动牵动着整个化工产业甚至世界经济.小李在某段时间内共加油两次,这段时间燃油价格有升有降,现小李有两种加油方案:第一种方案是每次加油40升,第二种方案是每次加油200元,则下列说法正确的是(
)A.
第一种方案更划算
B.
第二种方案更划算
C.
两种方案一样
D.
无法确定4.艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是(
)A.
中位数
B.
平均数
C.
方差
D.
极差参考答案1【答案】B【解析】解:由茎叶图知,出现的数据最多的是85,故众数为85;由于数据总数为1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑施工合同担保书
- 物业使用权转让协议书格式
- 在线辅导合同模板
- 学生与学校入学合同协议书
- 服务外包技术支持框架
- 设计合同解除合同解除合同案例分析
- 软件开发及外包服务
- 二手房买卖合同的权益保护指南
- 员工外出安全管理规定
- 房屋买卖合同的签订步骤与方法
- 《德米安 埃米尔 辛克莱年少时的故事》读书笔记思维导图PPT模板下载
- -卫生资格-副高-护理学-副高-章节练习-护理学总论-社区护理(单选题)(共625题)
- GB/T 8350-2008输送链、附件和链轮
- GB/T 532-1997硫化橡胶或热塑性橡胶与织物粘合强度的测定
- 诸子争鸣到新文化运动(秦晖)
- 2023年国旗护卫队工作计划三篇
- 法商财富论坛法商产说会精简版天安人寿逸享人生课件
- 艰苦边远地区范围和类别表
- 汉语拼音过关分类检测(直接打印)
- 传统针刺手法及郑氏针法临床应用解读67张课件
- 五年级上册数学课件-9.3 多边形的面积总复习丨苏教版 (共23张PPT)
评论
0/150
提交评论