随机抽样精品_第1页
随机抽样精品_第2页
随机抽样精品_第3页
随机抽样精品_第4页
随机抽样精品_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(1)理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.(2)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.(3)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(4)了解独立检验(只要求2×2列联表)、回归分析的基本思想、方法,并能应用这些方法解决一些实际问题.(5)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别;了解两个互斥事件的概率加法公式.(6)理解古典概型及其概率计算公式;会用列举法计算一些随机事件所含的基本事件数及事件发生的概率(7)了解随机数的意义,能运用模拟方法估计概率;了解几何概型的意义.概率与统计是高中数学主干知识,考查题型广泛,形式多样,多为容易题和中档题.选择题、填空题主要考查互斥事件、古典概型、几何概型等概率的求解,考查抽样方法的特点以及有关数据的计算、茎叶图与频率分布直方图的识图与计算;解答题中主要以频率分布表及频率分布直方图为问题情境,考查统计方法简单的应用,突出考查或然与必然思想、数据处理能力和应用意识.预计2011年高考在本章的选择、填空题考查重点是古典概型、几何概型等概率的求解,解答题以实际问题作背景设计试题,以频率分布表及频率分布直方图为问题情境,通过识图、读表,对数据进行处理,同时结合古典概型的概率及样本数据的平均数与标准差,考查数据处理能力及运用概率知识解决实际问题的能力.1.有20位同学,编号为1~20号,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为(

)A.5,10,15,20

B.26,10,14C.2,4,6,8

D.5,8,11,14

将20分成4个组,每组5个号,间隔等距离为5,选A.A2.甲、乙两位位同学参加加由学校举举办的篮球球比赛,它它们都参加加了全部的的7场比赛赛,平均得得分均为16分,标标准差分别别为5.09和3.72,则甲甲、乙两同同学在这次次篮球比赛赛活动中,,发挥得更更稳定的是是()A.甲B.乙C.甲、乙乙相同D.不能确确定平均数相同同,看谁的的标准差小小,标准差差小的就稳稳定,选B.B3.如图是2010年元元旦晚会举举办的挑战战主持人大大赛上,七七位评委为为某选手打打出的分数数的茎叶统统计图,去去掉一个最最高分和一个个最低分后后,所剩数数据的平均均数和方差差分别为(()A.84,,484B.84,,16C.85,,16D.85,,47899446473C由茎叶图可可知,去掉掉一个最高高分和一个个最低分后后,所剩数数据为84,84,86,84,87,所以平均数数为方差s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=1.6,选C.易错点:样样本方差公公式.4.某中学高一一、高二、、高三三个个年级的学学生数分别别为1500人,1200人,1000人.现采用按年年级分层抽抽样的方法法抽取部分分学生参加加社区活动动.已知在高一一年级抽取取了75人,则这次次活动共抽抽取了人.设共抽取了了x人,则有解得x=185,填185.1855.对某校400名学生生的体重(单位:kg)进行统计,,得到如图图所示的频频率分布直直方图,则则学生体重重在60kg以上的的人数为100.体重在60kg以上上的频率为为(0.040+0.010)×5=0.25,所以体重在在60kg以上的学学生人数为为0.25×400=100,,填100.易错点:频频率分布直直方图的识识图及频率率的计算.1.常用的抽样样方法(1)简单随机抽抽样:一般地,设设一个总体体含有N个个体,从从中逐个不不放回地抽抽取n个个个体体作作为为样样本本(n≤N),如如果果每每次次抽抽取取时时总总体体内内的的各各个个个个体体被被抽抽到到的的机机会会相相等等,,就就把把这这种种抽抽样样方方法法叫叫做做简简单单随随机机抽抽样样.最常常用用的的简简单单随随机机抽抽样样方方法法有有两两种种::抽抽签签法法和和随随机机数数表表法法.(2)系统抽样样:当总体中中的个体体比较多多时,首首先把总总体分成成均衡的的几个部部分,然然后按照照预先定定出的规规则,从从每一部部分中抽抽取一些些个体,,得到所所需要的的样本,,这种抽抽样方法法叫做系系统抽样样.(3)分层抽抽样::一般地地,在在抽样样时,,将总总体分分成互互不交交叉的的层,,然后后按照照一定定的比比例,,从各各层独独立地地取出出一定定数量量的个个体,,将各各层取取出的的个体体合在在一起起作为为样本本,这这种抽抽样方方法叫叫做分分层抽抽样.2.样本估计总总体通常我们对对总体作出出的估计一一般分成两两种:一种种是用样本本的频率分分布估计总总体分布,,另一种是是用样本的的数字特征征(如平均数、、标准差等等)估计总体的的数字特征征.3.频率分布直直方图在频率分布布直方图中中,纵轴表表示频率/组距,每个个小长方形形的面积表表示相应各各组的频率率,各小长长方形的面面积的总和和等于1.4.茎叶图当数数据是两位位有效数字字时,用中中间的数字字表示十位位数,即第第一个有效效数字,两两边的数字字表示个位位数,即第第二个有效效数字,它它的中间部部分像植物物的茎,两两边部分像像植物茎上上长出来的的叶子,因因此通常把把这样的图图叫做茎叶叶图.5.平均数数、中位数数和众数(1)平均数:一组数据的的总和除以以数据的个个数所得的的商就是平平均数.(2)中位数:如果将一组组数据按从从小到大的的顺序依次次排列,当当数据有奇奇数个时,,处在最中中间的一个个数;当数数据有偶数数个时,处处在最中间间两个数的的平均数,,是这组数数据的中位位数.(3)众数:出现次数最最多的数.若有两个个或几个数数据出现得得最多,且且出现的次次数一样,,这些数据据都是这组组数据的众众数;若一一组数据中中,每个数数据出现的的次数一样样多,则认认为这组数数据没有众众数.6.样本本方差与与标准差差:设样本数据x1,x2,…,xn的平均数为,,称和为样本方差与与标准差.重点突破:随随机抽样防疫站对学生生进行身体健健康调查,按按性别分层抽抽样抽取.某学校学生共共有1600名,抽取一个个容量为200的样本.已知样本中女女生比男生少少10人,则该校的的女生人数应应是人.由抽取的200人中,女生比比男生少10人,可求得女女生所抽取的的人数.结合分层抽样样法的定义,,进而求得该该校的女生人人数.760设抽取男生为为x人,抽取女生生为y人,则x+y=200,且x-y=10,故y=95,该校的女生生人数应是为为解解题的的关键在于分分层抽样法的的理解.解分层抽样法法问题时,必必须保证每个个个体等可能能入样,所有有层中每个个个体被抽到的的可能性相同同.切记,每层样样本数量与每每层个体数量量的比与这层层个体数量与与总体容量的的比相等.某大型超市销销售的乳类商商品有四种::纯奶、酸奶奶、婴幼儿奶奶粉、成人奶奶粉,且纯奶奶、酸奶、婴婴幼儿奶粉、、成人奶粉分分别有30种种、10种、、35种、25种不同的的品牌.现采采用分层抽样样的方法从中中抽取一个容容量为n的样本进行三三聚氰胺安全全检测,若抽抽取的婴幼儿儿奶粉的品牌牌数是7,则则n=.由解得n=20.20重点突破:频频率分布直方方图为了解高一学学生的体能情情况,某校抽抽取部分学生生进行一分钟钟跳绳次数测测试,将所得得数据整理后后,画出频率率分布直方图图(如图所示示),图中从从左到右各小小长方形面积积之比为2∶4∶17∶15∶9∶3,第二小组频频数为12.问:(Ⅰ)第二小组的频频率是多少?样本容量是是多少?(Ⅱ)若次数在110以上(含110次)为达标,试估估计该校全体体高一学生的的达标率是多多少?小长方形面积积比已给,而而各小长方形形面积之和为为1,故可求求得各小长方方形的面积,,即频率;由由第二小组频频数为12,,可求得样本本容量.解答答本题可先求求得第二小组组的频率,然然后根据频数数求得样本容容量,从而求求得达标率.(Ⅰ)由于频率分布布直方图以面面积的大小反反映了数据落落在各个小组组内的频率大大小,因此第第二小组的频频率为又因为第二小小组频率=所以样本容量量=第二小组频数数样本容量,第二小组频数数第二小组频率率(Ⅱ)由图可估计该该校高一学生生的达标率约约为故第二小组的的频率是0.08,样本容容量是150,高一学生生达标率是88%.解本题的关键键是准确掌握握“频率、频频数及样本容容量(数据个数总和和)之间的关系””.某校高三文科科分为四个班班.高三数学学调研测试后后,随机地在在各班抽取部部分学生进行行测试成绩统统计,各班被被抽取的学生生人数恰好成成等差数列,,人数最少的的班被抽取了了22人.抽抽取出来的所所有学生的测测试成绩统计计结果的频率率分布条形图图如图所示,,其中120~130((包括120分但不包括括130分))的频率为0.05,此此分数段的人人数为5人.(Ⅰ)问各班班被抽抽取的的学生生人数数各为为多少少人?(Ⅱ)在抽取取的所所有学学生中中,任任取一一名学学生,,求分分数不不小于于90分的的概率率.(Ⅰ)由频率率分布布条形形图知知,抽抽取的的学生总总数为为=100人人.因为各各班被被抽取取的学学生人人数成成等差差数列列,设设其公公差为为d,由22+(22+d)+(22+2d)+(22+3d)=100,,得得4××22+6d=100,,解解得得d=2.所以以各各班班被被抽抽取取的的学学生生人人数数分分别别是是22人人,,24人人,,26人人,,28人人.(Ⅱ)在抽抽取取的的学学生生中中,,任任取取一一名名学学生生,,则则分分数数不不小小于于90分分的的概概率率为为0.35+0.25+0.1+0.05=0.75.重点点突突破破::用用样样本本的的数数字字特特征征估估计计总总体体的的数数学学特特征征某公公司司的的33名职职工工的的月月工工资资((以以元元为为单单位位))如如下下::职务董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500(Ⅰ)求该该公公司司职职工工月月工工资资的的平平均均数数、、中中位位数数、、众众数数;;(Ⅱ)假设设董董事事长长的的工工资资从从5500元元提提升升到到30000元元,,副副董董事事长长的的工工资资从从5000元元提提升升到到20000元元,,那那么么新新的的平平均均数数、、中中位位数数、、众众数数又又是是什什么么?(精确确到到元元)(Ⅲ)你认认为为哪哪个个统统计计量量更更能能反反映映这这个个公公司司员员工工的的工工资资水水平平?结结合合此此问问题题谈谈一一谈谈你你的的看看法法.解答答本本题题先先用用公公式式求求出出平平均均数数,,再再写写出出中中位位数数和和众众数数,,然然后后根根据据平平均均数数、、中中位位数数、、众众数数的的特特征征解解决决第第(3)问.(Ⅰ)平均均数数为为中位位数数是是1500元元,,众众数数是是1500元元.(Ⅱ)新平平均均数数为为中位位数数是是1500元元,,众众数数是是1500元元.(Ⅲ)在这这个个问问题题中中,,中中位位数数或或众众数数均均能能反反映映该该公公司司员员工工的的工工资资水水平平.因因为为公公司司中中少少数数人人的的工工资资额额与与大大多多数数人人的的工工资资额额差差别别较较大大,,这这样样导导致致平平均均数数与与中中位位数数偏偏差差较较大大,,所所以以平平均均数数不不能能反反映映这这个个公公司司员员工工的的工工资资水水平平.由于于平平均均数数受受极极端端值值影影响响较较大大,,故故有有时时平平均均数数不不一一定定能能客客观观地地反反映映总总体体情情况况.本本题题易易误误认认为为职职工工工工资资的的平平均均水水平平能能代代表表多多个个员员工工工工资资的的基基本本水水平平.应应深深刻刻理理解解平平均均数数、、众众数数、、中中位位数数的的特特点点,,结结合合实实际际情情况况灵灵活活运运用用.甲、、乙乙两两位位学学生生参参加加数数学学竞竞赛赛培培训训,,在在活活动动期期间间,,他他们们参参加加的的5次次测测试试成成绩绩记记录录如如下下::甲8282799587;;乙9575809085.(Ⅰ)用茎茎叶叶图图表表示示这这两两组组数数据据;;(Ⅱ)若要从中中选派一一人参加加数学竞竞赛,从从统计学学的角度度考虑,,你认为为选派哪哪位学生生参加合合适?说说明理由由.(Ⅰ)作出的茎茎叶图如如下(Ⅱ)派甲参赛比比较合适.理由如下下:甲=(70×1+80×3+90××1+9+2+2+7+5)=85,乙=(70×1+80×2+90××2+5+0+5+0+5)=85=[(79-85)2+(82-85)2+(82-85)2+(87-85)2+(95-85)2]=31.6,=[(75-85)2+(80-85)2+(85-85)2+(90-85)2+(95-85)2]=50,因为甲=乙,<,所以甲的成成绩较稳定定,派甲学学生参赛比比较合适.注:本小题题结论及理理由均不唯唯一.如果能从统统计学的角角度分析,,写出其他他正确结论论,也是可可以的.如派乙参赛赛比较合适适.理由如下::从统计的角角度看,甲甲获得85分以上(含含85分)的概率率P1=,乙获得85分以上(含含85分)的概率率P2=.所以P2>P1,所以派乙学学生参赛比比较合适.在某电脑杂杂志的一篇篇文章中,,每个句子子的字数如如下:10,28,31,,17,23,27,18,,15,26,24,20,,19,36,27,14,,25,15,22,11,24,27,17.在某报纸的的一篇文章章中,每个个句子中所所含的字的的个数如下下:27,39,33,,24,28,19,32,,41,33,27,35,,12,36,41,27,,13,22,23,18,,46,32,22.(Ⅰ)将这两组数数据用茎叶叶图表示;;(Ⅱ)将这两组数数据进行比比较分析,,得到什么么结论?(Ⅰ)如图所示(Ⅱ)电脑杂志上上每个句子子的字数集集中在10~30之间,中位位数为27;而报纸上上每个句子子的字数集集中在10~40之间.中位数为27.5.还可以看出出电脑杂志志上每个句句子的平均均字数比报报纸上每个个句子的平平均字数要要少.说明电脑杂杂志作为科科普读物须须通俗易懂懂、简明.1.频率分布表表的制作步步骤是:第一步:按确定的组组距对一批批数据分组组,数出落落在各组内内数据的个个数(即频数)填入表中;;第二步;各小组的频频数与数据据总数的比比值叫做这这一小组的的频率,算算出各小组组的频率,,填入表中中;2.画频率分布布直方图的的步骤:①求极差;②决定组距与与组数;③将数据分组组;④列频率分布布表;⑤画频率分布布直方图.3.众数、中位位数与平均均数的特征征(1)众数、中位位数及平均均数都是描描述一组数数据集中趋趋势的量,,平均数是是最重要的的量.(2)由于平均数数与每一个个样本数据据有关,所所以,任何何一个样本本数据的改改变都会引引起平均数数的改变,,这是中位位数、众数数都不具有有的性质.(3)众数考查各各数据出现现的频率,,大小只与与这组数据据中的部分分数据有关关,当一组组数据中有有不少数据据多次重复复出现时,,其众数往往往更能反反映问题.(4)中位数仅与与数据的排排列位置有有关,某些些数据的变变动对中位位数没有影影响.中位数可能能出现在所所给数据中中,也可能能不在所给给数据中.当一组数据据中的个别别数据变动动较大时,,可用中位位数描述其其集中趋势势.4.方差的特征征方差和标标准差描述述其波动大大小,也可可以说方差差、标准差差和极差反反映各个数数据与其平平均数的离离散程度.一组数据的的方差或标标准差越大大,说明这这组数据波波动越大.1.(2009·山东卷卷)某工厂对一一批产品进进行了抽样样检测.下下图是根据据抽样检测测后的产品品净重(单单位:克))数据绘制制的频率分分布直方图图,其中产产品净重的的范围是[[96,106],,样本数据据分组为[[96,98),[[98,100),,[100,102),[102,104),,[104,106].已知知样本中产产品净重小小于100克的个数数是36,,则样本中中净重大于于或等于98克并且且小于104克的产产品的个数数是()AA.90B.75C.60D.45产品净重小于于100克的概率为((0.050+0.100)×2=0.300,已知样本中产产品净重小于于100克的个数是36,设样本容量为为n,则=0.300,所以n=120,净重大于或或等于98克并且小于104克的产品的概概率为(0.100+0.150+0.125)×2=0.75,所以样本中中净重大于或或等于98克并且小于104克的产品的个个数是120×0.75=90.选A.试题以频率分分布直方图为为背景,通过过读图、识图图,考查数据据处理能力和和应用意识.解答本题的关关键在于灵活活、准确从图图形中提取相相关的信息,,从而使问题题得到解决.2.(2009·宁宁夏/海南卷卷)某工厂有工人人1000名,250名工人参加过过短期培训(称为A类工人)另外750名工人参加过过长期培训(称为B类工人).现用分层抽抽样方法(按A类,B类分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论