知识讲解-高考总复习:统计与统计案例_第1页
知识讲解-高考总复习:统计与统计案例_第2页
知识讲解-高考总复习:统计与统计案例_第3页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高考总复习:统计与统计案例【考纲要求】1理解随机抽样的必要性和重要性;2会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2. 用样本估计总体1了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它 们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取根本的数字特征如平均数、标准差,并作出合理的解释4会用样本的频率分布估计总体分布,会用样本的根本数字特征估计总体的根本数字特征,理解用 样本估计总体的思想5会用随机抽样的根本方法和样本估计总体的思想,解决一些简单的实际问题3. 变量的相关性1会作两个有关联变量数据的散点图,

2、会利用散点图认识变量间的相关关系;2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程线性回归方程 系数公式不要求记忆【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一局部,进行调查或观测,获取数据,并以此对调查对象的某项 指标做出推断,这就是抽样调查调查对象的全体称为总体,被抽取的一局部称为样本1简单的随机抽样简单随机抽样的概念:设一个总体的个体数为 N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽 到的概率相等,就称这样的抽样为简单随机抽样. 用简单随机抽样从含有 N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,

3、任1n个体被抽到的概率为一;在整个抽样过程中各个个体被抽到的概率为一;NN 简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; 简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的根底.简单抽样常用方法: 抽签法:先将总体中的所有个体共有N个编号号码可从1到N,并把号码写在形状、大小相同的号签上号签可用小球、卡片、纸条等制作 ,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签 时每次从中抽一个号签,连续抽取n次,就得到一个容量为 n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法. 随机数表法:随机数表抽样

4、“三步曲:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2 系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个局部,然后按预先制定出的规那么,从每一局部抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤: 采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等. 为将整个的编号分段 即分成几个局部,要确定分段的间隔k .当-是整数时N为总体中的个体n的个数,n为样本容量,k N ;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的n n个数N能被n整除,这时k 也.n 在第

5、一段用简单随机抽样确定起始的个体编号丨. 按照事先确定的规那么抽取样本 通常是将丨加上间隔k,得到第2个编号丨k,第3个编号丨2k , 这样继续下去,直到获取整个样本 .要点诠释:系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每 局部进行抽样时,采用的是简单随机抽样; 与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的 总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体 数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整 除再进行系统抽样.3. 分层抽样:当总体由差异明显

6、的几局部组成时,为了使样本更充分地反映总体的情况,常将总体分成几局部, 然后按照各局部所占的比例进行抽样,这种抽样叫做分层抽样,所分成的局部叫做层.4. 常用的三种抽样方法的比拟:类别共同点不同点联系适用范围简单随抽样过从总体中逐个抽取是后两种方法的根底总体个数较少机抽样程中每系统抽样个个体将总体均分成几局部,按事先确在起始局部抽样时用简总体个数较多被抽取定的规那么在各部门抽取单随机抽样分层抽样的概率将总体分成几层,分层进行抽取各层抽样时采用简单随总体由差异明显相等机抽样或系统抽样的几局部组成要点诠释:1各种抽样的个体被抽到的概率相等;2抽样过程中个体被抽到的概率相等5. 不放回抽样和放回抽样

7、:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体 后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2作频率分布直方图的步骤(1) 求极差(即一组数据中最大值与最小值的差)(2) 决定组距与组数(3) 将数据分组(4) 列频率分布表(5) 画频率分布表3. 频率分布折线图和总体密度曲线(1) 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2) 总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线

8、图会越来越 接近于一条光滑曲线,即总体密度曲线4. 标准差和方差(1)标准差是样本数据到平均数的一种平均距离,方差:s22 2-(Xix)(X2 x) . (Xnnx)2 ( xn是样本数据,n是样本容量,x是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做,这与有样本的频率分布近似代替总体分布是法是用样本的平均数和标准差去估计总体的平均数与标准差 类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5. 利用频率分布直方图估计样本的数字特征(1) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计

9、中位数的值(2) 平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标 之和(3) 众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标6. 频率分布直方图反映样本的频率分布频率频率(1) 频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距x组距组距(2) 频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3) 频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4) 众数为最高矩形中点的横坐标.(5) 中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点

10、的横坐标考点三、变量的相关性将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合2. 两个变量的线性相关1相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2) 正相关在散点图中,点散布在从左下角到右上角的区域对于两个变量的这种相关关系,我们将它称为正相关.(3) 负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(4) 线性相关关系、回归直线如果散点图中点的分布从整体上

11、看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线3. 回归方程(1) 最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法(2) 回归方程方程y bx a是两个具有线性相关关系的变量的一组数据(xn,yn),的回归方程,期中a,b是待定参数n人 yinxyi 1n2 2Xj nxi 1(Xi X)(yi y)i 1n(x X)2i 1a y bx要点诠释:相关关系与函数关系的异同点:相同点:两者均是指两个变量的关系不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是

12、伴随关系考点四、统计案例(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)随机误差:线性回归模型用y bx a e表示,其中a,b为模型的未知数,e称为随机误差 样本点的中心在具有线性相关关系的数据(Xi,yi),(X2, y2),(Xn,yn),中回归方程的截距和斜率的最小二乘估计公式分别为n(Xi X)(Yiy)i 1n(Xii 1,a= y-bx2X)1其中x -n i 1Xi ,y=Xi ,(X,y)称为样本点的中心.i 1(4)相关系数n(Xi X)(yi y) r 1nn(Xi X)2(yiy)2.i 1i 1当r 0时,说明两个变量正相关;当r 0时,说明两个变

13、量负相关.r r大于0.75时,认为两个变量有很强的线性相关性(1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:n_(yiy)2i 1(2)残差数据点和它回归直线上相应位置的差异(yi yi)2是随机误差的效应,称ei=yi yi为残差.(3)残差平方和i(yi yJ2.n相关指数R2(y y)2i 1n_(yi y)2i 1R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变3.独立性检验(1) 分类变量:变量的不同“值表示个体所属的不同类别,像这类变量称为分类变量(2) 列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类

14、变量 X和Y,它们的可能取值分别n (ad be)2构造一个随机变量K2,其中a b(a b)(e d)(a e)(b d)为为,力和X2,y2,其样本频数列联表(称为2x2列联表)为y1y2总计X1aba bX2ede d总计a eb dabed2X 2列联表c d为样本容量.(3)独立性检验利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系的方法称为两个分类变量的独立性检验注:在独立性检验中经常由2 2K得到观测值k,那么k= K是否成立?2OK与k的关系并不是k = K , k是K2的观测值,或者说 K2是一个随机变量,它在 a, b , e, d取不同值时,K2可能不同,而

15、k是取定一组数a, b , e, d后的一个确定的值.【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴 100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法【解析】解法1:抽签法将100件轴编号为1, 2,100,并做好大小、形状相同的号签,分别 写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个 10个号签对应的轴的直径.解法2:随机数表法将 100件轴编号为00, 01,99,在随机数表中选定一个起始位置,如取第21行第1个数开始

16、,选取10个为68, 34, 30, 13, 70, 55, 74, 77, 40, 44,这10件即为所要抽取的样本 .总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时, 方法 2 优于方法 1.举一反三:【变式】某大学为了支持奥运会 , 从报名的 24 名大三的学生中选 6 人组成志愿小组 , 请用抽签法和随 机数表法设计抽样方案 .【思路点拨】 (1) 总体的个体数较少 , 利用抽签法或随机数表法可容易获取样本 ;(2) 抽签法的操作要点 : 编号、制签、搅匀、抽取 ;(3) 随机数表法的操作要点 : 编号、选起始数、读数、获取样本 .【解析】抽签法第

17、一步:将24名志愿者编号,编号为1,2,3,,24;第二步 : 将 24 个号码分别写在 24 张外形完全相同的纸条上 , 并揉成团 , 制成号签 ;第三步 : 将 24 个号签放入一个不透明的盒子中 , 充分搅匀 ; 来源 :Zxxk.Com第四步:从盒子中逐个抽取 6 个号签,并记录上面的编号;第五步 : 所得号码对应的志愿者 , 就是志愿小组的成员 .随机数表法第一步 : 将 24 名学生编号 , 编号为 01,02,03, 24;第二步 : 在随机数表中任选一数开始 , 按某一确定方向读数 ;第三步:凡不在0124中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步 : 找出号

18、码与记录的数相同的学生组成志愿小组 .类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1, 2,295,为了了解学生的学习情况,要按 1:5 的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按 1 :5 分段,每段 5 人,共分 59 段,每段抽取一人,关键是确定第 1 段的编号 .【解析】按照1: 5的比例,应该抽取的样本容量为295十5=59,我们把259名同学分成59组,每组5人,第一组是编号为 15的 5 名学生,第 2 组是编号为 610的 5 名学生,依次下去, 59组是编号为 291 295的5名学生.采用简单随机抽样的方法,从第一组5名学生中

19、抽出一名学生,不妨设编号为k(1 0, a + b+ c= 600.当数据a, b, c的方差s2最大时,写出a, b, c的值(结论不要求证明),并求此时s2的值.108113 2109 11329.33由于s甲s乙,所以甲车间的产品的重量相对稳定;n从乙车间6件样品中随机抽取两件,结果共有15个:124,110 ,124,112 ,124,115 ,124,108,124,109,110,112 ,110,115 ,110,108 ,110,109,112,115,112,108 ,112,109 ,115,108 ,115,109,108,109.设所抽取两件样品重量之差不超过2克的事件

20、为A,那么事件A共有4个结果:110,112 , 110,108 , 110,109 , 108,109 .4所以 P A .15【例6】近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下 (单位:吨):厨余垃圾箱可回收物箱其他垃圾箱厨余垃圾400100100可回收物3024030其他垃圾202060注:S2=(Xi-X)2+(X2-X)2 + +(Xn-X)2 ,其中 X为数据 x1, X2,,Xn 的平均数 n【思路点拨】1、2两问

21、可通过古典概型公式加以求解;第3问利用方差的意义求解。【解析】1厨余垃圾投放正确的概率约为“厨余垃圾箱里厨余垃圾量=400=2厨余垃圾总量400+100+10032设生活垃圾投放错误为事件A,那么A表示升华垃圾投放正确。事件A的概率约为“厨余垃圾箱里厨余垃圾量、“可回收物箱里的可回收物量与“其他垃圾箱里其他垃圾量的总和除以升华垃圾总量,即P(A)约为400+240+60 =0.71000所以p(A)3当a=600, b=c=0时,s2取得最大值。因为 X=1(a+b+c)=200,所以 s2 =(600-200)2+(0-200)2 +(0-200) 2=80000。3 3【总结升华】此题主要

22、考察求解古典概型的方法和方差的几何意义,同时考查数据收集处理的能力。10件,测量产品中某种元素的【例7】为了解甲、乙两厂的产品的质量,从两厂生产的产品中随机抽取各规定:当产品中的此种元素含量满足该产品为优等品含量单位:毫克下表是测量数据的茎叶图:甲厂乙厂90396 5 8184 569015 0 321033羽8毫克时,I试用上述样本数据估计甲、乙两厂生产的优等品率;n从乙厂抽出的上述10件产品中,随机抽取 3件,求抽到的3件产品中优等品数的分布列及其数 学期望E();川从上述样品中,各随机抽取3件,逐一选取,取后有放回,求抽到的优等品数甲厂恰比乙厂多2件的概率.【思路点拨】I根据茎叶图所给数

23、据,数出甲乙厂优等品数量即可。n 的取值为0, 1, 2, 3,分别求出对应的抽取方法,再按照等可能事件概率方法求解可得。川优等品数甲厂恰比乙厂多 2件包括2种情况,“甲厂2件,乙厂0以及“甲厂3件,乙厂1件,分别按照独立重复试验概率公式求解,又从甲厂抽取与从乙厂抽取相互独立,按照乘法计算即可。【解析】I甲厂抽取的样本中优等品有 6件,优等品率为 1051乙厂抽取的样本中优等品有 5件,优等品率为10 2II 的取值为0,1,2,3.P(0)普C101)512P(C303)27500811000抽取的优等品数甲厂恰比乙厂多2件的概率为P(A) P(B)2750081100027200所以的分布

24、列为0123P155112121212故1的数学期望为(E )0丄1 2总313121212122(III)抽取的优等品数甲厂恰比乙厂多2件包括2个事件,即A=抽取的优等品数甲厂 2件,乙厂0件,B=抽取的优等品数甲厂 3件,乙厂1件P(A) C|(|)2(|) c3)(-2)0(-2)33,3、31,1、1/1、2P(B) C3(3) C3(1)(2)【总结升华】此题属于统计与概率综合题,考查茎叶图有关知识,同时考查学生对相互独立事件同时发生的概率与独立重复试验的概率的应用能力。【例8】对某电子元件进行寿命追踪调查,情况如下:寿命h100200200300300400400500500600

25、个数20308040301列出频率分布表;2画出频率分布直方图和累积频率分布图;3估计电子元件寿命在 100400 h以内的概率;4估计电子元件寿命在 400 h以上的概率.【思路点拨】此题直接利用作频率分布直方图的步骤求解即可得到答案。10DD35-DED30Q财DJD2D015015 呗仙 !J711DD 2OD 3CD 4UD融。冃皿壽命hJ 何黒积频率0.80C.G0伽/0.20寿命h100 2W 3W 400 500【解析】1频率分布表如下:寿命h频数频率累积频率10020020200300303004008040050040500600301合计20012频率分布直方图如下:3由累

26、积频率分布图可以看出,寿命在100400 h内的电子兀件出现的频率为0.65,所以我们估计电子元件寿命在 100400 h内的概率为0.65.4由频率分布表可知,寿命在 400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在 400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义,明确频率分布直方图中各小 长方形的面积之和为1.举一反三:【变式1】根据?中华人民共和国道路交通平安法?规定:车辆驾驶员血液酒精浓度在2080 mg/100mL不含80之间,属于酒后驾车;血液酒精浓度在80mg/100mL含80以上时,属醉酒

27、驾车。据有关报道,2022年8月15日至8月28日,某地区查处酒后驾车和醉酒驾车共500人,如图是对这 500人血液中酒精含量进行检测所得结果的频率分布直方图,那么属于醉酒驾车的人数约为A. 25B.50C. 75D.100【答案】C频率【变式2】某部门方案对某路段进行限速,为调查限速60 km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按40, 50,50,60,60,70 , 70,80辆.【答案】180。数据绘制成频率分布直方图如图,由图中数据可知m=体重在45 50 kg的人数是【答案】0.1,50.,所抽取的学生中【变式3】从某校随机抽取了 100名学生,将他们

28、的体重单位:kg【例9】对某校高三年级学生参加社区效劳次数进行统计,随机抽取M名学生作为样本,得到这 M名学生参加社区效劳的次数根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数频率10,15)1015,20)24n20,25)mp25,30)2合计M1八频率/组距a亠忙0 015 2025 30 次数I求出表中M , p及图中a的值;n假设该校高三学生有240人,试估计该校高三学生参加社区效劳的次数在区间10,15内的人数;川在所取样本中,从参加社区效劳的次数不少于20次的学生中任选 2人,求至多一人参加社区效劳次数在区间25,30内的概率.【思路点拨】In禾U用某一组的频数和

29、频率的关系可加以求解。川利用列举法列举出所有情况,再根据对立事件概率关系可以求解。【解析】I由分组10,15内的频数是10,频率是100.25 知,-0M0.25,所以M 40 .因为频数之和为40,所以1024 m 240,p卫幺0.10.M 40因为a是对应分组15,20的频率与组距的商,所以2440 50.12 .60人.6人,n因为该校高三学生有240人,分组10,15内的频率是0.25 ,所以估计该校高三学生参加社区效劳的次数在此区间内的人数为川这个样本参加社区效劳的次数不少于20次的学生共有 m 2设在区间20,25内的人为a1,a2,a3,a4,在区间25,30内的人为,b2 .

30、那么任选 2人共有(a1,a2),(a1,a3),(a1,a4),(a1,b1),(a1,b2),(a2,a3),(a2,a4),(a2,b1),2山2,心3月4,何4,何4,心44,印山2,3415种情况,而两人都在25,30内只能是b1,b2 一种,114所以所求概率为P 1.约为0.931515【总结升华】在频 率分布表中,频数的和等于样本容量,频率的和等于 1,每一小组的频率等于这一组的 频数除以样本容量频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率对于开放性问题的答复,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论

31、举一反三:【变式】某校从高一年级学生中随机抽取60名学生,将其期中考试的数学成绩均为整数分成六段:40,50 , 50,60,90,100后得到如下频率分布直方图.I求分数在 70,80内的频率;根据频率分布直方图,估计该校高一年级学生期中考试数学成绩的平均分;川用分层抽样的方法在80分以上含80分的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任意选取2人,求其中恰有1人的分数不低于90分的概率.【解析】I分数在 70,80内的频率为:1 (0.0100.015 0.015 0.025 0.005) 101 0.70.3 .n平均分为:X 45 0.1 55 0.15 65 0.1

32、5 75 0.3 85 0.25 95 0.05 71.由题意,80,90分数段的人数为:0.25 60 15人;90,100分数段的人数为:0.05 60 3人;用分层抽样的方法在 80分以上含80分的学生中抽取一个容量为6的样本, 80,90分数段抽取5人,分别记为 A, B, C, D , E;90,100分数段抽取1人,记为M.因为从样本中任取 2人,其中恰有1人的分数不低于90分,那么另一人的分数一定是在80,90分数段,所以只需在分数段80,90抽取的5人中确定1人.设“从样本中任取 2人,其中恰有1人的分数不低于90分为事件A ,那么根本领件空间包含的根本领件有:(A,B),(A

33、,C), (A,D), (A,E), (B, C), (B, D),(B, E), (C, D), (C, E), (D, E),(A,M),(B,M), (C ,M) , (D, M) , (E , M)共 15 种.事件A包含的根本领件有(A , M) , (B , M) , (C , M) , (D , M) , (E , M)5种.恰有1人的分数不低于90分的概率为pA5_15为了了解本次竞赛成绩情况,【例10】某中学举行了一次环保知识竞赛全校学生参加了这次竞赛.从中抽取了局部学生的成绩得分取正整数,总分值为100分作为样本进行统计请根据下面尚未完成并有局部污损的频率分布表和频率分布直

34、方图如下列图解决以下问题:频率分布表组别分组频数频率第1组50 , 608第2组60, 70a第3组70 , 8020第4组80 , 90矚第5组90 , 1002b合计频率分布直方图 频率P(A)C62I写出a, b, x, y的值;n在选取的样本中,从竞赛成绩是 80分以上含80分的同学中随机抽取 2名同学到广场参加环保知识的志愿宣传活动,求所抽取的2名同学来自同一组的概率;川在n的条件下,设表示所抽取的2名同学中来自第 5组的人数,求 的分布列及其数学期望【思路点拨】I禾U用某一组的频数和频率的关系可求得样本总频数和第四组频数,进而求出a,b, x,y 的值。n分两种情况:一,2人来自第

35、4组,二,2人来自第5组。川由n容易得到的可能取值为,再利用等可能事件概率求解。【解析】I由题意可知,a 16,b 0.04, x 0.032, y 0.004 n由题意可知,第 4组有4人,第5组有2人,共6人.从竞赛成绩是80分以上含80分的同学中随机抽取 2名同学有C;15种情况.设事件A :随机抽取的2名同学来自同一组,那么7所以,随机抽取的 2名同学来自同一组的概率是71515P(0)C4226 215 5P(1)C:CCs815P(2)C222115所以,的分布列为012P28151515281 2所以,E 012 -51515 3【总结升华】此题考查频数,频率及频率分布直方图及概

36、率知识,考查运用统计知识解决简单实际问题的能力,数据处理能力和运用意识。举一反三:【变式】为增强市民的节能环保意识,某市面向全市征召义务宣传志愿者从符合条件的500名志愿者中随机抽样100名志愿者的年龄情况如下表所示.I频率分布表中的、位置应填什么数据?并在答题卡中补全频率分布直方图如图,再根据频率分布直方图估计这 500名志愿者中年龄在30,35岁的人数;n在抽出的100名志愿者中按年龄再采用分层抽样法抽取 20人参加中心广场的宣传活动,从这 20 人中选取2名志愿者担任主要负责人,记这 2名志愿者中“年龄低于 30岁的人数为 X,求X的分布列 及数学期望.分组单位:岁频数频率20,2550

37、.05025,300.20030,353535,40300.30040,45100.100合计1001.00频率岁【解析】I处填20,处填0.35 ;补全频率分布直方图如下列图500名志愿者中年龄在 30,35的人数为 0.35 500 175人.频率岁n用分层抽样的方法,从中选取20人,那么其中“年龄低于30岁的有5人, “年龄不低于30岁的有15人.故X的可能取值为0 , 1 , 2 ;p(x 0)C5C2021, P(X381)G;C2201538,P(X2)C;038所以X的分布列为:X012P2115P 2383838211521EX 012383838 2类型五、变量的相关性、回归分析和独立性检验【例111某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)年份1993199419951996199719981999x(92108115123130138145kg)y(t)1求x与y之间的相关系数,并检验是否线性相关;2假设线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量【思路点拨】1使用样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论