08第八章 统计和概率(原卷版)_第1页
08第八章 统计和概率(原卷版)_第2页
08第八章 统计和概率(原卷版)_第3页
08第八章 统计和概率(原卷版)_第4页
08第八章 统计和概率(原卷版)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章统计和概率1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.(2)简单随机样本通过简单随机抽样获得的样本称为简单随机样本.(3)简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.2.总体平均数与样本平均数名称定义总体均值(总体平均数)一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq\x\to(Y)=eq\f(Y1+Y2+…+YN,N)样本均值(样本平均数)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq\x\to(y)=eq\f(y1+y2+…+yn,n)为样本均值,又称样本平均数说明:①在简单随机抽样中,我们常用样本平均数eq\o(y,\s\up6(-))去估计总体平均数eq\o(Y,\s\up6(-))②总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性)③一般情况下,样本量越大,估计越准确3.分层随机抽样(1)分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)分层随机抽样的平均数计算在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),样本平均数为eq\o(w,\s\up6(-)),则eq\o(w,\s\up6(-))=eq\f(M,M+N)eq\o(x,\s\up6(-))+eq\f(N,M+N)eq\o(y,\s\up6(-))=eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-)).我们可以用样本平均数eq\o(w,\s\up6(-))估计总体平均数eq\o(W,\s\up6(-)).4.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.(2)频率分布表、频率分布直方图的制作步骤及意义5.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.6.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把eq\f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq\o(x,\s\up6(-)),则这组数据的标准差和方差分别是s=eq\r(\f(1,n)[x1-\o(x,\s\up6(-))2+x2-\o(x,\s\up6(-))2+…+xn-\o(x,\s\up6(-))2]),s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2].7.常用结论(1)若x1,x2,…,xn的平均数为1,那么mx1+a,mx2+a,…,mxn+a的平均数为m+A.(2)数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a的方差相等,即数据经过平移后方差不变.(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.7.样本空间和随机事件(1)样本点和有限样本空间①样本点:随机试验E的每个可能的基本结果称为样本点,常用ω表示.全体样本点的集合称为试验E的样本空间,常用Ω表示.②有限样本空间:如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间.(2)随机事件①定义:将样本空间Ω的子集称为随机事件,简称事件.②表示:大写字母A,B,C,….③随机事件的极端情形:必然事件、不可能事件.8.古典概型具有以下特征的试验叫做古典概型试验,其数学模型称为古典概率模型,简称古典概型.(1)有限性:样本空间的样本点只有有限个.(2)等可能性:每个样本点发生的可能性相等.9.古典概型的概率公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)=eq\f(k,n)=eq\f(nA,nΩ).其中,n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.10.概率的性质性质1:对任意的事件A,都有0≤P(A)≤1.性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(∅)=0.性质3:如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5:如果A⊆B,那么P(A)≤P(B),由该性质可得,对于任意事件A,因为∅⊆A⊆Ω,所以0≤P(A)≤1.性质6:设A,B是一个随机试验中的两个事件,有P(A∪B)=P(A)+P(B)-P(A∩B).考点一简单随机抽样【例1】下列抽样方法是简单随机抽样的是()A.质检员从50个零件中一次性抽取5个做质量检验B.“隔空不隔爱,停课不停学”,网课上,李老师对全班45名学生中点名表扬了3名发言积极的C.老师要求学生从实数集中逐个抽取10个分析奇偶性D.某运动员从8条跑道中随机抽取一条跑道试跑归纳点拨(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).对点训练1.用简单随机抽样的方法从含有10个个体的总体中,抽取一个样本量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.eq\f(1,10),eq\f(1,10) B.eq\f(3,10),eq\f(1,5)C.eq\f(1,5),eq\f(3,10) D.eq\f(3,10),eq\f(3,10)考点二分层抽样【例2】某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20000人,其中各种态度对应的人数如下表所示:最喜爱喜爱一般不喜欢4800720064001600电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为()A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8归纳点拨(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体数量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算.(3)在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为eq\f(mx+ny,m+n).对点训练1.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取__________件.2.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为__________分.考点三统计图表【例3】已知某市某居民小区户主人数和户主对户型结构的满意率分别如图①和图②所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()A.240,18 B.200,20C.240,20 D.200,18归纳点拨(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)由条形图可知总体中样本的种类及对应各类样本的数量.对点训练1.某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2022年1月至2022年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8,9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳考点四频率分布直方图【例4】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下频率分布直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).归纳点拨(1)谨记频率分布直方图的相关公式①直方图中各小长方形的面积之和为1.②直方图中纵轴表示eq\f(频率,组距),故每组样本的频率为组距×eq\f(频率,组距),即矩形的面积.③直方图中每组样本的频数为频率×总数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的.③平均数等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.对点训练1.(多选)去年12月,有关部门出台在疫情防控常态化条件下推进电影院恢复开放的通知,规定低风险地区在电影院各项防控措施有效落实到位的前提下,可有序恢复开放营业.一批影院恢复开放后,统计影院连续14天的相关数据得到如下的统计图表.其中,编号为1的日期是周一,票房指影院门票销售金额,观影人次相当于门票销售数量.由统计图表可以看出,连续14天内()A.周末日均的票房和观影人次低于非周末B.影院票房,第二周相对于第一周同期趋于上升C.观影人次,在第一周的统计中逐日增长量大致相同D.每天的平均单场门票价格都高于20元2.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小长方形的高为__________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为__________.考点五总体百分位数的估计【例5】如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2B.0C.1D.2归纳点拨(1)计算一组n个数据第p百分位数的步骤(2)频率分布直方图中第p百分位数的计算①确定要求的p%分位数所在分组[A,B).②由频率分布表或频率分布直方图计算样本中小于A的频率为a,小于B的频率为b,则p%分位数=A+组距×eq\f(p%-a,b-a).对点训练1.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为__________,第86百分位数为__________.2.将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是__________.(结果保留两位小数)考点六频率分布直方图的数字特征【例6】某市市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.归纳点拨频率分布直方图的数字特征(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.对点训练1.(多选)空气质量指数大小分为五级,指数越大说明污染的情况越严重,对人体危害越大,指数范围为[0,50],[51,100],[101,200],[201,300],[301,500],对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级,下面是某市连续14天的空气质量指数变化趋势图,下列说法中正确的是()A.从2日到5日空气质量越来越好B.这14天中空气质量指数的极差为195C.这14天中空气质量指数的中位数是103.5D.这14天中空气质量指数为“良”的频率为eq\f(3,14)2.某市质监部门严把食品质量关,在2022年3月15日前夕,根据质量管理考核指标对本地的500家食品生产企业进行考核,通过随机抽样抽取其中的50家企业,统计其考核成绩(单位:分)制成如图频率分布直方图.这50家食品生产企业考核成绩的平均数eq\o(x,\s\up6(-))=__________分.(同一组中的数据用该组区间的中点值代替)考点七古典概型【例7】(1)从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A.eq\f(1,5) B.eq\f(1,3)C.eq\f(2,5) D.eq\f(2,3)(2)将4个1和2个0随机排成一行,则2个0不相邻的概率为()A.eq\f(1,3) B.eq\f(2,5)C.eq\f(2,3) D.eq\f(4,5)归纳点拨古典概型概率问题的应用技巧(1)一定要针对具体问题认真分析事件特点,准确判断事件类型,古典概型中事件特点是结果有限且等可能性.(2)计算古典概型中事件A的概率的关键是求出基本事件总数n和事件A中所含基本事件数m.(3)计算基本事件总数常用计数原理与排列组合计算,分清是排列还是组合问题,另外还有列举法、列表法、树状图法等.对点训练1.“仁、义、礼、智、信”为儒家“五常”,由孔子提出“仁、义、礼”,孟子延伸为“仁、义、礼、智”,董仲舒扩充为“仁、义、礼、智、信”.将“仁、义、礼、智、信”排成一排,则“仁”排在第一位,且“智、信”相邻的概率为()A.eq\f(2,5) B.eq\f(3,10)C.eq\f(1,5) D.eq\f(1,10)2.一张方桌有四个座位,A先坐在如图所示的座位上,B,C,D三人随机坐到其他三个座位上,则C与D相邻的概率为__________.一、选择题1.为了解某地区的“健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“健步走”活动情况有较大差异,而男、女“健步走”活动情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.抽签法抽样B.按性别分层随机抽样C.按年龄段分层随机抽样D.利用随机数表抽样2.某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层随机抽样的方法,从该校学生中抽取样本量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.363.某工厂生产的30个零件编号为01,02,…,19,30,现利用如下随机数表从中抽取5个进行检测.若从表中第1行第5列的数字开始,从左往右依次读取数字,则抽取的第5个零件编号为()3457078636046896082323457889078442125331253007328632211834297864540732524206443812234356773578905642A.25B.23C.12D.074.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,40 B.100,20C.200,40 D.200,205.《普通高中数学课程标准(2017版)》提出了数学学科的六大核心素养.为了比较甲、乙两名高二学生的数学核心素养水平,现以六大核心素养为指标对两人进行了测验,根据测验结果绘制了雷达图(如图,每项指标值满分为5分,分值高者为优),则下列叙述正确的是()A.甲的数据分析素养优于乙B.甲的数学建模素养优于数学抽象素养C.乙的六大核心素养中逻辑推理最差D.乙的六大核心素养整体水平优于甲6.设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.107.我国是世界上严重缺水的国家,某市为了制订合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1)…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.则估计全市居民月均用水量的中位数是()A.2.25吨 B.2.24吨C.2.06吨 D.2.04吨8.某学校有男生400人,女生600人.为调查该校全体学生每天的睡眠时间,现根据性别采用分层抽样的方法抽取样本,计算得男生每天睡眠时间的平均数为7.5小时,方差为1,女生每天睡眠时间的平均数为7小时,方差为0.5.则可估计该校全体学生每天睡眠时间的方差为()A.0.45B.0.62C.0.7D.0.769.已知数据x1,x2,…,x10,2的平均值为2,方差为1,则数据x1,x2,…,x10相对于原数据()A.一样稳定 B.变得稳定C.变得不稳定 D.稳定性不可以判断10.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下.甲地:总体平均数为3,中位数为4;乙地:总体平均数为1,总体方差大于0;丙地:总体平均数为2,总体方差为3;丁地:中位数为2,众数为3.则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是()A.甲地B.乙地C.丙地D.丁地11.某射手在一次射击中,射中10环,9环,8环的概率分别是0.2,0.3,0.1,则该射手在一次射击中不够8环的概率为()A.0.9 B.0.3C.0.6 D.0.412.从集合{1,2,4}中随机抽取一个数a,从集合{2,4,5}中随机抽取一个数b,则向量m=(a,b)与向量n=(2,-1)垂直的概率为()A.eq\f(1,9) B.eq\f(2,9)C.eq\f(1,3) D.eq\f(2,3)13.四名数学老师相约到定点医院接种新冠疫苗,若他们一起登记后,等待电脑系统随机叫号进入接种室,则甲不被第一个叫到,且乙、丙被相邻叫到的概率为()A.eq\f(1,8) B.eq\f(1,6)C.eq\f(1,4) D.eq\f(1,3)14.在一个不透明的容器中有6个小球,其中有4个黄球,2个红球,它们除颜色外完全相同,如果一次随机取出2个球,那么至少有1个红球的概率为()A.eq\f(2,5) B.eq\f(3,5)C.eq\f(7,15) D.eq\f(8,15)15.根据中央关于精准脱贫的要求,某市某农业经济部门随机派遣甲、乙等4位专家对3个县区进行调研,每个县区至少派1位专家,则甲、乙两位专家派遣至同一县区的概率为()A.eq\f(1,6) B.eq\f(1,4)C.eq\f(1,3) D.eq\f(1,2)16.某市质监部门严把食品质量关,在2022年3月15日前夕,根据质量管理考核指标对本地的500家食品生产企业进行考核,通过随机抽样抽取其中的50家企业,统计其考核成绩(单位:分)制成如图频率分布直方图.则这50家食品生产企业考核成绩的平均数eq\o(x,\s\up6(-))=()(其中,同一组中的数据用该组区间的中点值代替)A.84.80 B.84.90C.83.80 D.83.90二、解答题17.某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论