统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册_第1页
统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册_第2页
统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册_第3页
统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册_第4页
统计知识点(一)-2023-2024学年高一下学期数学人教A版(2019)必修第二册_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计知识点(一)--师知识点一简单随机抽样(1)定义放回简单随机抽样不放回简单随机抽样概念一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,这样的抽样方法叫做不放回简单随机抽样(2)常用方法实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法.知识点二总体平均数与样本平均数1.总体平均数(1)一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq\x\to(Y)=eq\f(Y1+Y2+…+YN,N)=eq\f(1,N)eq\o(∑,\s\up11(N),\s\do4(i=1))Yi为总体均值,又称总体平均数.(2)如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式eq\x\to(Y)=eq\f(1,N)eq\o(∑,\s\up11(k),\s\do4(i=1))fiYi.2.样本平均数如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq\x\to(y)=eq\f(y1+y2+…+yn,n)=eq\f(1,n)eq\o(∑,\s\up11(n),\s\do4(i=1))yi为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数eq\x\to(y)去估计总体平均数eq\x\to(Y).例题1.某班有50名学生,要从中随机地抽出6人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程.【解】(1)利用抽签法步骤如下:第一步:将这50名学生编号,编号为01,02,03,…,50;第二步:将50个号码分别写在外观、质地均无差别的小纸片上,并揉成团,制成号签;第三步:将得到的号签放在一个不透明的容器中,搅拌均匀;第四步:从容器中逐一抽取6个号签,并记录上面的号码.对应上面6个号码的学生就是参加该项活动的学生.(2)利用随机数法步骤如下:第一步:将这50名学生编号,编号为01,02,03,…,50;第二步:用随机数工具产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本;第三步:重复第二步的过程,直到抽足样本所需人数.对应上面6个号码的学生就是参加该项活动的学生.[练习一]1.某工厂对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,则选出来的第5个零件编号是()034743738636964736614698637162332616804560111410A.36B.16C.11D.14解:选C.从题中给的随机数表第一行第3列开始从左往右开始读取,重复的数字只读一次,读到的小于40的编号分别为36,33,26,16,11.所以选出来的第5个零件编号是11.故选C.2.从某批零件中抽取50个,然后再从50个零件中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为()A.36%B.72%C.90%D.25%解:选C.eq\f(36,40)×100%=90%.3.某学校高一年级(1)班,(2)班,(3)班的人数分别为45,50,55,在某次考试中,(1)班的平均分为83分,(3)班的平均分为91分,三个班的平均分为86.6分,则(2)班的平均分为()A.84分B.85分C.86分D.87分解:选B.设(2)班的平均分为x分,则有:eq\f(83×45+50x+91×55,45+50+55)=86.6,解得x=85.4.有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:数据x70≤x≤7980≤x≤8990≤x≤99个数8001300900平均数78.18591.9请根据表格中的信息,估计这4万个数据的平均数约为()A.92.16B.85.23C.84.73D.77.97解:选B.这3000个数据的平均数为eq\f(78.1×800+85×1300+91.9×900,3000)=85.23.用样本平均数估计总体平均数,可知这4万个数据的平均数约为85.23.故选B.5.为了节约用水,制定阶梯水价,同时又不加重居民生活负担,某市物价部门在8月份调查了本市某小区300户居民中的50户居民,得到如下数据:用水量/m3181920212223242526频数24461210822物价部门制定的阶梯水价实施方案为:月用水量水价/(元/m3)不超过21m33超过21m3的部分4.5(1)计算这50户居民的用水的平均数;(2)写出水价的函数关系式,并计算用水量为28m3时的水费;解:(1)eq\x\to(y)=eq\f(1,50)×(18×2+19×4+20×4+21×6+22×12+23×10+24×8+25×2+26×2)=22.12(m3).(2)设月用水量为xm3,则水价为f(x)=eq\b\lc\{(\a\vs4\al\co1(3x,0≤x≤21,,4.5x-31.5,x>21,))当x=28时,f(28)=4.5×28-31.5=94.5(元).知识点三分层随机抽样(1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.[练习二]1.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4B.5C.6D.7解:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×eq\f(1,10)=2,抽取的果蔬类的种数为20×eq\f(2,10)=4,二者种数之和为6,故选C.2.某小学三年级有甲、乙两个班,其中甲班有男生30人,女生20人,乙班有男生25人,女生25人,现在需要各班按男、女生分层抽取20%的学生进行某项调查,则两个班共抽取男生人数是()A.10B.11C.20D.21解:选B.因为甲班有男生30人,女生20人,乙班有男生25人,女生25人,各班按男,女生分层抽取20%的学生进行某项调查,所以甲班需抽取(30+20)×20%=10(人),其中男生抽取10×eq\f(30,30+20)=6(人),乙班需抽取(25+25)×20%=10(人),其中男生抽取10×eq\f(25,25+25)=5(人).则两个班共抽取男生人数是6+5=11.故选B.3.某校高一、高二、高三共有2800名学生,为了解学生每天学习情况,计划用分层随机抽样的方法抽取一个容量为56的样本,已知从高二学生中抽取的人数为19,则高二学生人数为________.解:设该校高二学生人数为x,则eq\f(x,2800)=eq\f(19,56),解得x=950.4.某校为了解学生的学习情况,采用按年级分层随机抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k∶5∶4,抽取的样本中高一学生有120人,则k的值为________.解:由题意可得,eq\f(120,300)=eq\f(k,k+5+4),解得k=6.5.某网站针对“2023年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:支持A方案支持B方案支持C方案35岁以下的人数20040080035岁以上(含35岁)人数100100400(1)从所有参与调查的人中,用分层随机抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;(2)从支持B方案的人中,用分层随机抽样的方法抽取5人,在这5人中35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?解:(1)由题意得eq\f(6,200+100)=eq\f(n,200+400+800+100+100+400),解得n=40.(2)35岁以下的人数为eq\f(400,400+100)×5=4,35岁以上(含35岁)的人数为eq\f(100,400+100)×5=1.知识点四频率分布直方图的画法(1)画频率分布直方图时,纵坐标表示的是频率与组距的比值,而不是频率.(2)频率分布直方图是以面积的形式反映了数据落在各个小组的频率大小,相应组的频率等于该组上的小长方形的面积,即小长方形的面积=组距×eq\f(频率,组距)=频率,所以各小长方形的面积的总和等于1,即样本数据落在整个区间的频率为1.从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图.【解】(1)频率分布表如下:成绩分组频数频率累积频率[40,50)20.040.04[50,60)30.060.1[60,70)100.20.3[70,80)150.30.6[80,90)120.240.84[90,100]80.161.00合计501.00(2)频率分布直方图如图所示.知识点五其他统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势[练习三]某家庭2020年收入的各种用途占比统计如图1所示,2021年收入的各种用途占比统计如图2所示.已知2021年的“旅行”费用比2020年增加了3500元,则该家庭2021年的“衣食住”费用比2020年增加了()A.2000元B.2500元C.3000元D.3500元【解】设该家庭2020年的收入为x元,2021年的收入为y元.由题意得35%y-35%x=3500,即y-x=10000,所以2021年的“衣食住”费用比2020年增加了25%y-25%x=2500(元).2.(多选)某网店2021年全年的月收支数据如图所示,则针对2021年这一年的收支情况,下列说法正确的是()A.月收入的极差为60万元B.7月份的利润最大C.这12个月利润的平均数在30万元以上D.这一年的总利润超过400万元解:选ABC.由题图可知月收入的极差为90-30=60(万元),故A正确.1至12月份的利润(单位:万元)分别为:20,30,20,10,30,30,60,40,30,30,50,30.其中7月份的利润最大,故B正确.易求得总利润为380万元,月平均利润为eq\f(380,12)≈31.7(万元),故C正确,D错误.3.如图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校在校学生3000人,根据统计图计算该校共捐款________元.解:由题图,得高一人数为3000×32%=960,捐款数是960×15=14400(元);高二人数为3000×33%=990,捐款数是990×13=12870(元);高三人数为3000×35%=1050,捐款数是1050×10=10500(元).所以该校学生共捐款14400+12870+10500=37770(元).某校100名学生期中考试语文成绩(单位:分)的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90]x∶y1∶12∶13∶44∶5解:(1)依题意得,10×(2a+0.02+0.03+0.04)=1,解得a=0.005.(2)数学成绩在[50,60)之间的人数为100×0.05=5,数学成绩在[60,70)之间的人数为100×0.4×eq\f(1,2)=20,数学成绩在[70,80)之间的人数为100×0.3×eq\f(4,3)=40,数学成绩在[80,90)之间的人数为100×0.2×eq\f(5,4)=25,所以数学成绩在[50,90)之外的人数为100-5-20-40-25=10.5.如图所示的是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.(1)求样本在[15,18)内的频率;(2)求样本量;(3)若在[12,15)内的小长方形面积为0.06,求在[18,33]内的频数.解:由题中样本频率分布直方图可知组距为3.(1)样本在[15,18)内的频率为eq\f(4,75)×3=eq\f(4,25).(2)因为样本在[15,18)内的频数为8,所以样本量为eq\f(8,\f(4,25))=8×eq\f(25,4)=50.(3)在[12,15)内的小长方形面积为0.06,所以样本在[12,15)内的频率为0.06,故样本在[15,33]内的频数为50×(1-0.06)=47,又在[15,18)内的频数为8,所以在[18,33]内的频数为47-8=39.知识点六百分位数的定义1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数第25百分位数,第50百分位数,第75百分位数这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量.【解】(1)所有数据从小到大排,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则第25百分位数是eq\f(8.0+8.3,2)=8.15,第75百分位数是eq\f(8.6+8.9,2)=8.75,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8g,7.9g.[练习四]1.对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:27,38,30,36,35,31,33,29,38,34,28,36.则他的最大速度的第一四分位数是()A.27.5B.28.5C.29.5D.30.5解:选C.把数据从小到大排序,得27,28,29,30,31,33,34,35,36,36,38,38.第一四分位数即第25百分位数,由12×25%=3,可知第一四分位数为第3项与第4项数据的平均数,即eq\f(1,2)×(29+30)=29.5.2.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5解:选B.把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是eq\f(90+91,2)=90.5.3.下图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,求该班的模拟考试成绩的80%分位数.(结果保留两位小数)【解】由题图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.0225)×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.由120+eq\f(0.80-0.70,0.925-0.70)×10≈124.44.故该班的模拟考试成绩的80%分位数约为124.44.4.如图所示是一样本的频率分布直方图,样本数据共分3组,分别为[5,10),[10,15),[15,20].估计样本数据的第60百分位数是()A.14B.15C.16D.17解:选A.第1组[5,10)的频率为0.04×5=0.20;第2组[10,15)的频率为0.10×5=0.50;所以第60百分位数是10+5×eq\f(0.60-0.20,0.70-0.20)=14.5.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:排号分组频数频率1[0,2)60.062[2,4)80.083[4,6)17b4[6,8)220.225[8,10)250.25排号分组频数频率6[10,12)120.127[12,14)a0.068[14,16)20.029[16,18]20.02合计1001(1)求频率分布表中a,b的值;(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.解:(1)a=0.06×100=6,b=eq\f(17,100)=0.17.(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,所以50%分位数在[6,8)内,所以50%分位数约为6+2×eq\f(0.50-0.31,0.53-0.31)≈7.73.因为7.73>7.68,所以估计有50%的学生的阅读时间达到7.68.6.已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的30百分位数、80百分位数分别相等,则eq\f(m,n)等于()A.eq\f(12,7)B.eq\f(10,7)C.eq\f(4,3)D.eq\f(7,4)解:选A.因为30%×6=1.8,大于1.8的比邻整数为2,所以30百分位数为n=28,80%×6=4.8,大于4.8的比邻整数为5,所以80百分位数为m=48,所以eq\f(m,n)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论