版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《第十一章统计与统计案例》章节训练习题第1讲随机抽样[基础题组练]1.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3 B.p2=p3<p1C.p1=p3<p2 D.p1=p2=p3解析:选D.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为()A.10 B.12C.18 D.24解析:选A.根据分层抽样的特征,从C学校中应抽取的人数为eq\f(90,180+270+90)×60=10.3.现用系统抽样方法从已编号(1~60)的60枚新型导弹中,随机抽取6枚进行试验,则所选取的6枚导弹的编号可能是()A.5,10,15,20,25,30 B.2,4,8,16,32,48C.5,15,25,35,45,55 D.1,12,34,47,51,60解析:选C.从60枚新型导弹中随机抽取6枚,采用系统抽样间隔应为eq\f(60,6)=10,只有C选项中导弹的编号间隔为10.4.某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是()(注:下表为随机数表的第8行和第9行)eq\b\lc\\rc\}(\a\vs4\al\co1(63016378591695556719981050,717512867358074439523879))第8行eq\b\lc\\rc\}(\a\vs4\al\co1(33211234297864560782524207,443815510013429966027954))第9行A.07 B.25C.42 D.52解析:选D.依题意得,依次选出的个体分别是12,34,29,56,07,52,…,因此选出的第6个个体是52,选D.5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4C.5 D.6解析:选B.35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.6.为了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.解析:在系统抽样中,确定分段间隔k,对编号进行分段,k=eq\f(N,n)(N为总体的容量,n为样本的容量),所以k=eq\f(N,n)=eq\f(1200,30)=40.答案:407.某高校有教授120人,副教授100人,讲师80人,助教60人,现用分层抽样的方法从以上所有老师中抽取一个容量为n的样本.已知从讲师中抽取的人数为16,那么n=________.解析:依题意得,eq\f(80,120+100+80+60)=eq\f(16,n),由此解得n=72.答案:728.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类型用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.解析:设该厂这个月共生产轿车n辆,由题意得eq\f(50,n)=eq\f(10,100+300),所以n=2000,则z=2000-100-300-150-450-600=400.答案:4009.最新高考改革方案已在上海和浙江实施,某教育机构为了解我省广大师生对新高考改革方案的看法,对某市部分学校500名师生进行调查,统计结果如下:赞成改革不赞成改革无所谓教师120y40学生xz130在全体师生中随机抽取1名“赞成改革”的人是学生的概率为0.3,且z=2y.(1)现从全部500名师生中用分层抽样的方法抽取50名进行问卷调查,则应抽取“不赞成改革”的教师和学生人数各是多少?(2)在(1)中所抽取的“不赞成改革”的人中,随机选出3人进行座谈,求至少有1名教师被选出的概率.解:(1)由题意知eq\f(x,500)=0.3,所以x=150,所以y+z=60.因为z=2y,所以y=20,z=40.则应抽取“不赞成改革”的教师人数为eq\f(50,500)×20=2,应抽取“不赞成改革”的学生人数为eq\f(50,500)×40=4.(2)至少有1名教师被选出的概率P=eq\f(Ceq\o\al(1,2)Ceq\o\al(2,4)+Ceq\o\al(2,2)Ceq\o\al(1,4),Ceq\o\al(3,6))=eq\f(12+4,20)=eq\f(4,5).10.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为eq\f(5,39),求x,y的值.解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,所以eq\f(30,50)=eq\f(m,5),解得m=3.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3).其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).所以从中任取2人,至少有1人学历为研究生的概率为eq\f(7,10).(2)由题意,得eq\f(10,N)=eq\f(5,39),解得N=78.所以35~50岁中被抽取的人数为78-48-10=20,所以eq\f(48,80+x)=eq\f(20,50)=eq\f(10,20+y),解得x=40,y=5.即x,y的值分别为40,5.[综合题组练]1.某学校有体育特长生25人,美术特长生35人,音乐特长生40人.用分层抽样的方法从中抽取40人,则抽取的体育特长生、美术特长生、音乐特长生的人数分别为()A.8,14,18 B.9,13,18C.10,14,16 D.9,14,17解析:选C.因为25+35+40=100,用分层抽样的方法从中抽取40人,所以每个个体被抽到的概率是P=eq\f(40,100)=eq\f(2,5)=0.4,所以体育特长生25人应抽25×0.4=10(人),美术特长生35人应抽35×0.4=14(人),音乐特长生40人应抽40×0.4=16(人).2.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是()A.63 B.64C.65 D.66解析:选A.由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.故选A.3.北京某校三个年级共有18个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到18,现用系统抽样方法,抽取6个班进行调查.若抽到的编号之和为57,则抽到的最小编号为________.解析:系统抽样的间隔为eq\f(18,6)=3.设抽到的最小编号为x,则x+(3+x)+(6+x)+(9+x)+(12+x)+(15+x)=57.解得x=2.答案:24.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多________人.解析:设班里“喜欢”摄影的同学有y人,“一般”的有x人,“不喜欢”的有(x-12)人,则eq\b\lc\{(\a\vs4\al\co1(\f(x-12,x)=\f(1,3),,\f(y,x)=\f(5,3),))解得eq\b\lc\{(\a\vs4\al\co1(x=18,,y=30.))所以全班共有30+18+6=54(人),又30-eq\f(54,2)=3(人).所以“喜欢”摄影的比全班人数的一半还多3人.答案:35.为了解某市市民晚饭后1小时内的生活方式,调查小组设计了“阅读”“锻炼”“看电视”和“其他”四个选项,用随机抽样的方法调查了该市部分市民,并根据调查结果绘制成统计图如图所示.根据统计图所提供的信息,解答下列问题:(1)本次共调查了________名市民;(2)补全条形统计图;(3)该市共有480万市民,估计该市市民晚饭后1小时内“锻炼”的人数.解:(1)本次共调查的市民人数为800÷40%=2000.故填2000.(2)晚饭后选择“其他”的人数为2000×28%=560,晚饭后选择“锻炼”的人数为2000-800-240-560=400.将条形统计图补充完整,如图所示.(3)晚饭后选择“锻炼”的人数所占的比例为:400÷2000=20%,故该市市民晚饭后1小时内锻炼的人数为:480×20%=96(万).6.据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改”引起广泛关注.为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:态度调查人群应该取消应该保留无所谓在校学生2100人120人y人社会人士600人x人z人已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05.(1)现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流.求第一组中在校学生人数ξ的分布列和数学期望.解:(1)因为抽到持“应该保留”态度的人的概率为0.05,所以eq\f(120+x,3600)=0.05,解得x=60.所以持“无所谓”态度的人数共有3600-2100-120-600-60=720,所以应在持“无所谓”态度的人中抽取720×eq\f(360,3600)=72(人).(2)由(1)知持“应该保留”态度的一共有180人,所以在所抽取的6人中,在校学生为eq\f(120,180)×6=4(人),社会人士为eq\f(60,180)×6=2(人),于是第一组在校学生人数ξ=1,2,3,P(ξ=1)=eq\f(Ceq\o\al(1,4)Ceq\o\al(2,2),Ceq\o\al(3,6))=eq\f(1,5),P(ξ=2)=eq\f(Ceq\o\al(2,4)Ceq\o\al(1,2),Ceq\o\al(3,6))=eq\f(3,5),P(ξ=3)=eq\f(Ceq\o\al(3,4)Ceq\o\al(0,2),Ceq\o\al(3,6))=eq\f(1,5),ξ的分布列为ξ123Peq\f(1,5)eq\f(3,5)eq\f(1,5)所以E(ξ)=1×eq\f(1,5)+2×eq\f(3,5)+3×eq\f(1,5)=2.第2讲用样本估计总体[基础题组练]1.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数C.方差 D.极差解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.某商场在国庆黄金周的促销活动中,对10月1日9时到14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为()A.10万元 B.12万元C.15万元 D.30万元解析:选D.9时至10时的销售额频率为0.1,因此9时至14时的销售总额为eq\f(3,0.1)=30(万元),故选D.3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A.法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.法二:因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.4.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为eq\o(x,\s\up6(-))甲,eq\o(x,\s\up6(-))乙,标准差分别为σ甲,σ乙,则()A.eq\o(x,\s\up6(-))甲<eq\o(x,\s\up6(-))乙,σ甲<σ乙 B.eq\o(x,\s\up6(-))甲<eq\o(x,\s\up6(-))乙,σ甲>σ乙C.eq\o(x,\s\up6(-))甲>eq\o(x,\s\up6(-))乙,σ甲<σ乙 D.eq\o(x,\s\up6(-))甲>eq\o(x,\s\up6(-))乙,σ甲>σ乙解析:选C.由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知eq\o(x,\s\up6(-))甲>eq\o(x,\s\up6(-))乙,图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.5.如图是1951~2016年我国的年平均气温变化的折线图.根据图中信息,下列结论正确的是()A.1951年以来,我国的年平均气温逐年增高B.1951年以来,我国的年平均气温在2016年再创新高C.2000年以来,我国每年的年平均气温都高于1981~2010年的平均值D.2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值解析:选D.由题图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B错误;2012年的年平均气温低于1981~2010年的平均值,所以选项C错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D正确,故选D.6.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m的值是________.解析:由甲组学生成绩的平均数是88,可得eq\f(70+80×3+90×3+(8+4+6+8+2+m+5),7)=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.答案:67.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.解析:由题图甲可知学生总人数是10000,样本容量为10000×2%=200,抽取的高中生人数是2000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数为40×50%=20.答案:200208.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=eq\f(5+15+25,0.75)=60.答案:609.某校1200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:成绩分组频数频率平均分[0,20)30.01516[20,40)ab32.1[40,60)250.12555[60,80)c0.574[80,100]620.3188(1)求a,b,c的值;(2)如果从这1200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P=eq\f(162,200)=eq\f(81,100)=0.81.(3)这次数学测验样本的平均分为eq\o(x,\s\up6(-))=eq\f(16×3+32.1×10+55×25+74×100+88×62,200)=73,所以这次数学测验的年级平均分大约为73分.10.有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A,B二人预赛成绩的中位数分别是多少?(2)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由.(3)若从参加培训的5位工人中选2人参加技能竞赛,求A,B二人中至少有一人参加技能竞赛的概率.解:(1)A的中位数是eq\f(83+85,2)=84,B的中位数是eq\f(84+82,2)=83.(2)派B参加比较合适.理由如下:eq\o(x,\s\up6(-))B=eq\f(1,8)(78+79+81+82+84+88+93+95)=85,eq\o(x,\s\up6(-))A=eq\f(1,8)(75+80+80+83+85+90+92+95)=85,seq\o\al(2,B)=eq\f(1,8)[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,seq\o\al(2,A)=eq\f(1,8)[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,因为eq\o(x,\s\up6(-))A=eq\o(x,\s\up6(-))B,但seq\o\al(2,B)<seq\o\al(2,A),说明B稳定,派B参加比较合适.(3)5位工人中选2人有10种:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E);A,B都不参加的有3种:(C,D),(C,E),(D,E),A,B二人中至少有一人参加技能竞赛的概率P=1-eq\f(3,10)=eq\f(7,10).[综合题组练]1.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是()A.A县 B.B县C.A县、B县两个地区相等 D.无法确定解析:选A.根据茎叶图中的数据可知,A县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B县的数据分布比较分散,不如A县数据集中,所以A县的方差较小.2.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.1 B.2C.3 D.4解析:选D.由题意这组数据的平均数为10,方差为2,可得:x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8,得t2=4,所以|x-y|=2|t|=4.3.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为________.解析:由茎叶图可知0≤x≤9且x∈N,中位数是eq\f(17+10+x,2)=eq\f(27+x,2),这位运动员这8场比赛的得分平均数为eq\f(1,8)(7+8+7+9+x+3+1+10×4+20×2)=eq\f(1,8)(x+115),由eq\f(1,8)(x+115)≥eq\f(27+x,2),得3x≤7,即x=0,1,2,所以这位运动员这8场比赛的得分平均数不小于得分中位数的概率为eq\f(3,10).答案:eq\f(3,10)4.我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则eq\f(1,a)+eq\f(4,b)的最小值为________.解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以eq\f(1,a)+eq\f(4,b)=(eq\f(1,a)+eq\f(4,b))×(eq\f(a,4)+eq\f(b,4))=eq\f(1,4)(1+eq\f(b,a)+eq\f(4a,b)+4)≥eq\f(1,4)×(5+4)=eq\f(9,4)(当且仅当b=2a时取等号).故eq\f(1,a)+eq\f(4,b)的最小值为eq\f(9,4).答案:eq\f(9,4)5.(应用型)某销售公司为了解员工的月工资水平,从1000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:(1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于4500元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于4500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资”“成熟员工工资”分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工若营销成功,将为公司赚得3万元,否则公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?解:(1)估计该公司员工的月平均工资为0.0001×1000×2000+0.0001×1000×3000+0.0002×1000×4000+0.0003×1000×5000+0.0002×1000×6000+0.0001×1000×7000=4700(元).(2)抽样比为eq\f(5,100)=eq\f(1,20),从工资在[1500,4500)内的员工中抽出100×(0.1+0.1+0.2)×eq\f(1,20)=2(人),设这两位员工分别为1,2;从工资在[4500,7500]内的员工中抽出100×(0.3+0.2+0.1)×eq\f(1,20)=3(人),设这三位员工分别为A,B,C.从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A),(1,B),(1,C),(2,A),(2,B),(2,C),(A,B),(A,C),(B,C).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A,B),(A,C),(B,C),概率为eq\f(3,10);其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A),(1,B),(1,C),(2,A),(2,B),(2,C),概率为eq\f(6,10)=eq\f(3,5);两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为eq\f(1,10).因为eq\f(1,10)<eq\f(3,10)<eq\f(3,5),所以公司收入2万元的可能性最大.6.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X的分布列和均值.解:(1)eq\o(x,\s\up6(-))甲=eq\f(1,8)(7+9+11+13+13+16+23+28)=15,eq\o(x,\s\up6(-))乙=eq\f(1,8)(7+8+10+15+17+19+21+23)=15,seq\o\al(2,甲)=eq\f(1,8)[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75,seq\o\al(2,乙)=eq\f(1,8)[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P1=eq\f(3,8),P2=eq\f(1,2),两人失分均超过15分的概率为P1P2=eq\f(3,16),X的所有可能取值为0,1,2.依题意,X~B(2,eq\f(3,16)),P(X=k)=Ceq\o\al(k,2)(eq\f(3,16))k(eq\f(13,16))2-k,k=0,1,2,则X的分布列为X012Peq\f(169,256)eq\f(39,128)eq\f(9,256)X的均值E(X)=2×eq\f(3,16)=eq\f(3,8).第3讲变量间的相关关系、统计案例[基础题组练]1.根据如下样本数据:x345678y4.02.50.50.50.40.1得到的线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0 B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0 D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以eq\o(b,\s\up6(^))<0,由样本点(3,4.0)及(4,2.5)可知eq\o(a,\s\up6(^))>0,故选B.2.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为eq\o(y,\s\up6(^))=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A.66% B.67%C.79% D.84%解析:选D.因为y与x具有线性相关关系,满足回归方程eq\o(y,\s\up6(^))=0.6x+1.2,该城市居民人均工资为x=5,所以可以估计该城市的职工人均消费水平eq\o(y,\s\up6(^))=0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为eq\f(4.2,5)=84%.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.4.千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届)2014201520162017学科竞赛获省级一等奖及以上的学生人数x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为()A.111 B.117C.118 D.123解析:选B.因为eq\o(x,\s\up6(-))=53,eq\o(y,\s\up6(-))=103.5,所以eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=103.5-1.35×53=31.95,所以回归直线方程为eq\o(y,\s\up6(^))=1.35x+31.95.当x=63时,代入解得eq\o(y,\s\up6(^))=117,故选B.5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),得K2=eq\f(100×(45×22-20×13)2,65×35×58×42)≈9.616.参照下表,P(K2≥k0)0.0500.0100.001k03.8416.63510.828下列结论正确的是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C.因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:eq\o(y,\s\up6(^))=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x变为x+1,eq\o(y,\s\up6(^))=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2457.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:18.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-eq\f(1,3)附近波动.经计算eq\o(∑,\s\up6(6),\s\do4(i=1))xi=11,eq\o(∑,\s\up6(6),\s\do4(i=1))yi=13,eq\o(∑,\s\up6(6),\s\do4(i=1))xeq\o\al(2,i)=21,则实数b的值为________.解析:令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-eq\f(1,3),此时eq\o(t,\s\up6(-))=eq\f(\o(∑,\s\up6(6),\s\do4(i=1))xeq\o\al(2,i),6)=eq\f(7,2),eq\o(y,\s\up6(-))=eq\f(\o(∑,\s\up6(6),\s\do4(i=1))yi,6)=eq\f(13,6),代入y=bt-eq\f(1,3),得eq\f(13,6)=b×eq\f(7,2)-eq\f(1,3),解得b=eq\f(5,7).答案:eq\f(5,7)9.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为eq\f(3,11).优秀非优秀总计甲班10乙班30总计110(1)请完成上面的列联表;(2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解:(1)列联表如下:优秀非优秀总计甲班105060乙班203050总计3080110(2)根据列联表中的数据,得到K2=eq\f(110×(10×30-20×50)2,60×50×30×80)≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.10.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\i\su(i=1,6,)xiyieq\i\su(i=1,6,)xeq\o\al(2,i)7301464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(\o(∑,\s\up6(n),\s\do8(i=1))xiyi-neq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do8(i=1))xeq\o\al(2,i)-neq\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(ⅰ)剔除异常数据,即3月份的数据后,得eq\o(x,\s\up6(-))=eq\f(1,5)×(7×6-6)=7.2,eq\o(y,\s\up6(-))=eq\f(1,5)×(30×6-31.8)=29.64.eq\i\su(i=1,5,)xiyi=1464.24-6×31.8=1273.44,eq\i\su(i=1,5,)xeq\o\al(2,i)=364-62=328.eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(5),\s\do8(i=1))xiyi-5eq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do8(i=1))xeq\o\al(2,i)-5eq\o(x,\s\up6(-))2)=eq\f(1273.44-5×7.2×29.64,328-5×7.2×7.2)=eq\f(206.4,68.8)=3,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=29.64-3×7.2=8.04.所以y关于x的回归方程为eq\o(y,\s\up6(^))=3x+8.04.(ⅱ)把x=18代入(ⅰ)中所求回归方程得eq\o(y,\s\up6(^))=3×18+8.04=62.04,故预报值为62.04万元.[综合题组练]1.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄[15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟退休”的人数155152817(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.参考数据及公式:P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))解:(1)列联表如下:45岁以下45岁以上总计支持354580不支持15520总计5050100因为K2=eq\f(100×(35×5-45×15)2,50×50×80×20)=eq\f(25,4)=6.25>3.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.①抽到1人是45岁以下的概率为eq\f(6,8)=eq\f(3,4),抽到1人是45岁以下且另一人是45岁以上的概率为eq\f(Ceq\o\al(1,6)Ceq\o\al(1,2),Ceq\o\al(2,8))=eq\f(3,7).故所求概率为eq\f(\f(3,7),\f(3,4))=eq\f(4,7).②X=0,1,2.P
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年天津市高考思想政治试卷(含答案解析)
- 2024污水处理厂工程项目设计合同(改)
- 2024年工程款支付担保协议(三方法人)
- 2024年区域代理商合作协议范本
- 2024年工程资料转化与迁移合同
- 2024年国际版权许可使用协议
- 2024标准户外广告合同格式
- 2024补偿贸易合同贸易合同范本
- 2024年Data Center Colocation Services Agreement(数据中心托管服务合同)
- 2024-2025学年高中地理第一章人口的变化单元评价含解析新人教版必修2
- 神经源性膀胱和直肠课件
- 一例脑梗塞病人护理个案
- 三国演义作品简介名著导读PPT 模板
- 固定资产情况表
- 超声引导下腰方肌阻滞PPT
- 绿色食品、有机食品和无公害食品课件
- 扩张型心肌病诊断和治疗指南
- 电子小报社团教案
- 八大特殊作业安全试题题库
- 标签打印管理办法及流程
- 广东开放大学风险投资(本2022春)-练习4答案
评论
0/150
提交评论