版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考数学一轮复习第十章统计与统计案例课件理湘教版5/9/2023第1页,共117页,2023年,2月20日,星期四第十章统计、统计案例10.1随机抽样10.2用样本估计总体10.3
变量间的相关关系、统计案例第2页,共117页,2023年,2月20日,星期四知识点考纲下载随机抽样1.理解随机抽样的必要性和重要性.2.会利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.用样本估计总体1.体会分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.第3页,共117页,2023年,2月20日,星期四知识点考纲下载统计案例1.会作两个有关联变量数据的散点图,会利用散点图直观认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)了解实际推断原理和假设检验的基本思想、方法及其简单应用.(3)进一步了解回归的基本思想、方法及其简单应用.第4页,共117页,2023年,2月20日,星期四10.1随机抽样
1.简单随机抽样(1)定义:设一个总体含有N个个体,从中
抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会
,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:
和
.逐个不放回都相等抽签法随机数法第5页,共117页,2023年,2月20日,星期四编号分段间隔k分段简单随机抽样l+kl+2k第6页,共117页,2023年,2月20日,星期四3.分层抽样(1)定义:在抽样时,将总体
的层,然后按照
,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由
.组成的,往往选用分层抽样.【思考探究】三种抽样方法有什么共同点?提示:抽样过程中每个个体被抽取的机会均等.分成互不交叉一定的比例差异明显的几个部分第7页,共117页,2023年,2月20日,星期四1.从2014名学生中选取10名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样法从2014人中剔除4人,剩下的2010人再按系统抽样的方法抽取,则每人入选的概率()A.不全相等B.均不相等C.都相等,且为D.都相等,且为【解析】从N个个体中抽取M个个体,则每个个体被抽到的概率都等于M/N.【答案】C第8页,共117页,2023年,2月20日,星期四2.将参加英语口语测试的1000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A.700B.669C.695D.676【解析】由题意可知,第一组随机抽取的编号l=15,分段间隔数k=N/n=1000/50=20,则抽取的第35个编号为a35=15+(35-1)×20=695.【答案】C第9页,共117页,2023年,2月20日,星期四3.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是()A.7
B.6
C.5
D.4第10页,共117页,2023年,2月20日,星期四4.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等.在第1段内采用简单随机抽样的方法确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号.由题意,第5组抽出的号码为22,因为2+(5-1)×5=22,则第1组抽出的号码应该为2,第8组抽出的号码应该为2+(8-1)×5=37.由分层抽样知识可知,40岁以下年龄段的职工占50%,按比例应抽取40×50%=20(人).【答案】3720第11页,共117页,2023年,2月20日,星期四简单随机抽样简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.【注意】
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.第12页,共117页,2023年,2月20日,星期四(1)下列抽取样本的方式属于简单随机抽样的个数是.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.(2)总体编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第11列和第12列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为.第13页,共117页,2023年,2月20日,星期四7816657208026314070243699728019832049234493582003623486969387418【解析】(1)①不是简单随机抽样.由于被抽取的样本总体的个体数是无限的,而不是有限的.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.第14页,共117页,2023年,2月20日,星期四(2)依题意,第一次得到的两个数字为02,由于02<20,将它取出;第二次得到的两个数字为63,由于63>20,将它去掉;第三次得到的两个数字为14,由于14<20,说明号码14在总体内,将它取出;继续向右读,依次可以取出07,02,01;但由于02在前面已经选出,故需要继续选一个.再选一个就是04.故选出来的第5个个体是04.【答案】(1)0(2)04第15页,共117页,2023年,2月20日,星期四【变式训练】
1.某项大赛举行群众参与活动,现在要从6名入围的幸运观众中抽取三人获得大赛一等奖.问:第一次抽取时,每个个体被抽到的概率是多少?第二次抽取时,余下的每个个体被抽到的概率是多少?第三次抽取时,余下的每个个体被抽到的概率是多少?整个抽样过程中,每个个体被抽取的概率是多少?应当选用什么样的方法抽取获奖观众更公平?第16页,共117页,2023年,2月20日,星期四第17页,共117页,2023年,2月20日,星期四系统抽样第18页,共117页,2023年,2月20日,星期四将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8B.25,17,8C.25,16,9D.24,17,9第19页,共117页,2023年,2月20日,星期四【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).令3+12(k-1)≤300得k≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k-1)≤495得1034<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B.【答案】B第20页,共117页,2023年,2月20日,星期四【变式训练】2.一个总体中的1000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x+33k的后两位数,(1)当x=24时,写出所抽取样本的10个号码;(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.第21页,共117页,2023年,2月20日,星期四第22页,共117页,2023年,2月20日,星期四分层抽样分层抽样遵循的原则(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样需遵循每层抽样的比相同,即为样本容量与总体数目的比值.第23页,共117页,2023年,2月20日,星期四(1)(2014·兰州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人):学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为
.(2)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为
.第24页,共117页,2023年,2月20日,星期四【解析】(1)因为3045+15+30+10+a+20=1245+15,解得a=30.(2)由题意知,青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.【答案】(1)30(2)15第25页,共117页,2023年,2月20日,星期四第26页,共117页,2023年,2月20日,星期四第27页,共117页,2023年,2月20日,星期四第28页,共117页,2023年,2月20日,星期四类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成三种抽样方法的比较第29页,共117页,2023年,2月20日,星期四从近两年的高考试题来看,分层抽样是高考的热点,但同时重视系统抽样,题型既有选择题也有填空题,分值占5分左右,属容易题.命题时多以现实生活为背景,主要考查基本概念及简单计算.第30页,共117页,2023年,2月20日,星期四7816657208026314070243699728019832049234493582003623486969387418(2013·江西卷)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08B.07C.02D.01【规范解答】选出来的5个个体编号依次为:08,02,14,07,01.故选D.【答案】D第31页,共117页,2023年,2月20日,星期四【阅后报告】(1)为了便于使用随机数表,给总体的每个个体编号时其位数相同:如两位数编号为01,02,…三位数编号为001,002,在数表中,每两个数字(每三个数字)连在一起对应一个个体.(2)读数时,从表中随机选取一个数字开始,自左向右,或自右向左选取,有超过总体号码或出现重复的数字舍去,直到找到全体.第32页,共117页,2023年,2月20日,星期四1.(2013·安徽卷)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数第33页,共117页,2023年,2月20日,星期四2.(2014·重庆卷)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250【解析】由题意,得70/3500=n/(3500+1500),解得n=100.【答案】A第34页,共117页,2023年,2月20日,星期四3.(2013·陕西卷)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14【解析】由系统抽样定义可知,所分组距为840/42=20,每组抽取一个,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.【答案】B第35页,共117页,2023年,2月20日,星期四4.(2014·湖北卷)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.【解析】设乙设备生产的产品总数为n,则80-50n=80/4800,解得n=1800.【答案】1800第36页,共117页,2023年,2月20日,星期四课时作业第37页,共117页,2023年,2月20日,星期四10.2用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.第38页,共117页,2023年,2月20日,星期四2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的
,就得到频率分布折线图.(2)总体密度曲线:随着
的增加,作图时
增加,
减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.中点样本容量所分的组数组距第39页,共117页,2023年,2月20日,星期四原始信息数据信息随时记录记录表示平均距离第40页,共117页,2023年,2月20日,星期四5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积
,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的
.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的
.横坐标应该相等横坐标之和第41页,共117页,2023年,2月20日,星期四1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a第42页,共117页,2023年,2月20日,星期四2.已知下列说法:①众数所在的组的频率最大;②各组频数之和为1;③如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组;④频率分布直方图中每个小长方形的高与这一组的频数成正比例.正确的说法是()A.①③
B.②③
C.③④
D.④第43页,共117页,2023年,2月20日,星期四3.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则()A.=5,s2<2B.=5,s2>2C.>5,s2<2D.>5,s2>2【解析】∵18(x1+x2+…+x8)=5,∴19(x1+x2+…+x8+5)=5,∴=5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,∴s2<2,故选A.【答案】A第44页,共117页,2023年,2月20日,星期四第45页,共117页,2023年,2月20日,星期四第46页,共117页,2023年,2月20日,星期四5.(2014·武汉武昌区联考)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为
;(2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为
.【解析】由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x=59+62+70+73+815=69,则该样本的方差【答案】(1)2,10,18,26,34(2)62第47页,共117页,2023年,2月20日,星期四频率分布直方图频率分布直方图从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据落在各个小组的频率的大小.第48页,共117页,2023年,2月20日,星期四第49页,共117页,2023年,2月20日,星期四【解析】(1)由频率分布直方图得前五组频率为(0.008+0.016+0.04+0.04+0.06)×5=0.82,后三组频率为1-0.82=0.18,人数为0.18×50=9(人),这所学校高三年级全体男生身高在180cm以上(含180cm)的人数为800×0.18=144(人).(2)由频率分布直方图得第八组频率为0.008×5=0.04,人数为0.04×50=2(人),设第六组人数为m,则第七组人数为9-2-m=7-m.又m+2=2×(7-m),∴m=4,所以第六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.频率/组距分别为0.016,0.012(画图如图).第50页,共117页,2023年,2月20日,星期四第51页,共117页,2023年,2月20日,星期四第52页,共117页,2023年,2月20日,星期四第53页,共117页,2023年,2月20日,星期四第54页,共117页,2023年,2月20日,星期四茎叶图1.运用茎叶图表示样本数据,有两大突出优点:(1)统计图上没有原始信息的损失,所有数据信息都可以从茎叶图中得到;(2)茎叶图可以随时记录,方便表示与比较.2.一般制作茎叶图的方法是:将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.第55页,共117页,2023年,2月20日,星期四随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.甲班
乙班
2
18
1
9
9
1
0
17
0
3
6
8
9
8
8
3
2
16
2
5
8
8
15
9(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差.
第56页,共117页,2023年,2月20日,星期四第57页,共117页,2023年,2月20日,星期四第58页,共117页,2023年,2月20日,星期四【变式训练】2.(2013·洛阳联考)有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次,用茎叶图表示这两组数据如图.(1)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由;(2)若从参加培训的5位工人中选2人参加技能竞赛,求A,B二人中至少有一人参加技能竞赛的概率.第59页,共117页,2023年,2月20日,星期四第60页,共117页,2023年,2月20日,星期四用样本的数字特征估计总体的分布平均数、众数、中位数描述一组数据的集中趋势,方差和标准差描述其波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.第61页,共117页,2023年,2月20日,星期四第62页,共117页,2023年,2月20日,星期四第63页,共117页,2023年,2月20日,星期四【变式训练】3.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?第64页,共117页,2023年,2月20日,星期四【解析】(1)设A药观测数据的平均数为A,B药观测数据的平均数为B,则A=120(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.B=120(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则A>B,因此A药的疗效更好.(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A药疗效的试验结果有7/10的叶集中在茎2,3上;B药疗效的试验结果有7/10的叶集中在茎0,1上由上述可看出A药的疗效更好.第65页,共117页,2023年,2月20日,星期四
1.几种表示频率分布方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.第66页,共117页,2023年,2月20日,星期四第67页,共117页,2023年,2月20日,星期四从近两年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.第68页,共117页,2023年,2月20日,星期四(2012·陕西卷)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如图所示:(1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率.第69页,共117页,2023年,2月20日,星期四【规范解答】(1)甲品牌产品寿命小于200小时的频率为用频率估计概率,所以甲品牌产品寿命小于200小时的概率为.(2)根据抽样结果,寿命大于200小时的产品共有75+70=145(个),其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是用频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为.【阅后报告】(1)注意本题中的图是频数分布图不是频率分布直方图.(2)弄清楚寿命小于200小时,大于200小时的频数便于求频率.第70页,共117页,2023年,2月20日,星期四1.(2014·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17].将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【解析】因为第一组与第二组共有20人,并且根据图象知第一组与第二组的频率之比是0.24∶0.16=3∶2,所以第一组的人数为20×35=12.又因为第一组与第三组的频率之比是0.24∶0.36=2∶3,所以第三组有12÷23=18人.因为第三组中没有疗效的人数为6,所以第三组中有疗效的人数是18-6=12.【答案】C第71页,共117页,2023年,2月20日,星期四第72页,共117页,2023年,2月20日,星期四第73页,共117页,2023年,2月20日,星期四3.(2013·辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为
.第74页,共117页,2023年,2月20日,星期四4.(2014·山东卷)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.第75页,共117页,2023年,2月20日,星期四第76页,共117页,2023年,2月20日,星期四10.3变量间的相关关系、统计案例1.两个变量的线性相关(1)正相关在散点图中,点散布在从
到
的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从
到
的区域,对于两个变量的这种相关关系,我们将它称为负相关.左下角右上角左上角右下角第77页,共117页,2023年,2月20日,星期四(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在
,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.【思考探究】
相关关系与函数关系有什么异同点?提示:相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.一条直线附近第78页,共117页,2023年,2月20日,星期四距离的平方和最小第79页,共117页,2023年,2月20日,星期四3.回归分析(1)定义:对具有__________的两个变量进行统计分析的一种常用方法.(2)随机误差:线性回归模型用y=bx+a+e表示,其中a和b为模型的__________,___称为随机误差.
相关关系未知参数e第80页,共117页,2023年,2月20日,星期四②当r>0时,表明两个变量________;当r<0时,表明两个变量_________.r的绝对值越接近于1,表明两个变量的线性
相关性_______.r的绝对值越接近于0时,
表明两个变量之间_______________________.通常|r|大于______时,认为两个变量有很强的线性相关性.
正相关负相关越强几乎不存在线性相关关系0.75第81页,共117页,2023年,2月20日,星期四随机误差差第82页,共117页,2023年,2月20日,星期四第83页,共117页,2023年,2月20日,星期四5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的__________,像这样的变量称为分类变量.(2)列联表:列出两个分类变量的________,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为不同类别频数表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2×2列联表第84页,共117页,2023年,2月20日,星期四构造一个随机变量K2=_______________________,其中n=______________为样本容量.(3)独立性检验利用随机变量、_____________来确定是
否一定有把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
a+b+c+d独立性假设第85页,共117页,2023年,2月20日,星期四1.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图B.二维条形图C.等高条形图D.独立性检验【解析】前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.【答案】D第86页,共117页,2023年,2月20日,星期四【解析】
据相关指数的定义可知,相关指数R2的值越大,残差平方和越小,即模型的拟合效果越好.【答案】A第87页,共117页,2023年,2月20日,星期四【解析】散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.【答案】D第88页,共117页,2023年,2月20日,星期四第89页,共117页,2023年,2月20日,星期四第90页,共117页,2023年,2月20日,星期四5.某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为
杯.气温(℃)181310-1杯数24343864第91页,共117页,2023年,2月20日,星期四第92页,共117页,2023年,2月20日,星期四相关关系的判断第93页,共117页,2023年,2月20日,星期四第94页,共117页,2023年,2月20日,星期四【变式训练】1.下面是水稻产量与施化肥量的一组观测数据:施化肥量:15
20
25
30
35
40
45水稻产量:320
330
360
410
460
470
480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?第95页,共117页,2023年,2月20日,星期四【解析】(1)散点图如图:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.第96页,共117页,2023年,2月20日,星期四回归方程的求法及回归分析第97页,共117页,2023年,2月20日,星期四为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5天的平均投篮命中率为
;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为
.时间x12345命中率y0.40.50.60.60.4【解析】小李这5天的平均投篮命中率y=(0.4+0.5+0.6+0.6+0.4)/5=0.5,可求得小李这5天的平均打篮球时间=3.根据表中数据可求得b=0.01,a=0.47,故线性回归方程为y=0.47+0.01x,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.【答案】0.50.53第98页,共117页,2023年,2月20日,星期四【变式训练】2.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:)零件个数x(个)2345加工时间(小时)2.5344.5第99页,共117页,2023年,2月20日,星期四【解析】(1)散点图如图.第100页,共117页,2023年,2月20日,星期四独立性检验第101页,共117页,2023年,2月20日,星期四第102页,共117页,2023年,2月20日,星期四第103页,共117页,2023年,2月20日,星期四第104页,共117页,2023年,2月20日,星期四【变式训练】3.某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的5/6,女生喜欢看NBA的人数占女生人数的1/3.(1)若被调查的男生人数为n,根据题意建立一个2×2列联表;(2)若有95%的把握认为是否喜欢看N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《试卷3份集锦》杭州市中考化学第一次调研试卷含解析
- 广西柳州铁路第一中学2023-2024学年下学期普通高中高三教学质量检测试题(一)数学试题
- 门市房出售服务合同(3篇)
- 质量管理部工作制度
- 设计岗试用期员工工作总结范文(31篇)
- 门头整修合同范本
- 校医工作年终的工作总结(3篇)
- 2023届新高考化学一轮复习有机物的结构和有机反应类型夯基础
- 驾校退款合同范本
- 中国电子级银粉行业投资分析、市场运行态势、未来前景预测报告
- 车削工艺与技能训练《台阶轴的车削》课件
- 中国航天发展史模板
- 骨科学研究生复试真题汇总版
- 初中信息技术人教八年级上册 综合实践活动第2节 制作视频类数字故事
- 小学综合实践六年级上册第4单元《主题活动三:校园文化活动我参与》教案
- 人教PEP小学三年级英语下册教学计划及进度表
- 铁路产品认证中心(CRCC)认证的铁路产品目录及标准
- 《新疆维吾尔自治区建筑安装工程费用定额》2010年
- 《职业发展与就业指导》全书教案全套教学单元设计
- DB32-T 3916-2020建筑地基基础检测规程-(高清现行)
- NFA112005低、中、高倍数泡沫标准中译文
评论
0/150
提交评论