版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
连州中学2016届高三文科导学案统计与统计案例主备人:陈英审核人:何红艳使用时间:使用人:PAGE第34-页共34页第1讲随机抽样一、考纲要求知识点考纲下载随机抽样1.理解随机抽样的必要性和重要性.2.会利用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样的方法.二、自主梳理1.简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.(2)常用方法:抽签法和随机数法.2.系统抽样(1)步骤:①先将总体的N个个体编号;②根据样本容量n,当eq\f(N,n)是整数时,取分段间隔k=eq\f(N,n);③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.(2)适用范围:适用于总体中的个体数较多时.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)适用范围:适用于总体由差异比较明显的几个部分组成时.1.辨明两个易误点(1)简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.(2)分层抽样中,易忽视每层抽取的个体的比例是相同的,即eq\f(样本容量n,总体个数N).2.三种抽样方法的比较类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成第一课时三、问题导学eq\a\vs4\al(考点一)__简单随机抽样________________________下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签法从10件产品中选取3件进行质量检验[规律方法]抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.1.(2013·高考江西卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B.07C.02 D.01考点二系统抽样(2013·高考陕西卷)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12C.13 D.14[规律方法]系统抽样的步骤:(1)先将总体的N个个体编号;(2)确定分段间隔k(k∈N*),对编号进行分段.当eq\f(N,n)(n是样本容量)是整数时,取k=eq\f(N,n);(3)在第1段用简单随机抽样确定第1个个体编号l(l≤k);(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.2.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,三个营区被抽中的人数依次为()A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9四、达标检测1.利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是()A.eq\f(1,2) B.eq\f(1,3)C.eq\f(1,6) D.eq\f(1,4)2.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为()49544354821737932378873520964384263491645724550688770474476721763350258392120676A.23 B.09C.02 D.173.(2015·河北石家庄模拟)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是()A.1,2,3,4,5,6 B.6,16,26,36,46,56C.1,2,4,8,16,32 D.3,9,13,27,36,544.(2015·安徽池州一中期末)已知某商场新进3000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋进行检查,将3000袋奶粉按1,2,…,3000随机编号,若第一组抽出的号码是11,则第六十一组抽出的号码为________.五、小结反思第二课时三、问题导学eq\a\vs4\al(考点三)__分层抽样(高频考点)____________________分层抽样是抽样方法考查的重点,也是高考命题的热点,多以选择题或填空题的形式出现,试题难度不大,多为容易题或中档题.高考对分层抽样的考查主要有以下三个命题角度:(1)已知各层总数,确定抽样比;(2)已知各层总数,某一层的样本数,求另一层样本数或总数;(3)已知某层总数及某层的样本数,求各层样本数.(1)(2015·抚顺模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7(2)(2014·高考天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.[规律方法]分层抽样问题的解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本数(或总体数).(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.跟踪训练3.(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12、21、25、43,则这四个社区驾驶员的总人数N为()A.101 B.808C.1212 D.2016(2)某报社做了一次关于“什么是新时代的雷锋精神”的调查,在A,B,C,D四个单位回收的问卷数依次成等差数列,且共回收1000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽取30份,则在D单位抽取的问卷是________份.,[学生用书P199~P200])考题溯源——分层抽样(2014·高考重庆卷)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150C.200 D.250[考题溯源]本题源于人教A版必修3P100A组第2(2)题“一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是________”,对题中m,n给予赋值.1.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A.54B.90C.45 D.1262.调查某高中1000名学生的身高情况得下表,已知从这批学生中随机抽取1名学生,抽到偏矮男生的概率为0.12,若用分层抽样的方法,从这批学生中随机抽取50名,则应在偏高学生中抽________名.偏矮正常偏高女生/人100273y男生/人x287z四、达标检测1.(2015·浙江模拟)某地区高中分三类,A类学校共有学生2000人,B类学校共有学生3000人,C类学校共有学生4000人,若采取分层抽样的方法抽取900人,则A类学校中的学生甲被抽到的概率为()A.eq\f(1,10) B.eq\f(9,20)C.eq\f(1,2000) D.eq\f(1,2)2.某学校在校学生2000人,为了加强学生的锻炼意识,学校举行了跑步和登山比赛,每人都参加且每人只参加其中一项比赛,各年级参加比赛的人数情况如下:高一年级高二年级高三年级跑步人数abc登山人数xyz其中a∶b∶c=2∶5∶3,全校参加登山的人数占总人数的eq\f(1,4).为了了解学生对本次活动的满意程度,按分层抽样的方式从中抽取一个200人的样本进行调查,则高三年级参加跑步的学生中应抽取的人数为()A.15 B.30C.40 D.453.某校对全校1600名男女生学生的视力状况进行调查,现用分层抽样的方法抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该为________.4.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1300样本容量(件)130由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________.5.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?6.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为eq\f(5,39),求x,y的值.五、小结反思第2讲用样本估计总体一、考纲要求知识点考纲下载用样本估计总体1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.二、自主梳理1.统计图表的含义(1)频率分布表①含义:把反映总体频率分布的表格称为频率分布表.②频率分布表的画法步骤:第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:能够反映样本的频率分布规律的直方图.(3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.(4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线.(5)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.(3)平均数:把eq\f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是s=eq\r(\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2])s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2]1.辨明两个易误点(1)易忽视频率分布直方图中纵轴表示的应为eq\f(频率,组距).(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.2.众数、中位数和平均数的异同众数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,出现在这些数据中不一定在这些数据中出现.奇数个时,在这组数据中出现;偶数个时,为中间两数的平均值不一定在这些数据中出现3.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.第一课时三、问题导学eq\a\vs4\al(考点一)__频率分布直方图(高频考点)______________频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下四个命题角度:(1)完善频率分布直方图;(2)利用频率分布直方图求样本容量;(3)求样本平均数、众数、中位数;(4)与概率结合考查某区间内的个体被选中的概率.(1)(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8C.12 D.18(2)(2014·高考北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100①从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;②求频率分布直方图中的a,b的值;③假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)[规律方法]解决频率分布直方图问题时要抓住:(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示eq\f(频率,组距),故每组样本的频率为组距×eq\f(频率,组距),即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.1.(1)某学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[40,50]元的同学有39人,则n的值为()A.100 B.120C.130 D.390(2)(2015·辽宁省五校上学期联考)为了了解某省各景点在大众中的熟知度,随机在15~65岁的人群中抽取了n人,回答问题“该省有哪几个著名的旅游景点?”,统计结果如下图表:组号分组回答正确的人数回答正确的人数占本组的频率第1组[15,25)a0.5第2组[25,35)18x第3组[35,45)b0.9第4组[45,55)90.36第5组[55,65]3y①分别求出a,b,x,y的值;②从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?③在②抽取的6人中随机抽取2人,求所抽取的人中恰好没有第3组人的概率.eq\a\vs4\al(考点二)__茎叶图________________________________(2013·高考课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[规律方法]茎叶图的优缺点:由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.2.(1)(2015·安徽省“江南十校”联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为()A.8 B.5C.4 D.2(2)(2013·高考重庆卷)右面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5C.5,8 D.8,8四、达标检测1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()A.0.05B.0.25C.0.5 D.0.72.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20 B.100,20C.200,10 D.100,103某同学进入高三后,4次月考的数学成绩的茎叶图如图,则该同学数学成绩的方差是()A.125 B.5eq\r(5)C.45 D.3eq\r(5)4.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图,如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于()A.80 B.90C.100 D.1105.(2015·湖北八校联考)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.(1)[25,30)年龄组对应小矩形的高度为________;6.(2014·高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.7.(2014·高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.五、小结反思:第二课时三、问题导学eq\a\vs4\al(考点三)__样本的数字特征______________________(2014·高考陕西卷)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为eq\o(x,\s\up6(-))和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.eq\o(x,\s\up6(-)),s2+1002 B.eq\o(x,\s\up6(-))+100,s2+1002C.eq\o(x,\s\up6(-)),s2 D.eq\o(x,\s\up6(-))+100,s2[规律方法]样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x1,x2,…,xn的平均数为eq\o(x,\s\up6(-)),方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为meq\o(x,\s\up6(-))+a,方差为m2s2.3.(1)(2013·高考山东卷)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x91则7个剩余分数的方差为()A.eq\f(116,9) B.eq\f(36,7)C.36 D.eq\f(6\r(7),7)(2)(2013·高考辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.,[学生用书P203])交汇创新——统计与概率的交汇(2014·高考广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.[名师点评]本题是概率与统计相交汇的常规命制试题,门槛低,入手容易.解决此类问题的关键是理解统计中一些基本概念,理解事件的含义并确定事件的所有可能结果,求出每个结果对应的概率,即可得到答案.(2015·海淀区第二学期期中练习)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制表如下:两名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超过35件的部分每件7元.根据表中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;四、达标检测1.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a2.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m+n=________.3.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是()A.3 B.4C.5 D.64.某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均分为________,方差为________.5.(2015·西安模拟)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:区间[100,110)的中点值为eq\f(100+110,2)=105)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.6.(2015·昆明市高三上学期调研)在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由;(2)从乙的6次成绩中随机选择2个成绩,求选到123分的概率.五小结反思:第三讲变量间的相关关系一、考纲要求知识点考纲下载统计案例1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)了解假设检验的基本思想、方法及其简单应用.(3)了解回归分析的基本思想、方法及其简单应用.二、自主梳理1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(eq\o(∑,\s\up6(n),\s\do4(i=1))xiyi-neq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),eq\o(∑,\s\up6(n),\s\do4(i=1))xieq\s\up4(2)-neq\o(x,\s\up6(-))eq\s\up4(2)),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).(3)通过求Q=eq\o(\s\do8(i=1),∑,\s\up6(n))eq^\o(,\s\do4(i=1))错误!未找到引用源。(yi-bxi-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))(其中n=a+b+c+d为样本容量).1.辨明三个易误点(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))点,可能所有的样本数据点都不在直线上.(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).2.求线性回归直线方程的方法求解回归方程关键是确定回归系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),因求解eq\o(b,\s\up6(^))的公式计算量太大,一般题目中给出相关的量,如eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),eq\o(\s\do8(i=1),∑,\s\up6(n))eq^\o(,\s\do4(i=1))错误!未找到引用源。xeq\o\al(2,i),eq\o(\s\do8(i=1),∑,\s\up6(n))eq^\o(,\s\do4(i=1))错误!未找到引用源。xiyi等,便可直接代入求解.充分利用回归直线过样本中心点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),即有y=eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))+eq\o(a,\s\up6(^)),可确定eq\o(a,\s\up6(^)).第一课时三、问题导学eq\a\vs4\al(考点一)__相关关系的判断______________________(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1(2)(2013·高考湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且eq\o(y,\s\up6(^))=2.347x-6.423;②y与x负相关且eq\o(y,\s\up6(^))=-3.476x+5.648;③y与x正相关且eq\o(y,\s\up6(^))=5.437x+8.493;④y与x正相关且eq\o(y,\s\up6(^))=-4.326x-4.578.其中一定不正确的结论的序号是()A.①② B.②③C.③④ D.①④1.(2015·河北石家庄市质量检测)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是()A.x和y正相关B.x和y的相关系数为直线l的斜率C.x和y的相关系数在-1到0之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同eq\a\vs4\al(考点二)__线性回归方程及其应用(高频考点)______线性回归问题是高考中的热点问题,考查形式可以是小题,也可以是解答题.高考中对线性回归问题的考查主要有以下两个命题角度:(1)求回归直线方程;(2)利用回归方程进行预测.(2014·高考课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:eq\o(b,\s\up6(^))=eq\f(eq\o(∑,\s\up6(n),\s\do4(i=1))(ti-eq\o(t,\s\up6(-)))(yi-eq\o(y,\s\up6(-))),eq\o(∑,\s\up6(n),\s\do4(i=1))(ti-eq\o(t,\s\up6(-)))eq\s\up4(2)),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(-))[规律方法](1)求回归直线方程前应通过散点图或相关系数进行相关性检验,确定是否有必要根据公式求回归直线方程,从而有依据地进行预测.(2)求线性回归方程的步骤:①计算eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-));②计算eq\o(∑,\s\up6(n),\s\do4(i=1))xiyi,eq\o(∑,\s\up6(n),\s\do4(i=1))xieq\s\up4(2)③计算eq\o(b,\s\up6(^))=eq\f(eq\o(∑,\s\up6(n),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-))),eq\o(∑,\s\up6(n),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))eq\s\up4(2))=eq\f(eq\o(∑,\s\up6(n),\s\do4(i=1))xiyi-neq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),eq\o(∑,\s\up6(n),\s\do4(i=1))xieq\s\up4(2)-neq\o(x,\s\up6(-))eq\s\up4(2)).eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-));④写出回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).2.(1)(2014·高考湖北卷)根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为eq\o(y,\s\up6(^))=bx+a,则()A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0(2)(2015·石家庄市第一次模拟)登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温(℃)181310-1山高(km)24343864由表中数据,得到线性回归方程eq\o(y,\s\up6(^))=-2x+eq\o(a,\s\up6(^))(eq\o(a,\s\up6(^))∈R).由此估计山高为72(km)处气温的度数为()A.-10 B.-8C.-6 D.-4四、达标检测1.(2015·泸州模拟)为研究变量x和y的线性相关性,甲、乙二人分别做了研究,利用回归分析的方法得到回归直线l1和l2,两人计算得eq\o(x,\s\up6(-))相同,eq\o(y,\s\up6(-))也相同,则下列结论正确的是()A.l1与l2重合B.l1与l2一定平行C.l1与l2相交于点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))D.无法判断l1和l2是否相交2.(2015·大连市双基测试)对于下列表格所示的五个散点,已知求得的线性回归直线方程为eq\o(y,\s\up6(^))=0.8x-155.x196197200203204y1367m则实数m的值为()A.8 B.8.2C.8.4 D.8.53.(2015·郑州市第二次质量预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为eq\o(y,\s\up6(^))=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.eq\f(1,6) B.eq\f(1,3)C.eq\f(1,2) D.eq\f(2,3)4.(2015·山东东营模拟)已知变量x与y之间的回归直线方程为eq\o(y,\s\up6(^))=-3+2x,若eq\o(∑,\s\up6(10),\s\do4(i=1))xi=17,则eq\o(∑,\s\up6(10),\s\do4(i=1))yi的值等于()A.3 B.4C.0.4 D.405.(2015·山东济南市模拟考试)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:eq\o(y,\s\up6(^))=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.五、小结反思第二课时三、问题导学eq\a\vs4\al(考点三)__独立性检验____________________________(2014·高考辽宁卷节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k)0.1000.0500.010k2.7063.8416.635[解]将2×2列联表中的数据代入公式计算,得K2=eq\f(100×(60×10-20×10)2,70×30×80×20)=eq\f(100,21)≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[规律方法]独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.3.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢德国队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:不喜欢德国队喜欢德国队总计40岁以上pq50不高于40岁153550总计ab100已知工作人员从所有统计结果中任取一个,取到喜欢德国队的人的概率为eq\f(3,5),则有超过________的把握认为年龄与德国队的被喜欢程度有关.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828四、达标检测1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050110由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),算得K2=eq\f(110×(40×30-20×20)2,60×50×60×50)≈7.8.附表:P(K2≥k)0.0500.0100
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版住宅小区车位产权转移及使用权购买合同3篇
- 2025版住宅小区消防设备设施定期检查与维护合同范本2篇
- 2025年度木门行业环保认证与推广合同3篇
- 2025年度国际物流合作解约及责任分担协议书
- 二零二五年度美容店转让合同包括美容院品牌授权及区域代理权
- 2025年度二零二五年度大型活动临时工人搬运服务承包协议
- 2025年度私人承包厂房租赁合同安全责任追究协议
- 二零二五板材行业数据分析与市场预测合同3篇
- 二零二五年度铲车清雪作业安全责任保险合同
- 二零二五年度深圳市新能源产业全日制劳动合同规范
- 中考模拟考试化学试卷与答案解析(共三套)
- 新人教版五年级小学数学全册奥数(含答案)
- 风电场升压站培训课件
- 收纳盒注塑模具设计(论文-任务书-开题报告-图纸)
- 博弈论全套课件
- CONSORT2010流程图(FlowDiagram)【模板】文档
- 脑电信号处理与特征提取
- 高中数学知识点全总结(电子版)
- GB/T 10322.7-2004铁矿石粒度分布的筛分测定
- 2023新译林版新教材高中英语必修一重点词组归纳总结
- 苏教版四年级数学下册第3单元第2课时“常见的数量关系”教案
评论
0/150
提交评论