高中数学高考3 第3讲 变量间的相关关系、统计案例 新题培优练_第1页
高中数学高考3 第3讲 变量间的相关关系、统计案例 新题培优练_第2页
高中数学高考3 第3讲 变量间的相关关系、统计案例 新题培优练_第3页
高中数学高考3 第3讲 变量间的相关关系、统计案例 新题培优练_第4页
高中数学高考3 第3讲 变量间的相关关系、统计案例 新题培优练_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[基础题组练]1.根据如下样本数据:x345678y4.02.50.50.50.40.1得到的线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则()A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0 B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0 D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以eq\o(b,\s\up6(^))<0,由样本点(3,4.0)及(4,2.5)可知eq\o(a,\s\up6(^))>0,故选B.2.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为eq\o(y,\s\up6(^))=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A.66% B.67%C.79% D.84%解析:选D.因为y与x具有线性相关关系,满足回归方程eq\o(y,\s\up6(^))=0.6x+1.2,该城市居民人均工资为x=5,所以可以估计该城市的职工人均消费水平eq\o(y,\s\up6(^))=0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为eq\f(4.2,5)=84%.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.4.(2019·黑龙江哈尔滨模拟)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届)2014201520162017学科竞赛获省级一等奖及以上的学生人数x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为()A.111 B.117C.118 D.123解析:选B.因为eq\o(x,\s\up6(-))=53,eq\o(y,\s\up6(-))=103.5,所以eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=103.5-1.35×53=31.95,所以回归直线方程为eq\o(y,\s\up6(^))=1.35x+31.95.当x=63时,代入解得eq\o(y,\s\up6(^))=117,故选B.5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),得K2=eq\f(100×(45×22-20×13)2,65×35×58×42)≈9.616.参照下表,P(K2≥k0)0.0500.0100.001k03.8416.63510.828下列结论正确的是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C.因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:eq\o(y,\s\up6(^))=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x变为x+1,eq\o(y,\s\up6(^))=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2457.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:18.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-eq\f(1,3)附近波动.经计算eq\o(∑,\s\up6(6),\s\do4(i=1))xi=11,eq\o(∑,\s\up6(6),\s\do4(i=1))yi=13,eq\o(∑,\s\up6(6),\s\do4(i=1))xeq\o\al(2,i)=21,则实数b的值为________.解析:令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-eq\f(1,3),此时eq\o(t,\s\up6(-))=eq\f(\o(∑,\s\up6(6),\s\do4(i=1))xeq\o\al(2,i),6)=eq\f(7,2),eq\o(y,\s\up6(-))=eq\f(\o(∑,\s\up6(6),\s\do4(i=1))yi,6)=eq\f(13,6),代入y=bt-eq\f(1,3),得eq\f(13,6)=b×eq\f(7,2)-eq\f(1,3),解得b=eq\f(5,7).答案:eq\f(5,7)9.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为eq\f(3,11).优秀非优秀总计甲班10乙班30总计110(1)请完成上面的列联表;(2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解:(1)列联表如下:优秀非优秀总计甲班105060乙班203050总计3080110(2)根据列联表中的数据,得到K2=eq\f(110×(10×30-20×50)2,60×50×30×80)≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.10.(2019·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\i\su(i=1,6,)xiyieq\i\su(i=1,6,)xeq\o\al(2,i)7301464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(\o(∑,\s\up6(n),\s\do8(i=1))xiyi-neq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do8(i=1))xeq\o\al(2,i)-neq\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(ⅰ)剔除异常数据,即3月份的数据后,得eq\o(x,\s\up6(-))=eq\f(1,5)×(7×6-6)=7.2,eq\o(y,\s\up6(-))=eq\f(1,5)×(30×6-31.8)=29.64.eq\i\su(i=1,5,)xiyi=1464.24-6×31.8=1273.44,eq\i\su(i=1,5,)xeq\o\al(2,i)=364-62=328.eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(5),\s\do8(i=1))xiyi-5eq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do8(i=1))xeq\o\al(2,i)-5eq\o(x,\s\up6(-))2)=eq\f(1273.44-5×7.2×29.64,328-5×7.2×7.2)=eq\f(206.4,68.8)=3,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=29.64-3×7.2=8.04.所以y关于x的回归方程为eq\o(y,\s\up6(^))=3x+8.04.(ⅱ)把x=18代入(ⅰ)中所求回归方程得eq\o(y,\s\up6(^))=3×18+8.04=62.04,故预报值为62.04万元.[综合题组练]1.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄[15,25)[25,35)[35,45)[45,55)[55,65]支持“延迟退休”的人数155152817(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.参考数据及公式:P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))解:(1)列联表如下:45岁以下45岁以上总计支持354580不支持15520总计5050100因为K2=eq\f(100×(35×5-45×15)2,50×50×80×20)=eq\f(25,4)=6.25>3.841,所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.(2)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.①抽到1人是45岁以下的概率为eq\f(6,8)=eq\f(3,4),抽到1人是45岁以下且另一人是45岁以上的概率为eq\f(Ceq\o\al(1,6)Ceq\o\al(1,2),Ceq\o\al(2,8))=eq\f(3,7).故所求概率为eq\f(\f(3,7),\f(3,4))=eq\f(4,7).②X=0,1,2.P(X=0)=eq\f(Ceq\o\al(2,6),Ceq\o\al(2,8))=eq\f(15,28),P(X=1)=eq\f(Ceq\o\al(1,6)Ceq\o\al(1,2),Ceq\o\al(2,8))=eq\f(12,28)=eq\f(3,7),P(X=2)=eq\f(Ceq\o\al(2,2),Ceq\o\al(2,8))=eq\f(1,28).可得随机变量X的分布列为X012Peq\f(15,28)eq\f(3,7)eq\f(1,28)故E(X)=1×eq\f(3,7)+2×eq\f(1,28)=eq\f(1,2).2.(2019·洛阳第一次联考)随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司6个月内的市场占有率进行了统计,并绘制了相应的折线图.(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系.求y关于x的线性回归方程,并预测M公司2017年4月份(即x=7时)的市场占有率.(2)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1000元/辆和1200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆使用年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用年限频数表如下:使用年限车型1年2年3年4年总计A20353510100B10304020100经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用年限都是整数,且以频率作为每辆单车使用年限的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?参考公式:回归直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-neq\o(x,\s\up6(-))eq\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-neq\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解:(1)由数据计算可得eq\o(x,\s\up6(-))=eq\f(1+2+3+4+5+6,6)=3.5,eq\o(y,\s\up6(-))=eq\f(11+13+16+15+20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论