




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课前基础巩固课堂考点探究
作业手册第54讲成对数据的统计分析1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系,会通过相关系数比较多组成对数据的相关性.
2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会用一元线性回归模型进行预测.
3.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.课标要求一、经验回归分析1.两个变量相关性的判断:(1)从散点图上看:当一个变量的值增加时,另一个变量的相应值也呈现
的趋势,则称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现
的趋势,则称这两个变量负相关.
课前基础巩固◈知识聚焦◈增加减少
课前基础巩固(ii)相关系数r的性质①当r>0时,表明成对样本数据
;当r<0时,表明成对样本数据
.
②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.课前基础巩固正相关负相关
课前基础巩固一条直线
课前基础巩固小横轴窄大3.经验回归分析的一般步骤:课前基础巩固二、独立性检验1.分类变量X,Y的2×2列联表:课前基础巩固XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d
2.独立性检验(1)基于小概率值α的检验规则:提出零假设H0:X和Y相互独立,并给出在问题中的解释.当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.常用的小概率值和相应的临界值如下表:课前基础巩固α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
课前基础巩固3.χ2独立性检验的一般步骤课前基础巩固题组一常识题1.[教材改编]对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得到散点图如图①所示;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得到散点图如图②所示.由这两个散点图可以判断,变量x与y
,u与v
.(填正相关、负相关或不相关)
课前基础巩固◈对点演练◈负相关正相关[解析]
由这两个散点图可以判断,变量x与y负相关,u与v正相关.
课前基础巩固68
零件数x(个)1020304050加工时间y(分钟)62
7581893.[教材改编]下面是2×2列联表:则表中a=
,b=
.
课前基础巩固52xy合计y1y2x1a2173x2222547合计b4612074[解析]
因为a+21=73,所以a=52.又a+22=b,所以b=74.
课前基础巩固题组二常错题
课前基础巩固①②[解析]
因为经验回归直线的斜率为2.5,所以y与x正相关,故①正确;若冬季昼夜温差增加1℃,则该新品种反季节大豆的发芽数约增加2.5颗,故②正确;经验回归直线方程只可预测结果,但不能确定,故③错误.故填①②.
课前基础巩固1.7年份20162017201820192020年份编号x12345年人均收入y(万元)0.50.611.4m
6.在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,则下列说法中正确的是
.
①100个吸烟者中至少有99人打鼾;②1个人患有心脏病,那么这个人有99%的概率打鼾;③在100个心脏病患者中一定有打鼾的人;④在100个心脏病患者中可能一个打鼾的人也没有.课前基础巩固④[解析]
在犯错误的概率不超过0.01的前提下认为结论是成立的,其意义是有99%的把握认为打鼾与患心脏病有关,在100个心脏病患者中可能一个打鼾的人也没有,故④正确,③错误;6.在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,则下列说法中正确的是
.
①100个吸烟者中至少有99人打鼾;②1个人患有心脏病,那么这个人有99%的概率打鼾;③在100个心脏病患者中一定有打鼾的人;④在100个心脏病患者中可能一个打鼾的人也没有.课前基础巩固④对于①,题设中没有给出吸烟与打鼾的相关性判断,故①错误;对于②,独立性检验是对分类变量是否相关的判断,不能具体到个体,故②错误.故填④.7.为了判断两个分类变量X和Y是否有关系,应用独立性检验法算得χ2=5.003,依据α=0.05的独立性检验,认为X和Y
关系(填“有”或“无”),该推断犯错误的概率不超过
.
课前基础巩固有α0.10.050.010.0050.001xe2.7063.8416.6357.87910.8280.05[解析]
因为χ2=5.003≥3.841=x0.05,所以认为X和Y有关系,该推断犯错误的概率不超过0.05.例1
(1)(多选题)2021年5月18日,《佛山市第七次全国人口普查公报》发布,公报显示,佛山市常住人口为9498863人.为了进一步分析数据特征,某数学兴趣小组先将近五次人口普查数据作出散点图(横坐标为人口普查的序号,第三次普查记为1,…,第七次普查记为5,纵坐标为当次人口普查佛山市的人口数),再利用不同的函数模型作回归分析,如图,以下说法正确的是 (
)课堂考点探究探究点一成对数据的统计相关性ACA.佛山市的人口数与普查序号正相关B.散点的分布呈现出很弱的线性相关特征C.模型2的拟合效果更好D.应用经验回归方程1可以预测第八次人口普查时佛山市人口会超过1400万课堂考点探究[思路点拨]
散点图中样本点的分布特点揭示了正负相关性及相关性的强弱,决定系数越大,模型拟合效果越好;[解析]对于A,散点图中的点的分布从左下方至右上方,所以人口数与普查序号正相关,故A正确;A.佛山市的人口数与普查序号正相关B.散点的分布呈现出很弱的线性相关特征C.模型2的拟合效果更好D.应用经验回归方程1可以预测第八次人口普查时佛山市人口会超过1400万课堂考点探究
对于C,因为0.9793>0.9728,所以模型2的拟合效果更好,故C正确;(2)[2021·河北衡水中学调研]有一散点图如图所示,在5个样本点中去掉点D(3,10)后,下列说法正确的是 (
)A.残差平方和变小B.相关系数r变小C.决定系数R2变小D.解释变量x与响应变量y的相关性变弱课堂考点探究A[思路点拨]
去掉点D,变量x与变量y的线性相关性变强.[解析]从散点图可分析得出,只有点D偏离直线较远,去掉点D后,变量x与变量y的线性相关性变强,相关系数变大,残差平方和变小,决定系数变大,故选A.[总结反思]对两个变量的相关关系的判断有两个方法:1.根据散点图进行判断,具有很强的直观性,直接得出两个变量是正相关或负相关,拟合效果的好坏也可由散点图直接判断;2.计算相关系数法,相关系数能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强.课堂考点探究变式题
(1)[2021·河北邢台模拟]已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=-0.957,则 (
)A.变量X与Y正相关,且X与Y之间的相关性强于U与V之间的相关性B.变量X与Y负相关,且X与Y之间的相关性强于U与V之间的相关性C.变量U与V负相关,且X与Y之间的相关性弱于U与V之间的相关性D.变量U与V正相关,且X与Y之间的相关性弱于U与V之间的相关性课堂考点探究C[解析]因为r1=0.837,r2=-0.957,所以变量X与Y正相关,变量U与V负相关,且X与Y之间的相关性弱于U与V之间的相关性.故选C.
课堂考点探究D[解析]由散点图得x与y负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下的数据线性相关性更强,所以-1<r2<r1<0.故选D.角度1
线性回归模型例2
(1)某南方农业研究所对冬季昼夜温差(最高温度与最低温度的差)大小与新型豌豆品种一天内发芽数之间的关系进行了分析研究,他们分别记录了11月1日~6日每天昼夜最高、最低的温度(如图甲),以及实验室每天每100颗种子中的发芽数情况(如图乙).请画出发芽数y与温差x的散点图,并用相关系数说明发芽数y与温差x之间的相关关系.课堂考点探究探究点二一元回归模型
课堂考点探究[思路点拨]
利用相关系数公式求出相关系数,相关系数的绝对值越大,相关性越强.
课堂考点探究(2)[2021·荆州模拟]随着电商事业的快速发展,网络购物交易额也快速提升,某网上交易平台工作人员把从2015年至2021年的总交易额(取近似值),进行统计分析如下表:课堂考点探究年份2015201620172018201920202021年份代码(t)1234567总交易额y(单位:百亿)5.79.112.116.821.326.837①通过分析,发现可用线性回归模型拟合总交易额y与年份代码t的关系,请用相关系数加以说明;[思路点拨]
利用公式求出相关系数,可知总交易额y与年份代码t的线性相关性很强;
课堂考点探究
课堂考点探究
课堂考点探究
课堂考点探究
课堂考点探究月份12345违章驾驶人数1201051009085
课堂考点探究月份12345违章驾驶人数1201051009085
课堂考点探究月份12345违章驾驶人数1201051009085
课堂考点探究B
课堂考点探究
课堂考点探究
课堂考点探究②由题意,物流城第10年的年经济净效益为2ln0.25+5=5-4ln2(亿元).由①知湿地公园第10年的投入约为0.03×62+0.006=1.086(亿元),这一年的经济净效益约为1.086+3=4.086(亿元).因为4.086>5-4ln2,所以这一年湿地公园产生的年经济净效益高.课堂考点探究
课堂考点探究
课堂考点探究变式题
已知某种细菌的适宜生长温度为12℃~27℃,为了研究该种细菌的繁殖数量y(单位:个)随温度x(单位:℃)的变化规律,收集数据如下:课堂考点探究温度x/℃14161820222426繁殖数量y/个2530385066120218对数据进行初步处理后,得到了一些统计量的值,如表所示:20784.1112157419.6其中k=lny.
课堂考点探究
(2)根据(1)中判断结果及表格数据,建立y关于x的经验回归方程(结果精确到0.001);课堂考点探究
课堂考点探究
例4
[2022·沈阳模拟]代驾就是当车主不能自行开车到达目的地时,由专业驾驶人员驾驶车主的车将其送至指定地点并收取一定费用的行为.某互联网代驾平台为了分析客户的需求,以便于更好的服务广大客户,随机调查了1000名代驾司机的客户满意程度,得到如下2×2列联表:课堂考点探究探究点三独立性检验驾龄满意程度合计非常满意基本满意5~10年300x
10年以上yz
合计
其中x∶y∶z=1∶4∶2.(1)求x,y,z的值.课堂考点探究[思路点拨]
根据2×2列联表的含义求x,y,z;解:由题意有y=4x,z=2x,x+y+z=1000-300,可得x=100,y=400,z=200.(2)分别估计客户对“驾龄5~10年”和“驾龄10年以上”的代驾司机服务基本满意的概率.课堂考点探究
课堂考点探究α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[思路点拨]
根据2×2列联表和公式计算χ2的值,再结合临界值表,作出判断.解:2×2列联表如下:驾龄满意程度合计非常满意基本满意5~10年30010040010年以上400200600合计7003001000单位:人
课堂考点探究α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
[总结反思]独立性检验的一般步骤:第一步,提出零假设H0:两个分类变量A和B没有关系;第二步,根据2×2列联表和公式计算χ2的值;第三步,查对临界值表,作出判断.课堂考点探究变式题
(1)某校为了了解学生性别与对篮球运动的态度(喜欢或不喜欢),随机抽取部分同学进行了一次调查,其中被调查的男生和女生人数相同,得到如图所示的等高堆积条形图,则可以判定性别与对篮球运动的态度
(“有”或“没有”)关联.
课堂考点探究有[解析]
由等高堆积条形图可以看出,喜欢篮球运动的男生比例比喜欢篮球运动的女生比例大很多,可以判定性别与对篮球运动的态度有关联.(2)[2021·武汉模拟]研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展,行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到图所示的统计图表.课堂考点探究①估算该市电动自行车骑乘人员的平均年龄.②完成下列2×2列联表,根据小概率值α=0.01的独立性检验,能否认为是否佩戴安全头盔与年龄有关联?单位:人课堂考点探究是否佩戴头盔年龄合计[20,40)[40,70]是
否
合计
α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
课堂考点探究单位:人是否佩戴头盔年龄合计[20,40)[40,70]是540340880否6060120合计6004001000【备选理由】例1是线性回归分析;例2、例3是非线性回归分析;例4是独立性检验.备用习题例1[配例2使用][2021·江苏泰州模拟]新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商、网络直播、职业创作者等,下表是2021年1月份至4月份某市新增微商电商的统计数据:备用习题月份1234新增微商电商个数90105125140
备用习题月份1234新增微商电商个数90105125140
备用习题
备用习题
备用习题x2122232425y68.56867.56668回归模型模型①模型②经验回归方程182.479.2
备用习题回归模型模型①模型②经验回归方程182.479.2
备用习题
备用习题例3
[配例3使用][2021·辽宁葫芦岛模拟]根据党的“扶贫同扶志、扶智相结合”精准扶贫、精准脱贫政策,中国儿童少年基金会为了丰富留守儿童的课余文化生活,培养良好的阅读习惯,在农村留守儿童聚居地区捐建“小候鸟爱心图书角”.某村在寒假和暑假组织开展小候鸟爱心图书角读书活动,号召全村少年儿童积极读书,养成良好的阅读习惯,下表是近5年该村庄100位少年儿童的假期周人均读书时间的统计:备用习题年份20162017201820192020年份代码x12345每周人均读书时间y(小时)1.32.85.78.913.8
备用习题
备用习题
备用习题例4
[配例4使用]为更好地落实农民工工资保证金制度,某市劳动保障部门调查了该市100名农民工(其中技术工、非技术工各50名)的月工资(单位:百元),得到这100名农民工月工资的中位数为39百元(这100名农民工的月工资均在[25,55]内)且月工资在[45,50]内的人数为15,并根据调查结果画出如图所示的频率分布直方图.(1)求m,n的值.(2)已知这100名农民工中月工资高于平均数的技术工有31名,非技术工有19名,则能否在犯错误的概率不超过0.001的前提下认为是不是技术工与月工资是否高于平均数有关联?备用习题
备用习题
备用习题工资工种合计技术工非技术工月工资不高于平均数193150月工资高于平均数311950合计5050100单位:人基础热身
C
1234567891011121314
D1234567891011121314
12345678910111213143.[2021·佛山模拟]
某校学生会为了调查学生是否关注2022年北京冬奥会是否与性别有关,抽样调查了100人,得到如下数据.(单位:人)性别是否关注合计不关注关注男生301545女生451055合计75251001234567891011121314
A
1234567891011121314
B
1234567891011121314
性别选修科类合计理科文科男131023女72027合计203050
1234567891011121314单位:人
1234567891011121314
1234567891011121314综合提升
图K54-1D1234567891011121314
1234567891011121314
B1234567891011121314
1234567891011121314
图K54-2AC1234567891011121314
1234567891011121314
1234567891011121314单位:人是否喜欢登山性别合计男女喜欢不喜欢合计1234567891011121314
1234567891011121314
图K54-31234567891011121314
1234567891011121314
ABD1234567891011121314
123456789101112131411.[2021·福建永泰模拟]
某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.得到数据如下表:10203040505365717685
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养殖合作协议合同范本
- 加工及测试合同范本
- 2025年锡林郭勒盟c1货运从业资格证模拟考试题
- 东莞物业服务合同范本
- 六座车买卖合同范本
- 买卖货款利息合同范本
- 劳动关系托管合同范本
- 劳务服务费合同范本
- 万瑞地产合同范本
- 办公商品采购合同范本
- 2024-2025学年第二学期开学典礼-开学典礼校长致辞
- 蚌埠介绍-蚌埠简介课件(经典版)
- GB/T 15561-2024数字指示轨道衡
- 探究烟花爆竹知识产权-洞察分析
- 网络保险风险评估-洞察分析
- 呼吸机湿化的护理
- 2025-2030年中国旅居康养行业全国市场开拓战略制定与实施研究报告
- 2024“五史”全文课件
- 食品检验员聘用合同样本
- 六年级信息技术下册教学计划
- 2025年九年级数学中考复习计划
评论
0/150
提交评论