专题8-6独立性检验与回归方程14类题型(原卷版)_第1页
专题8-6独立性检验与回归方程14类题型(原卷版)_第2页
专题8-6独立性检验与回归方程14类题型(原卷版)_第3页
专题8-6独立性检验与回归方程14类题型(原卷版)_第4页
专题8-6独立性检验与回归方程14类题型(原卷版)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题86独立性检验与回归方程14类题型TOC\o"13"\n\h\z\u题型一独立性检验题型二独立性检验与超几何分布题型三独立性检验与二项式分布题型四独立性检验与正态分布题型五样本中心的计算及应用题型六相关系数的计算题型七求线性回归直线方程(结合相关系数与二项式分布,超几何分布,正态分布)题型八残差分析题型九相关指数题型十求非线性回归方程:幂函数方程拟合题型十一求非线性回归方程:指数函数方程拟合题型十二求非线性回归方程:对数函数方程拟合题型十三回归方程与独立性检验题型十四相关系数与独立性检验独立性检验独立性检验的基本步骤

(1)提出零假设:X和Y相互独立(即X和Y无关)

(2)根据联表给出的数据算出(其中),得到随机变量,并与临界值xα比较.

(3)根据实际问题需要的可信程度(小概率值α)确定临界值“X与Y有关系”,这种推断犯错误的概率不超过,即成立;否则就说没有的把握认为“X与Y有关系”,即不成立.(4)下表给出了产独立性检验中几个常用的小概率值和相应的临界值0.10.050.010.0050.0012.7063.8416.6357.87910.828(5)临界值统计量也可以用来作相关性的度量,越小说明变量之间越独立,越大说明变量之间越相关.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,这个临界值就可作为判断大小的标准.线性回归方程解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.最小二乘法将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估计,其中,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).回归模型的处理方法幂函数型:(n为常数,a,x,y均取正值),两边取常用对数,即,令,,原方程变为,然后按线型回归模型求出,.指数函数方程:1.直接设指数求解;2.取对数化简,再设对数求解对数函数方程:1.直接设对数求解;2.对指数型取对数残差与残差分析(1)残差对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq\o(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.(2)残差分析残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为0,方差为σ2的随机变量的观测值(3)残差计算思路∶先求出回归方程y=bx+a(b,a直接套公式即可),然后把表格中每一个x值通过方程算出对应的每一个y值,最后与表格中的y值对应相减即可。数据点和它在回归直线上相应位置的差异yi-yi是随机误差的效应,称ei=yi-残差计算公式∶实际观察值与估计值(拟合值)之间的差(4)残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(5)残差平方和法残差平方和越小,模型的拟合效果越好.(6)R2在回归分析中,可以用来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.模型的拟合效果用相关指数来表示,,表达式中,与经验回归方程无关,残差平方和与经验回归方程有关,因此,越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差注:决定系数与相关系数的联系与区别①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果.②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为.③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好.重点题型·归类精重点题型·归类精练题型一独立性检验某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验.经计算,则所得到的统计学结论是:有(

)的把握认为“学生性别与支持该活动有系”.0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828A. B. C. D.足球运动是深受学生喜爱的一项体育运动,为了研究是否喜爱足球运动与学生性别的关系,从某高校男女生中各随机抽取80名学生进行调查问卷,得到如下数据():喜爱不喜爱男生女生若有90%以上的把握认为是否喜爱足球运动与学生性别有关,则m的最小值为(

)附:.其中.0.250.100.050.001k2.0722.7063.8416.635A.17 B.15 C.13 D.11“村BA”后,贵州“村超”又火出圈!所谓“村超”,其实是目前火爆全网的贵州乡村体育赛事一一榕江(三宝侗寨)和美乡村足球超级联赛,被大家简称为“村超”.“村超”的民族风、乡土味、欢乐感,让每个人尽情享受着足球带来的快乐.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各50名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生20女生15合计100附:χ2α0.10.050.010.0050.001x2.7063.8416.6357.87910.828(1)根据所给数据完成上表,依据α=0.005的独立性检验,能否有99.5%(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范定点射门.据统计,这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人进球相互独立,求3人进球总次数X题型二独立性检验与超几何分布民族要复兴,乡村要振兴,合作社助力乡村产业振兴,农民专业合作社已成为新型农业经营主体和现代农业建设的中坚力量,为实施乡村振兴战略作出了巨大的贡献.已知某主要从事手工编织品的农民专业合作社共有100名编织工人,该农民专业合作社为了鼓励工人,决定对“编织巧手”进行奖励,为研究“编织巧手”是否与年龄有关,现从所有编织工人中抽取40周岁以上(含40周岁)的工人24名,40周岁以下的工人16名,得到的数据如表所示.“编织巧手”非“编织巧手”总计年龄≥40岁19__________年龄<40岁_____10_____总计__________40(1)请完成答题卡上的2×2列联表,并根据小概率值α=0.010的独立性检验,分析“编织巧手”与“年龄”是否有关;(2)为进一步提高编织效率,培养更多的“编织巧手”,该农民专业合作社决定从上表中的非“编织巧手”的工人中采用分层抽样的方法抽取6人参加技能培训,再从这6人中随机抽取2人分享心得,求这2人中恰有1人的年龄在40周岁以下的概率.参考公式:,其中.参考数据:α0.1000.0500.0100.005xα2.7063.8416.6357.8792023年实行新课标新高考改革的省市共有29个,选科分类是高级中学在校学生生涯规划的重要课题,某高级中学为了解学生选科分类是否与性别有关,在该校随机抽取100名学生进行调查.统计整理数据得到如下的2×2列联表:选物理类选历史类合计男生3515女生2525合计100(1)依据小概率值α=0.05的独立性检验,能否据此推断选科分类与性别有关联?(2)在以上随机抽取的女生中,按不同选择类别同比例分层抽样,共抽取6名女生进行问卷调查,然后在被抽取的6名女生中再随机抽取4名女生进行面对面访谈.设面对面访谈的女生中选择历史类的人数为随机变量X,求随机变量X的分布列和数学期望.附:χ2=nα0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.8282023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件A=“了解亚运会项目”,B=“学生为女生”,据统计PAB=附:χ2=nα0.0500.0100.001x3.8416.63510.828(1)根据已知条件,填写下列2×2列联表,并依据α=0.001的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关?了解不了解合计男生女生合计(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为X,求X的分布列和数学期望.杭州第19届亚运会又称“2022年杭州亚运会”,是继1990年北京亚运会、2010年广州亚运会之后,中国第三次举办亚洲最高规格的国际综合性体育赛事.某高校部分学生十分关注杭州亚运会,若将累计关注杭州亚运会赛事消息50次及以上的学生称为“亚运会达人”,未达到50次的学生称为“非亚运会达人”.现从该校随机抽取100名学生,得到数据如表所示:亚运会达人非亚运会达人合计男生4056女生24合计(1)补全列联表,并判断能否有99%的把握认为是否为“亚运会达人”与性别有关?(2)现从样本的“亚运会达人”中按性别采用分层抽样的方法抽取6人,然后从这6人中随机抽取3人,记这3人中女生的人数为X,求X的分布列和数学期望.附:,.0.0500.0100.005k3.8416.6357.879题型三独立性检验与二项式分布2023年9月23日第19届亚运会在中国杭州举行,其中电子竞技第一次列为正式比赛项目.某中学对该校男女学生是否喜欢电子竞技进行了调查,随机调查了男女生人数各200人,得到如下数据:男生女生合计喜欢120100220不喜欢80100180合计200200400(1)根据表中数据,采用小概率值的独立性检验,能否认为该校学生对电子竞技的喜欢情况与性别有关?(2)为弄清学生不喜欢电子竞技的原因,采用分层抽样的方法从调查的不喜欢电子竞技的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,求“至少抽到一名男生”的概率;(3)将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对电子竞技喜欢的人数为,求的数学期望.参考公式及数据:,其中.0.150.100.050.0250.012.0722.7063.8415.0246.635为学习贯彻中央农村工作会议精神“强国必先强农,农强方能国强”,某市在某村积极开展香菇种植,助力乡村振兴.香菇的生产可能受场地、基料、水分、菌种等因素的影响,现已知香菇有菌种甲和菌种乙两个品种供挑选,菌种甲在温度时产量为28吨/亩,在温度30℃时产量为20吨/亩;菌种乙在温度20℃时产量为22吨/亩,在气温时产量为30吨/亩.(1)请补充完整2×2列联表,根据2×2列联表和小概率值的独立性检验,判断菌种甲、乙的产量与温度是否有关?合计菌种甲菌种乙合计(2)某村选择菌种甲种植,已知菌种甲在气温为时的发芽率为,从菌种甲中任选3个,若设为菌种甲发芽的个数,求的分布列及数学期望.附:参考公式:,其中.临界值表:0.100.050.012.7063.8416.635某市某部门为了了解全市中学生的视力情况,采用比例分配的分层随机抽样方法抽取了该市120名中学生,已知该市中学生男女人数比例为7:5,他们的视力情况统计结果如表所示:性别视力情况合计近视不近视男生30女生40合计120(1)请把表格补充完整,并根据小概率值α=0.01的独立性检验,判断近视是否与性别有关;(2)如果用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的概率,且每名同学是否近视相互独立.现从该市中学生中任选4人,设随机变量X表示4人中近视的人数,求X的分布列及均值.附:χ2=nad-bcα0.10.050.01xα2.7063.8416.635sinαcosβ=12sinα+β+sinα-β,cosαsinβ=12sinα+β-sin合格不合格合计高三年级的学生54高一年级的学生16合计100(1)请完成2×2列联表,依据小概率值α=0.001的独立性检验,分析“对公式的掌握情况”与“学生所在年级”是否有关?(2)以频率估计概率,从该校高一年级学生中抽取3名学生,记合格的人数为X,求X的分布列和数学期望.附:χ2=α0.1000.0500.0100.001x2.7063.8416.63510.828随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人):经常网购偶尔或不用网购合计男性45100女性65100合计(1)完成如表;对于以上数据,采用小概率值α=0.01的独立性检验,能否认为我市市民网购与性别有关联?(2)①现从所抽取的女市民中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取20人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.参考公式:χ2α0.1500.1000.0500.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828某中医研究所研制了一种治疗A疾病的中药,为了解其对A疾病的作用,要进行双盲实验.把60名患有A疾病的志愿者随机平均分成两组,甲组正常使用这种中药,乙组用安慰剂代替中药,全部疗期后,统计甲、乙两组的康复人数分别为20和5.(1)根据所给数据,完成下面2×2列联表,并判断是否有99.9%的把握认为使用这种中药与A康复未康复合计甲组2030乙组530合计(2)若将乙组未用药(用安慰剂代替中药)而康复的频率视为这种疾病的自愈概率,现从患有A疾病的人群中随机抽取3人,记其中能自愈的人数为X,求X的分布列和数学期望.附表:α0.1000.050.010.0050.001x2.7063.8416.6357.87910.828附:χ2=n注:双盲实验:是指在实验过程中,测验者与被测验者都不知道被测者所属的组别,(实验组或对照组),分析者在分析资料时,通常也不知道正在分析的资料属于哪一组.旨在消除可能出现在实验者和参与者意识当中的主观偏差和介入偏好.安慰剂:是指没有药物治疗作用,外形与真药相像的片、丸、针剂.某企业生产的产品按质量分为一等品和二等品,该企业计划对现有生产设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取200件产品作为样本,产品的质量情况统计如下表:一等品二等品合计设备改造前12080200设备改造后15050200合计270130400附:(1)判断能否在犯错误的概率不超过的前提下,认为该企业生产的这种产品的质量与设备改造有关;(2)按照分层抽样的方法,从设备改造前的产品中取得了5件产品,其中有3件一等品和2件二等品.现从这5件产品中任选3件,记所选的一等品件数为,求的分布列及均值;(3)根据市场调查,企业每生产一件一等品可获利100元,每生产一件二等品可获利60元,在设备改造后,用先前所取的200个样本的频率估计总体的概率,记生产1000件产品企业所获得的总利润为,求的均值.题型四独立性检验与正态分布新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是50岁以上人群,该病毒进入人体后有潜伏期.潜伏期是指病原体侵入人体至最早出现临床症状的这段时间,潜伏期越长,感染到他人的可能性越高,现对400个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.2,方差为,如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,50岁以上人数占70%,长期潜伏人数占25%,其中50岁以上长期潜伏者有60人.(1)请根据以上数据完成列联表,并根据小概率的独立性检验,是否可以认为“长期潜伏”与年龄有关;单位:人50岁以下(含50岁)50岁以上总计长期潜伏非长期潜伏总计(2)假设潜伏期X服从正态分布,其中近似为样本平均数,近似为样本方差,现在很多省市对入境旅客一律要求隔离14天,请结合原则通过计算概率解释其合理性.附:,其中.0.10.050.0102.7063.8416.635若,,,.某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,数据如下:单位:人男生女生合计同意7050120不同意305080合计100100200(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?(2)现有足球、篮球、跳绳供学生选择.①若甲、乙两名学生从这三项运动中随机选一种,且他们的选择情况相互独立互不影响.已知在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件B为“甲、乙两名学生的选择不同”,判断事件、是否独立,并说明理由.②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数增加10,该校有1000名学生,预估经过训练后该校每分钟跳182个以上人数(结果四舍五入到整数).参考公式和数据:,其中;0.0250.0100.0055.0246.6357.879若,则,,.为调查学生数学建模能力的总体水平,某地区组织10000名学生(其中男生4000名,女生6000名)参加数学建模能力竞赛活动.(1)若将成绩在70,85的学生定义为“有潜力的学生”,经统计,男生中有潜力的学生有2500名,女生中有潜力的学生有3500名,完成下面的2×2列联表,并判断是否有99.9%的把握认为学生是否有潜力与性别有关?是否有潜力性别合计男生女生有潜力没有潜力合计(2)经统计,男生成绩的均值为80,方差为49,女生成绩的均值为75,方差为64.(ⅰ)求全体参赛学生成绩的均值μ及方差σ2(ⅱ)若参赛学生的成绩X服从正态分布Nμ,σ2,试估计成绩在参考数据:①P0.10.050.010.0050.001k2.7063.8416.6357.87910.828②若X∼Nμ,σ2,则Pμ-σ≤X≤μ+σ=0.6827参考公式:K2=n某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:天数[0,5](5,10](10,15](15,20](20,25](25,30]人数4153331116(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布Nμ,σ2,其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:性别活动天数合计[0,15](15,30]男生女生合计并依据小概率值α=0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.附:参考数据:Pμ-σ≤X≤μ+σ=0.6827;Pμ-2σ≤X≤μ+2σ=0.9545α0.10.050.010.0050.001x2.7063.8416.6357.87910.828题型五样本中心的计算及应用如果记录了,的几组数据分别为,,,,那么y关于x的经验回归直线必过点(

)A. B. C. D.下列说法中正确的有(填正确说法的序号).①回归直线恒过点,且至少过一个样本点;②若样本数据的方差为4,则数据的标准差为4;③已知随机变量,且,则;④若线性相关系数越接近1,则两个变量的线性相关性越弱;⑤是用来判断两个分类变量是否相关的随机变量,当的值很小时可以推断两个变量不相关.已知两个变量和之间存在线性相关关系,某兴趣小组收集了一组,的样本数据如下表所示:123450.50.611.41.5根据表中数据利用最小二乘法得到的回归方程是(

)A. B.C. D.已知变量x和y的统计数据如表:x12345y55668根据上表可得回归直线方程,据此可以预测当时,(

).A.9.2 B.9.5 C.9.9 D.10.1近年来,“考研热”持续升温,2022年考研报考人数官方公布数据为457万,相比于2021年增长了80万之多,增长率达到21%以上.考研人数急剧攀升原因较多,其中,本科毕业生人数增多、在职人士考研比例增大,是两大主要因素.据统计,某市各大高校近几年的考研报考总人数如下表:年份20182019202020212022年份序号x12345报考人数y(万人)1.11.622.5m根据表中数据,可求得y关于x的线性回归方程为,则m的值为___________.(多选)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):x12345y0.50.811.21.5假设经验回归方程为,则(

)A.B.当时,y的预测值为2.2C.样本数据y的40%分位数为0.8D.去掉样本点后,x与y的样本相关系数r不变题型六相关系数的计算(多选)对于样本相关系数,下列说法正确的是(

)A.的取值范围是B.越大,相关程度越弱C.越接近于0,成对样本数据的线性相关程度越强D.越接近于1,成对样本数据的线性相关程度越强(多选)已知关于变量x,y的4组数据如表所示:x681012ya1064根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则(

)A. B.变量x,y正相关 C. D.题型七求线性回归直线方程(结合相关系数与二项式分布,超几何分布,正态分布)近年来,“直播带货”成为一种常见的销售方式,某果农2018年至2022年通过直播销售水果的年利润(单位:万元)如表所示:年份20182019202020212022年份代码t12345年利润/万元2.42.74.16.47.9(1)由表中的数据判断,能否用线性回归模型拟合与的关系?请用相关系数加以说明(精确到0.01);(2)建立关于的线性回归方程,并预测2025年该果农通过直播销售水果的利润.参考数据:,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.比亚迪,这个在中国乘用车市场嶡露头角的中国品牌,如今已经在全球汽车品牌销量前十中占据一席之地.这一成就不仅是比亚迪的里程硨,更是中国新能源汽车行业的里程碑,标志着中国已经在全球范围内成为了新能源汽车领域的强国.比亚迪旗下的宋plus自2020年9月上市以来,在SUV车型中的月销量遥遥领先,现统计了自上市以来截止到2023年8月的宋plus的月销量数据.(1)通过调查研究发现,其他新能源汽车的崛起、购置税减免政策的颁布等,影响了汽车的月销量,现将残差过大的数据剔除掉,得到2022年8月至2023年8月部分月份月销量(单位:万辆)和月份编号的成对样本数据统计.月份2022.82022.92022.122023.12023.22023.32023.42023.62023.7202.8月份编号12345678910月销量(单位:万辆)4.254.594.993.53.783.012.462.723.023.28请用样本相关系数说明与之间的关系可否用一元线性回归模型拟合?若能,求出关于的经验回归方程;若不能,请说明理由.(运算过程及结果均精确到0.01)(若,则线性相关程度很高,可用一元线性回归模型拟合)(2)为庆祝2023年“双节”(中秋节和国庆节),某地店特推出抽奖优惠活动,奖项共设一、二、三等奖三个奖项,其中一等奖、二等奖、三等奖分别奖励1万元、5千元、2千元,抽中一等奖、二等奖、三等奖的概率分别为.现有甲、乙两人参加了抽奖活动(每人只有一次抽奖机会),假设他们是否中奖相互独立,求两人所获奖金总额超过1万元的概率.参考公式:样本相关系数,.参考数据:,.已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.参考数据:,,,.参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为,.某骑行爱好者近段时间在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分与对应用时(单位:小时)如下表:身体综合指标评分()12345用时(/小时)108.5876.5(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数如以说明;(2)建立关于的回归方程.参考数据和参考公式:相关系数,,,.火车晚点是人们在旅行过程中最常见的问题之一,针对这个问题,许多人都会打进行投诉.某市火车站为了解每年火车的正点率对每年顾客投诉次数(单位:次)的影响,对近8年(2015年~2022年)每年火车正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.60059243837.293.8(1)求关于的经验回归方程;若预计2024年火车的正点率为,试估算2024年顾客对火车站投诉的次数;(2)根据顾客对火车站投诉的次数等标准,该火车站这8年中有6年被评为“优秀”,2年为“良好”,若从这8年中随机抽取3年,记其中评价“良好”的年数为,求的分布列和数学期望.附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:,直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货销售金额稳步提升,以下是该公司2023年前6个月的带货金额:月份123456带货金额万元25435445495416542054(1)根据统计表中的数据,计算变量与的样本相关系数,并判断两个变量与的相关程度(若,则认为相关程度较强;否则没有较强的相关程度,精确到0.01);(2)若与的相关关系拟用线性回归模型表示,试求关于的经验回归方程,并据此预测2023年10月份该公司的直播带货金额(精确到整数).附:经验回归方程,其中,样本相关系数;参考数据:.为助力四川新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x(元/件)88.28.48.68.89销量y(万件)908483807568(1)根据以上数据,求y关于x的线性回归方程;(2)若该产品成本是4元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?(参考公式:回归方程,其中,).人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:(1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);(2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).附:线性回归方程y=bx+相关系数r=i=1参考数据:i=16网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数yi和时间第xx12345y75849398100由表中给出的数据是否可用线性回归模型拟合人数y与时间x之间的关系?若可用,估计8月10日到该专营店购物的人数(人数用四舍五入法取整数;若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合,计算r时精确到0.01).参考数据:4340≈65.88.附:相关系数r=i=1nxi题型八残差分析已知变量x和y的统计数据如下表:x678910y3.5455.57如果由表中数据可得经验回归直线方程为,那么,当时,残差为______.(注:残差=观测值预测值)已知回归方程,而试验中的一组数据是,,,则其残差平方和是______.经验表明,树高与胸径具有线性关系,为了解回归方程的拟合效果,利用下列数据计算残差,用来绘制残差图.胸径x/cm18.219.122.324.526.2树高的观测值y/m18.919.420.822.824.8树高的预测值18.619.321.523.024.4则残差的最大值和最小值分别是(

)A.0.4,1.8 B.1.8,0.4 C.0.4,0.7 D.0.7,0.4某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:x3456y235根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为,则表中m的值为__________.(多选)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样本点数据,则下列结论正确的是(

)A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心C.若以模型拟合该组数据,为了求出回归方程,设,将其变换后得到线性方程,则a,h的估计值分别是3和6D.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好题型九相关指数关于线性回归的描述,下列命题错误的是(

)A.回归直线一定经过样本点的中心 B.残差平方和越小,拟合效果越好C.决定系数越接近1,拟合效果越好 D.残差平方和越小,决定系数越小(多选)进入21世纪以来,全球二氧化碳排放量增长迅速,自2000年至今,全球二氧化碳排放量增加了约40%,我国作为发展中国家,经济发展仍需要大量的煤炭能源消耗.下图是2016—2020年中国二氧化碳排放量的统计图表(以2016年为第1年).利用图表中数据计算可得,采用某非线性回归模型拟合时,;采用一元线性回归模型拟合时,线性回归方程为,.则下列说法正确的是(

)A.由图表可知,二氧化碳排放量y与时间x正相关B.由决定系数可以看出,线性回归模型的拟合程度更好C.利用线性回归方程计算2019年所对应的样本点的残差为0.30D.利用线性回归方程预计2025年中国二氧化碳排放量为107.24亿吨某种农作物可以生长在滩涂和盐碱地,它的灌溉是将海水稀释后进行灌溉.某实验基地为了研究海水浓度(%)对亩产量(吨)的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.海水浓度(%)34567亩产量(吨)0.570.530.440.360.30残差0.010.02mn0绘制散点图发现,可以用线性回归模型拟合亩产量(吨)与海水浓度(%)之间的相关关系,用最小二乘法计算得与之间的线性回归方程为.(1)求的值;(参考公式:)(2)统计学中常用相关指数来刻画回归效果,越大,回归效果越好,如假设,就说明预报变量的差异有是解释变量引起的.请计算相关指数(精确到0.01),并指出亩产量的变化多大程度上是由灌溉海水浓度引起的?附残差相关指数其中题型十求非线性回归方程:幂函数方程拟合为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:752.2582.54.512028.35表中,.(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.某县依托种植特色农产品,推进产业园区建设,致富一方百姓.已知该县近年人均可支配收入如下表所示,记年为,年为,…以此类推.年份年份代号人均可支配收入(万元)(1)使用两种模型:①;②的相关指数分别约为,,请选择一个拟合效果更好的模型,并说明理由;(2)根据(1)中选择的模型,试建立关于的回归方程.(保留位小数)附:回归方程中斜率和截距的最小二乘估计公式分别为,.参考数据:,令,.为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y(单位:gm3)与样本对原点的距离x(单位:m)的数据,并作了初步处理,得到了下面的一些统计理的值.(表中uixyui=1i=1i=1i=1i=1697.900.21600.1414.1226.13-1.40(1)利用样本相关系数的知识,判断y=a+bx与y=c+dx哪一个更适宜作为平均金属含量y关于样本对原点的距离(2)根据(1)的结果回答下列问题:①建立y关于x的回归方程;②样本对原点的距离x=20时,金属含量的预报值是多少?附:对于一组数据t1,s1,t2,s数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.参考数据t=1i=1ti=117500.370.55参考公式:对于一组数据(u1,v1),(1)赛前小明进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:x(天)1234567y(秒/题)910800600440300240210现用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程;((2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为23,且各局之间相互独立,设比赛X局后结束,求随机变量X在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布N(0.54,0.022(1)假设生产条件正常,记X表示化肥的有效利用率,求P(X≥0.56);(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为x(单位:公斤),粮食亩产量为y(单位:百公斤)参考数据:i=1i=1i=1i=1i=1i=1i=1i=165091.552.51478.630.5151546.5ti=lnxi,zi=lny(i)根据散点图判断,y=a+bx与y=cxd,哪一个适宜作为该农作物亩产量y关于每亩化肥施用量(ii)根据(i)的判断结果及表中数据,建立y关于x的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量y的值.(附:①对于一组数据(ui,vi)(i=1,2,3,…,n),其回归直线②若随机变量X∼N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6827题型十一求非线性回归方程:指数函数方程拟合从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:x2023252730z22.4334.6由上表可得经验回归方程,则当x=35时,蝗虫的产卵量y的估计值为(

)A. B. C.8 D.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额和年盈利额数据进行分析,建立了两个函数模型:;,其中、、、均为常数,为自然对数的底数,令,,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立关于的回归方程.(系数精确到0.01)附:相关系数回归直线中:,.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,⋯,10)数据进行分析,建立了两个函数模型:y=α+βx2;y=eλx+t,其中α、β、λ、txyuvi=1i=1i=1i=1i=1i=1(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立y关于x的回归方程.(系数精确到0.01)附:相关系数r=回归直线y=bx+a中:近三年的新冠肺炎疫情对我们的生活产生了很大的影响,当然也影响着我们的旅游习惯,乡村游、近郊游、周边游热闹了许多,甚至出现“微度假”的概念.在国家有条不紊的防疫政策下,旅游又重新回到了老百姓的日常生活中.某乡村抓住机遇,依托良好的生态环境、厚重的民族文化,开展乡村旅游.通过文旅度假项目考察,该村推出了多款套票文旅产品,得到消费者的积极回应.该村推出了六条乡村旅游经典线路,对应六款不同价位的旅游套票,相应的价格x与购买人数y的数据如下表.旅游线路奇山秀水游古村落游慢生活游亲子游采摘游舌尖之旅套票型号ABCDEF价格x/元394958677786经数据分析、描点绘图,发现价格x与购买人数y近似满足关系式y=axba>0,b>0,即lny=blnx+lnaa>0,b>0,对上述数据进行初步处理,其中vi=附:①可能用到的数据:i=16viwi=75.3,②对于一组数据v1,w2,v2,w2,…,(1)根据所给数据,求y关于x的回归方程.(2)按照相关部门的指标测定,当套票价格x∈49,81时,该套票受消费者的欢迎程度更高,可以被认定为“热门套票”.现有三位游客,每人从以上六款套票中购买一款旅游,购买任意一款的可能性相等.若三人买的套票各不相同,记三人中购买“热门套票”的人数为X,求随机变量X当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:年份201720182019202020212022编号x123456企业总数量y(单位:百个)5078124121137352(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“参考数据:i=16u参考公式:对于一组数据xi,yi题型十二求非线性回归方程:对数函数方程拟合为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场,得到天数与直播间人数的数据如下表所示:日期第一天第二天第三天第四天第五天第六天第七天日期代码x1234567直播间人数y(万人)4122123252728(1)求直播间人数y和与日期代码x的样本相关系数(精确到0.01);(2)若使用作为y关于x的回归方程模型,计算该回归方程(结果保留1位小数),并预测至少要到哪一天直播间人数可以超过30万人.参考公式和数据:相关系数,其中,回归直线方程中,66614032681.2206.413.22.6510.87.39某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是(

)A. B.C. D.放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数xi与该机场飞往A地航班放行准点率yi(i=1xyti=1i=1i=1i=12017.580.41.540703145.01621254.227.71226.8其中ti=(1)根据散点图判断,y=bx+a与y=clnx-2012+d哪一个适宜作为该机场飞往A地航班放行准点率y关于年份数x的经验回归方程类型(给出判断即可,不必说明理由),并根据表中数据建立经验回归方程,由此预测2023年该机场飞往(2)已知2023年该机场飞往A地、B地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往A地航班放行准点率的估计值,且2023年该机场飞往B地及其他地区(不包含A、B两地)航班放行准点率的估计值分别为80%和75(i)现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;(ii)若2023年某航班在该机场准点放行,判断该航班飞往A地、B地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.附:(1)对于一组数据u1,v1,u2,v2,…参考数据:ln10≈2.30,ln11≈2.40,《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yi(1)利用散点图判断,y=a+bx和y(2)对数据作出如下处理:得到相关统计量的值如表:xyωi=1i=1i=1i=19.430.323666.6439.266其中令ωi=lnxi,ω=110i=110(3)规定:观看人次大于等于120万人次的主播为优秀主播,从这10名主播中随机抽取3名,记其中优秀主播的人数为X,求X的分布列和数学期望.参考数据和公式:ln2≈0.69,附:对于一组数据u1,v1,u2,v2,…,某剧场的座位数量是固定的,管理人员统计了最近在该剧场举办的五场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论