版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第57讲成对数据的统计分析【备选理由】例1是成对数据的统计相关性判断及应用;例2是线性回归分析问题;例3是非线性回归分析问题;例4是独立性检验与线性回归分析的综合问题.例1[配例1使用]某中学有学生600人,要求学生在每天上午7:30之前进校,现有一个调查小组调查某天7:00~7:30进校人数的情况,得到如下表格(其中y表示第x分钟内到校的人数,1≤x≤30,x∈N*,如当x=9时,y=4表示第9分钟内,即在7:08~7:09这一分钟内到校的人数为4).x1591519212427282930y13451121366694101106根据调查所得数据,甲同学得到的经验回归方程是y=3.6x-27(对应图中的实线),乙同学得到的经验回归方程是y=0.82e0.16x(对应图中的虚线),则下列结论中错误的是 (C)A.7:00~7:30内,y与x正相关B.乙同学的经验回归方程拟合效果更好C.根据甲同学得到的经验回归方程可知该校当天7:16~7:17这一分钟内的到校人数一定是34D.该校超过半数的学生都选择在距离规定到校时间的5分钟内到校[解析]对于A,根据散点图知,7:00~7:30内,y与x正相关,故A中结论正确;对于B,由题中图知,曲线y=0.82e0.16x的拟合效果更好,故乙同学的经验回归方程拟合效果更好,故B中结论正确;对于C,表格中并未给出7:16~7:17这一分钟内到校人数的值,即当x=17时,对应y的值,而由甲的经验回归方程得到的只能是估计值,不一定就是实际值,故C中结论错误;对于D,全校有学生600人,从表格中的数据知,7:26~7:30到校的人数超过300,即该校超过半数的学生都选择在距离规定到校时间的5分钟内到校,故D中结论正确.故选C.例2[配例2使用][2023·黑龙江哈尔滨九中二模]为调查某地区植被覆盖面积x(单位:公顷)与野生动物数量y的关系,某研究小组将该地区等面积划分为200个区块,从中随机抽取20个区块,得到样本数据(xi,yi)(i=1,2,…,20),部分数据如下:x…2.73.63.2…y…57.864.762.6…经计算得∑i=120xi=60,∑i=120yi=1200,(1)利用最小二乘法建立y关于x的经验回归方程.(2)记y关于x的经验回归直线为l1,该小组又利用这组数据建立了x关于y的经验回归方程,记x关于y的经验回归直线为l2,并把这两条拟合直线画在同一坐标系xOy中,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.(i)比较l1与l2的斜率大小,并说明理由;(ii)求这两条直线的公共点坐标.附:y关于x的经验回归方程y=a+bx中,b=∑解:(1)由题意可知x=6020=3,y=120020b=∑i=120(xi-x)(yi-故y关于x的经验回归方程为y=8x+36.(2)设l1,l2的斜率分别为k1,k2,x关于y的经验回归方程为x=a1+b1y,则bk1=b=∑(i)k1<k2,理由如下.∵k1k假设k1=k2,则|r|=1,即yi=8xi+36(i=1,2,…,20)恒成立,将表格中的一对数据(2.7,57.8)代入上式得57.8≠8×2.7+36,与yi=8xi+36(i=1,2,…,20)恒成立矛盾,故假设不成立,则k1<k2.(ii)根据经验回归直线的求解过程可知两条直线都过点(x,y),又k1<k2,故这两条直线的公共点坐标为(x,y),即(3,60).例3[配例3使用][2023·山西吕梁三模]数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018~2022年中国车载音乐市场规模(单位:十亿元),其中年份2018~2022对应的代码分别为1~5.年份代码x12345车载音乐市场规模y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型y=a·bx拟合y与x的关系,请建立y关于x的经验回归方程(a,b的值精确到0.1);(2)综合考虑2023年及2024年的经济环境等因素,某预测公司根据上述数据求得y关于x的经验回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.参考数据:v∑e0.524e0.4721.9433.821.71.6其中vi=lnyi,v参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=∑解:(1)因为y=a·bx,所以两边同时取自然对数,得lny=lna+xlnb,设v=lny,α=lna,β=lnb,所以v=α+xβ.因为x=3,v=1.94,所以βα=v-βx=1.94-0.472×3=0.524,所以lna=0.524,lnb=0.所以a=e0.524=1.7,b=e0.472=1.6,所以y=1.7×1.6x.(2)由(1)知2023年与2024年这两年的年平均增长率为1.6-1.3=0.3,因为2022年中国车载音乐市场规模为17,所以预测2024年的中国车载音乐市场规模为17×(1+0.3)2=28.73(十亿元).例4[配例2、例4使用]小家电一般指除大功率、大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,其应用场景比较广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元)与年份代码的一组数据.年份代码x12345市场规模y0.91.21.51.41.6(1)由上表数据可知,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明(设样本相关系数为r,若|r|≥0.75,则说明两变量间的线性相关程度较高);(2)建立y关于x的经验回归方程;(3)某传媒公司为了了解中国智能小家电消费者的年龄分布,随机调查了200名消费者,统计这200名消费者的年龄,按照青少年与中老年分为两组,得到如下2×2列联表:单位:人购买智能小家电年龄合计青少年中老年喜欢80不喜欢60合计110200依据小概率值α=0.001的独立性检验,能否认为是否喜欢购买智能小家电与年龄有关联?参考数据:y=1.32,∑χ2=n(ad-bc附:α0.10.010.001xα2.7066.63510.828解:(1)由已知得x=1+2+3+4+55=3,y=1.∑所以r≈1.63.因为y与x的样本相关系数近似为0.92>0.75,所以y与x的线性相关程度较高,可以用线性回归模型拟合y与x的关系.(2)由题意得∑a=y-bx=1.32-0.16×3=0.故y关于x的经验回归方程为y=0.16x+0.84.(3)由题意可得2×2列联表如下,单位:人购买智能小家电年龄合计青少年中老年喜欢80
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度环保工程承包合同工程范围与环保标准
- 2024年度租赁期满续租合同标的及租金调整机制
- 2024年度智能家居系统购买合同
- 2024个人住房借款合同范本
- 2024年度墙板安装工程承包合同2篇
- 2024年度云服务数据存储协议3篇
- 2024年度建筑项目技术研发合同2篇
- 2024年度电商物流无人机配送与运营合作协议
- 企业培训服务合同实施策略
- 抵押借款合同纠纷的调解与仲裁
- 2023年营口市站前区人民法院聘用制书记员招聘考试试题及答案
- 南京市2023-2024学年九年级上学期期末英语试卷(含答案解析)
- 空乘人员生涯发展展示
- 项目风险评估与缓解措施
- 《美丽的颜色》核心素养课件
- 废弃资源循环利用技术创新
- 职业打假人投诉、举报处理规范
- 危重患者早期识别课件
- 预防事故和职业病的措施及应注意的安全事项
- 丰田核心竞争力及战略分析课件
- 高风险作业施工安全措施
评论
0/150
提交评论