版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系/了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程/了解独立检验(只要求2×2列联表)的基本思想、方法简单应用/了解假设检验的基本思想、方法简单应用/了解聚类分析的基本思想、方法简单应用)9.3
变量间的相关关系、回归分析及独立性检验1.相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.4.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.5.
回归直线:设所求的直线方程为,其中求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.6.相关系数:r=叫做变量y与x之间的样本相关系数,简称相关系数,用 它来衡量两个变量之间的线性相关程度.7.相关系数的性质:|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小.8.独立性检验:一般地,假设有两个分类变量X和Y,它们的可能取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表
若要推断的论述为H1:X与Y有关系,可以按如下步骤判断结论H1成立的可能性:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例.“两个比例的值相差越大,H1成立的可能性就越大.”(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:①根据实际问题需要的可信程度确定临界值k0;②利用公式K2=,由观测数据计算得到随机变量K2的观测值k;③如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.1.在对两个变量x,y进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图. 如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是() A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③① 答案:D2.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是() A.由样本数据得到的回归方程=bx+a必过样本中心() B.残差平方和越小的模型,拟合的效果越好 C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好 D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相 关关系 答案:C3.(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关.答案:C4.下面是一个2×2列联表
则表中a、b处的值分别为() A.94,96B.52,50C.52,54D.54,52 答案:C
y1y2总计x1a2173x222527总计b46判断两个变量正相关还是负相关,有三种方法:1.利用散点图;2.利用相关系数r的符号;当r>0时,正相关;r<0时,负相关;3.在已知两变量线性相关时,也可以利用回归方程=a+bx.当b>0时,=a+bx是增函数,两变量是正相关,当b<0时,=a+bx是减函数, 两变量是负相关.【例1】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg). (1)画出散点图; (2)判断是否具有相关关系.施化肥量x15202530354045棉花产量y330345365405445450455思维点拨:用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系.解答:(1)散点图如右图所示, (2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线.
【例2】一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?思维点拨:利用相关系数r进行线性相关检验(也可利用散点图).如果线性相关,再求回归直线方程并加以判断.(2)=0.7286x-0.8571.(3)要使≤10⇒0.7286x-0.8571≤10,所以x≤14.9013.所以机器的转速应控制在14.9013转/秒以下.解答:变式2.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
(1)y与x间是否有线性相关关系?若有,求出线性回归方程; (2)估计使用年限为10年时的维修费用.使用年限(x)/年23456维修费用(y)/万元2.23.85.56.57.0所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值,比较它与临界值的大小关系,来判断事件X与Y是否有关的问题.【例3】(2009·辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数12638618292614乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数297185159766218甲厂乙厂合计优质品非优质品合计解答:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%. 所以有99%的把握认为“两个分厂生产的零件的质量有差异”
甲厂乙厂合计优质品360320680非优质品140180320合计5005001000(2)变式3.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)画出二维条形图; (3)检验休闲方式是否与性别有关,可靠性有多大.解答:(1)2×2列联表如图:休闲方式性别看电视运动合计女432770男213354合计6460124(2)二维条形图如图:(3)假设休闲方式与性别无关,则K2=≈6.201>5.024,所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关.【方法规律】1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同).2.回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;②根据一组观察值,预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.3.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断.
为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩.数学888311792108100112物理949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.【答题模板】(2)由于x与y之间具有线性相关关系,根据回归系数公式得到b==0.5,a=100-0.5×100=50,∴线性回归方程为=0.5x+50.当y=115时,x=130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.
【分析点评】1.成绩的稳定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 济宁学院《科技文献检索与论文写作》2021-2022学年第一学期期末试卷
- 汽车改装技术 课件 4.2加装迎宾踏板和休闲踏板
- 2024年度旅游业务合作与运营合同协议2篇
- 手术室专科护士培训演讲
- xxx智慧停车场建设项目可行性研究报告
- 2024年办公室内勤年终工作总结范文
- 电工培训课件
- 肝病合并糖尿病的诊治
- 管理软件推广活动方案
- 银行培训公开课
- 钢结构防火涂料施工、监理报告
- 浅谈配电线路施工临时拉线的制作
- 邮轮旅游市场营销PPT完整全套教学课件
- 第六章具体行政行为行政合同
- 道路监控系统项目施工重点难点及施工方案
- 微机电系统设计与制造课件
- 连铸大包回转台安全操作规程
- 【医疗题材纪录片兴起与其传播价值6900字】
- 轮胎修理环保措施
- 色环电阻识别方法
- 轴平键强度计算表
评论
0/150
提交评论