3.1.1回归分析的基本思想及其初步应用_第1页
3.1.1回归分析的基本思想及其初步应用_第2页
3.1.1回归分析的基本思想及其初步应用_第3页
3.1.1回归分析的基本思想及其初步应用_第4页
3.1.1回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1回归分析的基本思想及初步应用(1)3.1回归分析的基本思想及初步应用(1)必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析

复习必修3(第二章统计)知识结构收集数据(随机抽样)整理统计的基本思想实际样本模拟抽样分析统计的基本思想实际样本模拟抽样分问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-------有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习、变量之间的两种关系问题1:正方形的面积y与正方形的边长x之间y=x2确定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.1.定义:1)相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析.2)

新课自变量取值一定时,因变量的取值带有一定随机性的两个变52.现实生活中存在着大量的相关关系.

如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入等等.探索:水稻产量y与施肥量x之间大致有何规律?2.现实生活中存在着大量的相关关系.探索:水稻产量y与1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近.探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455散点图10203040505001020304050500450400350300·······xy施化肥量水稻产量102030最小二乘法:称为样本点的中心。最小二乘法:称为样本点的中心。3.对两个变量进行的线性分析叫做线性回归分析.2.回归直线方程:2.相应的直线叫做回归直线.1.所求直线方程叫做回归直---线方程;其中3.对两个变量进行的线性分析叫做线性回归分析.2.回归直线方相关系数1.计算公式2.相关系数的性质(1)|r|≤1.(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.问题:达到怎样程度,x,y线性相关呢?它们的相关程度怎样呢?相关系数1.计算公式负相关正相关负相关正相关相关系数r>0正相关;r

<0负相关.通常,r

∈[-1,-0.75]--负相关很强;

r

∈[0.75,1]—正相关很强;

r

∈[-0.75,-0.3]--负相关一般;r

∈[0.3,0.75]—正相关一般;

r

∈[-0.25,0.25]--相关性较弱;相关系数r>0正相关;r<0负相关.通常,r·······1020304050500450400350300xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455解:1.画出散点图2.求出3.写出回归方程4.计算相关系数·······10203040例题1从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。

例题例题1从某大学中随机选出8名女大学生,其身高和体重数据如下分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.3.通过探究栏目引入“线性回归模型”.此处可以引导学生们体会函数模型与回归模型之间的差别.学分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差.(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不(1)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.(1)由图形观察可以看出,样本点呈条状分布,身高和体重有比较线性回归模型

y=bx+a+ey=bx+a+e其中a和b为模型的未知参数,e

是y

与之间的误差,通常e称为随机误差.线性回归模型y=bx+a+e其中a和b为为了衡量预报的精度,需要估计的σ2值?为了衡量预报的精度,需要估计的σ2值?(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差来判断模型拟合的效果这种分析工作称为残差分析(1)根据散点图来粗略判断它们是否线性相关。了解残差图的制作及作用,见课本P85.坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意.错误数据模型问题身高与体重残差图异常点了解残差图的制作及作用,见课本P85.错误数据身P89习题3.1第1题

作业P89习题3.1作业3.1回归分析的基本思想及初步应用(1)3.1回归分析的基本思想及初步应用(1)必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析

复习必修3(第二章统计)知识结构收集数据(随机抽样)整理统计的基本思想实际样本模拟抽样分析统计的基本思想实际样本模拟抽样分问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-------有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习、变量之间的两种关系问题1:正方形的面积y与正方形的边长x之间y=x2确定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.1.定义:1)相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析.2)

新课自变量取值一定时,因变量的取值带有一定随机性的两个变282.现实生活中存在着大量的相关关系.

如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入等等.探索:水稻产量y与施肥量x之间大致有何规律?2.现实生活中存在着大量的相关关系.探索:水稻产量y与1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近.探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455散点图10203040505001020304050500450400350300·······xy施化肥量水稻产量102030最小二乘法:称为样本点的中心。最小二乘法:称为样本点的中心。3.对两个变量进行的线性分析叫做线性回归分析.2.回归直线方程:2.相应的直线叫做回归直线.1.所求直线方程叫做回归直---线方程;其中3.对两个变量进行的线性分析叫做线性回归分析.2.回归直线方相关系数1.计算公式2.相关系数的性质(1)|r|≤1.(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.问题:达到怎样程度,x,y线性相关呢?它们的相关程度怎样呢?相关系数1.计算公式负相关正相关负相关正相关相关系数r>0正相关;r

<0负相关.通常,r

∈[-1,-0.75]--负相关很强;

r

∈[0.75,1]—正相关很强;

r

∈[-0.75,-0.3]--负相关一般;r

∈[0.3,0.75]—正相关一般;

r

∈[-0.25,0.25]--相关性较弱;相关系数r>0正相关;r<0负相关.通常,r·······1020304050500450400350300xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455解:1.画出散点图2.求出3.写出回归方程4.计算相关系数·······10203040例题1从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。

例题例题1从某大学中随机选出8名女大学生,其身高和体重数据如下分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.3.通过探究栏目引入“线性回归模型”.此处可以引导学生们体会函数模型与回归模型之间的差别.学分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论