统计回归模型课件_第1页
统计回归模型课件_第2页
统计回归模型课件_第3页
统计回归模型课件_第4页
统计回归模型课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模之统计回归模型统计回归模型人群中各个体收入有区别吗?不同性别的收入是否不同?是否少数民族的收入是否不同?不同工种的收入是否不同?不同性别和工种的收入是否不同?是否少数民族不同工种的收入是否不同?方差分析方法统计回归模型全球吃死的人比饿死的人多?据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占2200万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的“专利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。

(引自《光明日报》刘军/文)问题:

肥胖症和体重超常与死亡人数真有显著的数量关系吗?

相关分析与回归分析方法统计回归模型统计方法

利用从一定总体中随机抽取一部分即样本的性质,来推断和预测总体的性质的方法。统计回归模型内容纲要52025年3月11日

数理统计中的一些基本概念

方差分析法

回归分析法

案例分析:教学评估统计回归模型一.数理统计中的一些基本概念总体,样本,抽样,简单随机样本统计量,平均值中位数分位数方差标准差极差k阶矩偏度峰度1.样本与统计量统计回归模型参数估计矩估计法、最大似然估计法点估计:区间估计:正态总体下均值与方差的区间估计假设检验正态总体下参数的检验分布拟合检验一.数理统计中的一些基本概念2.参数估计与假设检验统计回归模型方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。二.方差分析法1.方差分析法概念

统计回归模型在试验中,有可能影响试验指标并且有可能加以控制的试验条件称为因素。通过试验的设计,在试验中只安排一个因素有所变化、取不同的状态或水平,而其余的因素都在设计的状态或水平下保持不变的试验称为单因素试验。即指标值X只受一个因素A的影响,检验A在取不同的状态或水平时,对指标值X的影响。二.方差分析法1.单因素方差分析

统计回归模型因素A的水平观测值试验次数

(n1+n2+…+nr=n)1.单因素方差分析

二.方差分析法统计回归模型在单因素试验中,假设有r

个编号为i=1至r的正态总体,它们分别服从N(

i,σ2)分布,当

i及σ2未知时,要根据取自这r个正态总体的r个相互独立且方差相同的样本检验原假设H0:各μi(i=1至r)相等,所作的检验以及对未知参数的估计称为方差分析。1.单因素方差分析

二.方差分析法(组内平均值)(总平均值)统计回归模型总离均差平方和的分解1.单因素方差分析

二.方差分析法考虑样本全体观测值xij对总平均值的偏差平方和记统计回归模型结论1)SST=SSE+SSA结论2)

结论3)当H0为真时,

结论4)当H0为真时,SSE、SSA相互独立1.单因素方差分析

二.方差分析法结论5)当H0为真时,统计回归模型《切胚乳试验》用小麦种子进行切胚乳试验,设计分3种处理,同期播种在条件较为一致的花盆内,出苗后每盆选留2株,成熟后测量每株粒重(单位:g),得到数据如下:

处理未切去胚乳切去一半胚乳切去全部胚乳

每株粒重

21,29,24,22,25,30,27,2620,25,25,23,29,31,24,26,20,2124,22,28,25,21,261.单因素方差分析

二.方差分析法统计回归模型方差来源

A

误差总和

平方和

6.77223.73230.50自由度

22123均方和

3.3910.65F值

0.32显著性

N分析结果1.单因素方差分析

二.方差分析法(F0.05(2,21)=3.47)统计回归模型变量间的相互关系◆确定性的函数关系

Y=f(X)◆不确定性的统计关系—相关关系

Y=f(X)+ε(ε为随机变量)◆没有关系

变量间关系的图形描述:坐标图(散点图)三.回归分析1.相关与回归分析的概念统计回归模型●

从涉及的变量数量看

简单相关多重相关(复相关)相关关系的类型●从变量相关关系的表现形式看

线性相关——散布图接近一条直线(左图)

非线性相关——散布图接近一条曲线(右图)三.回归分析1.相关与回归分析的概念统计回归模型●

从变量相关的程度看

完全相关

(B)

不完全相关

(A)

不相关

(C)●

从变量相关关系变化的方向看

正相关——变量同方向变化同增同减(A)

负相关——变量反方向变化一增一减(B)ABC三.回归分析1.相关与回归分析的概念统计回归模型

回归的古典意义:

高尔顿遗传学的回归概念三.回归分析1.相关与回归分析的概念父母身高与子女身高的关系:

无论高个子或低个子的子女都有向人的平均身高回归的趋势统计回归模型

一个因变量对若干解释变量依存关系的研究回归的目的(实质):由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值回归的现代意义三.回归分析1.相关与回归分析的概念统计回归模型●共同的研究对象:都是对变量间相关关系的分析●相关分析中相关系数的确定建立在回归分析的基础上●只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义●相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析三.回归分析1.相关与回归分析的概念相关分析与回归分析的联系统计回归模型一般形式).,0(~2sNei相互独立且都式中的三.回归分析2.一元线性回归模型统计回归模型

根据样本及其观测值可以得到α、β及σ2的估计量及估计值

得到回归方程的估计式或经验回归方程

进行n次独立试验,测得数据如下:三.回归分析2.一元线性回归模型统计回归模型确定未知参数的方法:最小二乘法。的值最小。a称截距,b称回归系数,而

三.回归分析2.一元线性回归模型统计回归模型根据最小二乘法的要求,由

三.回归分析2.一元线性回归模型统计回归模型一元回归方程的显著性检验(即检验β=0是否为真)残差平方和回归平方和且SSR与SSE相互独立三.回归分析2.一元线性回归模型统计回归模型当H0为真时,

当F≥F1-α(1,n-2)时应该拒绝原假设H0。

F检验法:

记,称为可决系数,用其大小来评价模型的有效性.三.回归分析2.一元线性回归模型统计回归模型利用回归方程进行预测Y的点预测:Y的个别值置信度为1-α的预测区间:三.回归分析2.一元线性回归模型统计回归模型

多元线性回归模型的一般形式三.回归分析3.多元线性回归模型统计回归模型多元回归分析数据格式三.回归分析3.多元线性回归模型统计回归模型多元线性回归分析的一般步骤三.回归分析3.多元线性回归模型统计回归模型拟合优度公式参数估计公式多元回归分析的几个公式多元回归方程的假设检验三.回归分析3.多元线性回归模型统计回归模型相关系数:描述两个变量间的线性相关程度。任何事物的存在都不是孤立的,而是相互联系、相互制约的。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。三.回归分析4.相关分析统计回归模型相关性检验:样本相关系数检验的依据:如果X和Y都服从正态分布,在总体相关系数的假设下,与样本相关系数rXY有关的t统计量服从自由度为n-2的t分布:

三.回归分析4.相关分析统计回归模型给定显著性水平,查自由度为n-2的临界值;◆若,表明相关系数r在统计上是显著的,应否定而接受的假设;◆反之,若,应接受的假设。三.回归分析4.相关分析统计回归模型三.回归分析4.相关分析手掌“生命线”的长度能反映人的寿命吗?有人认为人的寿命与手掌上的“生命线”的长度相关,“生命线”长的人寿命就长些,反之,寿命就短些。为检验此说法,现抽取50位自然死亡的人的生存年龄x(年)及“生命线”长度y(cm)的数据.从而x与y之间的相关系数为且即x与y之间的线性相关关系是不显著的.统计回归模型为了考评教师的教学质量,教学研究部门设计了一个教学评估表,对学生进行一次问卷调查,要求学生对12位教师的15门课程(其中3名教师有两门课程)按以下7项内容打分,分值为1—5分(5分最好,1分最差):课程内容组织的合理性;:主要问题展开的逻辑性;:回答学生问题的有效性;:课下交流的有助性;:教科书的帮助性;:考试评分的公正性;:对教师的总体评价。三.案例分析:教学评估1.问题统计回归模型教师编号课程编号12014.464.424.234.104.564.374.1122244.113.823.293.603.993.823.3833013.583.313.243.764.393.753.1743014.424.374.344.403.634.274.3953014.624.474.534.674.634.574.69收回问卷调查表后,得到了学生对12位教师、15门课程各项评分的平均值,见表。三.案例分析:教学评估1.问题统计回归模型教师编号课程编号63093.183.823.923.623.504.143.2573112.472.793.583.502.843.842.8483114.293.924.053.762.764.113.9593124.414.364.274.754.594.114.18103124.594.344.244.392.644.384.44113334.554.454.434.574.454.404.47124244.674.644.524.393.484.214.6133513.713.413.394.184.064.063.1744114.284.454.104.073.764.434.1594244.244.384.354.484.154.504.33三.案例分析:教学评估1.问题统计回归模型定每项都对教师总体评价Y有显著影响,并且各项内之间也可能存在很强的相关性,他们希望得到一个总体评价与各项具体内容之间的模型,模型应尽量简单和有效,并且由此能给教师一些合理的建议,以提高评价总体评价.教学研究部门认为,所列各项具体内容

不一三.案例分析:教学评估

1.问题统计回归模型逐步回归这个问题给出了6个自变量,但我们希望从中选出对因变量影响显著的那些来建立回归模型。变量选择的标准应该是将所有对因变量影响显著的自变量都选入模型,而影响不显著的自变量都不选入模型,从便于应用的角度,应使模型中的自变量个数尽量少。逐步回归就是一种从众多自变量中有效的选择重要变量的方法。三.案例分析:教学评估

2.问题分析统计回归模型逐步回归的基本思路是:先确定一个包含若干自变量的初始

集合,然后每次从集合外的变量中引入一个对因变量影响最

大的,再对集合中的变量进行检验,从变得不显著的变量中

移出一个影响最小的,依次进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。

利用MATLAB系统工具箱中的逐步回归命令stepwise可以实现

逐步回归。Stepwise提供人机交互式画面,可以在画面上自由

引入和移出变量,进行统计分析。具体用法参见MATLAB丛书.三.案例分析:教学评估

2.问题分析统计回归模型利用MATLAB命令得到各个变量的回归系数,置信区间及剩余标准差(RMSE),决定系数(R-square),值、值,见表.三.案例分析:教学评估

3.回归模型的建立与求解统计回归模型参数参数估计值置信区间10.5162[0.015460.019]2-0.05469[-0.8530.7436]30.6706[-0.037951.379]40.1245[-0.4620.6751]5-0.04335[-0.25140.1647]60.1363[-0.69580.9684]RMSER-squareFp0.11250.980667.292.071e-006可以看到,除外其他自变量的回归系数置信区间都包含零点,在临界状态,将一一移去(与次序无关),当模型中仅含时结果见下表。三.案例分析:教学评估

3.回归模型的建立与求解统计回归模型参数参数估计值置信区间10.5099[0.3260.6938]2-0.1137[-0.6890.4616]30.7678[-0.51241.023]40.0833[-0.27670.4433]5-0.018[-0.15650.1205]60.1109[-0.55940.7811]RMSER-squareFp0.10.977254.71.487e-010值大大提高。这些可以看到,仅含模型的回归系数置信区间远离零点,对的影响是显著的,与上个结果比较,剩余标准差由0.1125减少到0.1,虽然略有下降,但表明仅含模型是合适的。但MATLAB命令并未给出回归模型的常数项。我们由以下方法计算得到:统计回归模型回归终得到的模型为其中,分别是的平均值。利用逐步三.案例分析:教学评估

3.回归模型的建立与求解统计回归模型在最终模型里回归变量只有,是一个简单易用的模型,据此可把课程内容组织的合理性()和回答学生问题的有效性()列入考评的重点。上式表明,的分值每增加一分,对教师的总体评价就增加约0.5分;的分值每增加一分,对教师的总体评价就增加约0.77分。应建议教师注重这两方面的工作。为了分析其它变量没有进入最终模型的原因,可以计算的相关系数,利用MATLAB系统工具箱中的corrcoef命令直接得到这7个变量的相关系数矩阵:三.案例分析:教学评估

4.

模型解释统计回归模型1.00000.90080.67520.73610.29100.64710.89730.90081.00000.85040.73990.27750.80260.93630.67520.85041.00000.74990.08080.84900.91160.73610.73990.74991.00000.43700.70410.82190.29100.27750.08080.43701.00000.18720.17830.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论