版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 回归分析介绍: 1、回归分析的概念和模型 2、回归分析的过程第1页,共49页。回归分析的概念寻求有关联(相关)的变量之间的关系主要内容:从一组样本数据出发,确定这些变量间的定量关系式对这些关系式的可信度进行各种统计检验从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著利用求得的关系式进行预测和控制第2页,共49页。2019.013回归分析直线回归第3页,共49页。回归分析的过程在回归过程中包括:Liner:线性回归Curve Estimation:曲线估计Binary Logistic: 二分变量逻辑回归Multinomial Logistic:多分变量逻辑回归Ordinal 序
2、回归Probit:概率单位回归Nonlinear:非线性回归Weight Estimation:加权估计2-Stage Least squares:二段最小平方法Optimal Scaling 最优编码回归第4页,共49页。线性回归(Liner)一元线性回归方程: y=a+bxa称为截距b为回归直线的斜率估计系数a,b的方法:最小二乘法检验模型的方法:1、用R2判定系数判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)2、检验系数b是否显著的不为零,即检验x与y的线性关系是否存在。第5页,共49页。2019.016检验问题等对于回归系数b=0的检验:t检验对于拟合
3、的F检验注:一元回归中t检验和F检验等价R2(决定系数)及修正的R2:判定一个线性回归直线的拟合程度(用来说明用自变量解释因变量变异的程度)第6页,共49页。2019.017一元线性回归模型的确定:一般先做散点图(Graphs -Scatter-Simple),以便进行简单地观测(如:x与y的关系)若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较R2 (-1)来确定一种最佳方程式(曲线估计)第7页,共49页。2019.018对两个变量的数据进行线性回归,就是要找到一条直线来最好地代表散点图中的那些点。 第8页,共49页。2019.019多元线性回归方程
4、: y=b0+b1x1+b2x2+bnxnb0为常数项b1、b2、bn称为y对应于x1、x2、xn的偏回归系数用Adjusted R2调整判定系数判定一个多元线性回归方程的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例)多元线性回归一般采用逐步回归方法-Stepwise第9页,共49页。2019.01101. 直线回归分析分析Regression例1 某医生为了探讨缺碘地区母婴TSH水平的关系,随机抽取10对数据如下,试求脐带血TSH水平y对母血TSH水平x的直线回归方程。第10页,共49页。2019.0111 n行2列 (自变量、应变量)数据格式第11页,共49页。2019.011
5、2Analyze Regression Linear 检验步骤 第12页,共49页。2019.0113Linear Regression对话框应变量自变量计算统计量第13页,共49页。2019.0114Statistics对话框回归系数估计回归系数可信区间模型检验统计描述第14页,共49页。2019.0115点击“OK”,运行结果第15页,共49页。2019.0116结果输出第16页,共49页。2019.0117统计描述第17页,共49页。2019.0118相关系数及假设检验结果P值相关系数第18页,共49页。2019.0119相关系数及决定系数R值=相关系数R的平方修正的R方第19页,共49
6、页。2019.0120回归方程的方差分析回归平方和剩余平方和自由度均方F值P值第20页,共49页。2019.0121回归系数及其统计推断结果标准化系数是指把原始数据进行标准化处理之后回归的结果。此时回归方程中常数项为零。第21页,共49页。2019.0122回归系数及其统计推断结果常数项自变量非标准化回归系数标准化回归系数a值b值第22页,共49页。2019.0123回归系数及其统计推断结果t值P值回归系数可信区间第23页,共49页。2022/8/3相关分析10.1 相关分析的概念和相关分析过程10.2 两个变量间的相关分析10.3 偏相关分析10.4 距离分析第24页,共49页。2019.0
7、125相关分析的概念研究变量间密切程度的一种常用统计方法1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(详见下面)2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远第25页,共49页。2019.0126线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。如
8、果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1r0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0.95 存在显著性相关;|r|0.8 高度相关;0.5 |r|0.8 中度相关;0.3 |r|0.5 低度相关;|r|.5,认为中度相关)P213 Data10-02 某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果: 秩相关系数r和其相应的显著性概率Sig(秩相关系数均.5,认为中度相关)第39页,共49页。2019.01403. 等级相关分析Correlate例某地做肝癌病因研究,调查了个乡的肝癌死亡率(万)与某种食物中黄曲霉毒素相对含量(以最高含量为)。试做等级相关分析。第40页,共49页。2019.0141 n行2列 (自变量、应变量)数据格式 第41页,共49页。2019.0142Analyze Correlate Bivariate 检验步骤第42页,共49页。2019.0143Bivariate Correlations对话框等级相关系数第43页,共49页。2019.0144Options对话框计算均数和标准差第44页,共49页。2019.0145点击“OK”,运行结果第45页,共49页。2019.0146结果输出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024服装加工合作协议书
- 2024年项目经理劳动合同
- 福建省南平市塔前中学2020年高二数学文上学期期末试题含解析
- 立秋节气营销新策
- 2024版二手房协议范本
- 10-2 《师说》说课稿 2024-2025学年统编版高中语文必修上册
- 安全避险六大系统
- 餐饮产品采购配送合同协议
- 个人借贷反担保责任合同样本版B版
- 煤炭原材料采购合同原煤采购合同
- VRV空调技术要求和质量标准
- Q∕GDW 10721-2020 电力通信现场标准化作业规范
- 公安警察工作汇报PPT模板课件
- 第二讲VSP地震勘探
- 直肠癌个案护理范文结肠癌个案护理.doc
- 污水处理中常用的专业术语
- 石英砂过滤器说明书
- 物业品质提升ppt课件
- -乌兔太阳择日法表
- 施工人员安全告知书
- 筛分系统设备安装施工方案正文
评论
0/150
提交评论