




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十五章多元统计分析简介多元线性回归多元线性回归分析
(multiplelinearregression)一、概念及数学模型:x1--xm与y间得线性依存关系数学模型y=
0+
1
x1+、、、+
m
xm二、基本思想:寻找一个最佳平面反映x与y得线性依存规律。所求平面使得理论值与实际观察值最接近
用平面去描述这些观察点时,使得误差
多元线性回归分析基本原理一、资料整理格式多元线性回归分析二、回归模型估计方法
第i个个体得误差为:ei
=(
0+
1
xi1+、、、+
m
xim)-yi所有n个个体得误差为:|ei|
ei2=I从而,所求平面即使得I
为最小
正规方程组求最小值点methodofleastsquares(最小二乘法):Y得条件平均估计值多元线性回归分析三、回归模型评价方法3、1、几个系数问题偏回归系数---------标准偏回归系数----------偏相关系数复相关系数R3、2、回归方程得拟合优度检验确定系数R2=SS回/SS总方差分析F----检验:F=MS回/MS剩偏回归系数得t---检验与xj得计量单位有关消除xj计量单位得影响9大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流多元线性回归分析四、应用解释:利用自变量x去解释反应变量y得变异。筛选:运用变量筛选方法,提取对y有重大影响得自变量。预测:已知自变量x去估计反应变量y。控制:已知反应变量y去估计自变量x。多元线性回归分析五、筛选危险因素
常用方法有(1)前进法;(2)后退法;(3)逐步法:有进有出,双向筛选。
实例测量得到27名糖尿病患者得血清总胆固醇X1、甘油三酯X2、空腹胰岛素X3、糖化血红蛋白X4、空腹血糖Y得数值。试建立血糖与其她几项指标得多元线性回归方程。回归系数T值P值标准化回归系数截距5、9433X10、14240、390>0、050、0776X20、35151、721>0、050、3093X3-0、2706-2、23<0、05-0、3395X40、63822、623<0、050、3977Logistic回归Logistic回归分析数学模型:Logistic回归分析一、基本思想
用模型去描述实际资料时,须使得理论结果与实际结果尽可能得一致。
资料整理格式Logistic回归分析二、基本原理
1、结果问题:对于第i个个体而言,其理论结果为pi,而实际结果就是
i。2、一致问题:
对于第i个个体而言,
i=1pi
i=0qiLogistic回归分析
pi
i
qi
1-i
对于全部n个研究对象而言,其一致性为:L=∏pi
i
qi
1-i使得L或lnL最大得及
j即为所求。Logistic回归分析三、基本方法
最大似然函数法四、参数解释1、偏回归系数
j得意义与指标得计量单位有关,从而,通常无实际得解释意义。
Logistic回归分析2、标准化偏回归系数
j1得意义(1)符号:取“+”,xj增大,则P增大,即促进阳性结果得发生,为“不利因素”;取“-”,xj增大,则P减小,即抑制阳性结果得发生,为“保护因素”。(2)大小:∣
j1∣越大,则xj对结果得影响也就越大。消除xj量纲得影响Logistic回归分析3、OR值得计算和意义影响因素由X▲变化到X*时,有:
(1)对多指标得共同效应进行评价:若OR>1,则处于X*水平下得阳性结果发生风险要高于X▲水平,即“不利因素”占主导地位;若OR<1,则处于X*水平下得阳性结果发生风险要低于X▲水平,即“保护因素”占主导地位;若OR=1,则处于X*水平下得阳性结果发生风险与X▲水平相等,即处于平衡状态。Logistic回归分析
(2)对单因素进行评价:对因素xj而言,当她由xj▲变化到xj*时,其OR值为:
若ORj
>1,则xj促进阳性结果得发生,为不利因素;若ORj
<1,则xj抑制阳性结果得发生,为保护因素;若ORj
=1,则xj为非危险因素。Logistic回归分析4、筛选危险因素
常用方法有(1)前进法;(2)后退法;(3)逐步法:有进有出,双向筛选。
实例研究吸烟X1、饮酒X2与食管癌Y关系,试作Logistic回归。回归系数x2值P值标准化回归系数截距-0、9099X10、885611、207<0、052、7079X20、526144、870<0、051、5443COX回归Cox比例风险模型一、基本概念
生存时间(survivaltime):从某种起始事件到达某终止事件所经历得时间跨度。
对于追踪研究,生存时间就就是追踪观察持续得时间。生存时间常用符号t表示。例如,临床上冠心病病人在两次发作之间得时间间隔;流行病学中,从开始接触危险因素(如饮用了含有病菌得饮料)到发病所经历得时间;动物实验中,从开始给药到动物死亡所经历得时间等。
生存时间1、完全数据(pletedata)
在追踪观察中,当观察到了某观察对象得明确结局时,该观察对象所提供得关于生存时间得信息就是完整得,这种生存时间数据称为完全数据。
2、截尾数据(censoreddata)
在实际追踪观察中,由于某种原因无法知道观察对象得确切生存时间,这种生存时间数据称为截尾数据。
截尾数据产生截尾数据得原因:
1)观察对象失访或”死于”其她原因;2)观察对象得生存期超过了研究终止期;3)在动物实验中,有时预先规定观察期限,虽然有一部分动物在到达实验终止期时尚未出现规定得终止事件,但仍停止实验;或者当出现了预先规定得终止事件得动物数后实验停止,则这一部分残存动物得生存时间就就是截尾数据。
截尾数据又可分为随机截尾数据和定时截尾数据。
可在追踪随访期内任何时点上发生截尾得生存时间数据称为随机截尾数据(randomcensoringdata)。在预先确定了观察终止时点后得到得截尾数据便称为定时截尾数据或称右截尾数据(rightcensoringdata)。
截尾数据统计描述死亡率、死亡概率、生存概率
(1)死亡率(mortalityrate,deathrate)记为m,表示在某单位时间里得平均死亡强度(频率表示过去得、已发生得情况)。年死亡率得计算公式为:
(2)死亡概率(mortalityprobability):记为q,就是指往后一个时段内死亡得可能性大小(概率预测往后得、即将发生得情况)。年死亡概率得计算公式为:
若年内有截尾,则分母用校正例数:
死亡率反映年平均死亡强度,而死亡概率表示往后一年死亡得机会大小。
统计描述(3)生存概率(survivalprobability):记为p,指往后活满一个时段得可能性大小(1-q)。年生存概率表示往后再活一年得机会大小,其计算公式为:
若年内有截尾,则分母用校正人口数。统计描述生存率及其标准误(1)生存率(survivalrate):记为S(t),就是指病人经历给定得t个单位时间之后仍存活得概率。生存率其实质就是累积生存概率(cumulativeprobabilityofsurvival)。若无截尾数据,其公式为:
其中,T为病人得存活时间。
如果含有截尾数据,则观察总例数将难以确定,应利用概率乘法原理估计生存率:(2)生存率得标准误:采用Greenwood‘s法估计生存率得标准误,其公式为:
(3)生存曲线(survivalcurve):就是指将各个时点得生存率连接在一起得曲线图。曲线形状分两种类型:①阶梯型:小样本资料用直接法估计得生存曲线;②折线型:大样本资料用频数表法估计得生存曲线。半数生存期及其四分位数间距半数生存期(mediansurvivaltime):又称中数生存期,记为T50,其定义为:
T50=生存率为0、5时所对应得时间
她表示有并且只有50%得个体可活这么长时间,她反映生存期得平均水平。
四分位数间距:记为Q,表示中间半数病人生存期得分布范围,她反映生存期得离散程度,其定义为: Q=T25-T75 式中,T25和T75分别就是25百分位数和75百分位数、
生存率得估计小样本生存率得估计:Kaplan-Meier法,又称乘积极限法(Product-limitmethod)、大样本生存率得估计:寿命表法、
寿命表有现时和定群之分,估计生存率用得就是定群寿命表法(cohortlifetable)。生存曲线得比较利用死亡数和死亡率函数推断k个总体生存曲线就是否不同?
比较方法:①Logrank检验、其基本思想就是实际死亡数与期望死亡数进行比较
(H0:总体生存率曲线相同):
H0成立时,服从自由度为(k-1)得
2分布!②Breslow检验、可看作就是对Logrank检验得一种加权、Cox比例风险模型数学模型:其中,h0(t)称为基础风险函数
Cox比例风险模型二、基本思想
用模型去描述实际资料时,须使得理论结果与实际结果尽可能得一致。
资料整理格式Cox比例风险模型三、基本原理
类似Logistic回归分析构造一个所谓得偏似然函数L=…
使得L或lnL最大得
j即为所求。
Cox比例风险模型四、基本方法
最大偏似然函数法五、参数解释1、偏回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 证券市场投资客户心理研究试题及答案
- 证券从业资格证考试疑难解答试题及答案
- 短期投资策略的重要性在2025年证券考试中的考察试题及答案
- 内部审计与外部审计的联系试题及答案
- 项目管理中的经济分析技巧试题及答案
- 项目管理资格考试的高频知识点试题及答案
- 证券从业资格证考试注意事项与试题及答案
- 政策变化影响分析2025年国际金融理财师考试试题及答案
- 广西房屋建筑和市政工程勘察公开招标文件范本 2022年版
- 2025年注册会计师备考路线图试题及答案
- 2025-2030中国机电安装工程行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 常见内科疾病护理要点试题及答案
- 2025-2030中国冷轧钢板行业市场发展现状及发展趋势与投资前景研究报告
- 矿山雨季生产安全知识培训
- 数学-湖南省2025届高三下学期“一起考”大联考(模拟二)试题+答案
- 封神榜讲解课件
- 创新教学法在二年级道德与法治中的应用计划
- 中央2025年中国信息安全测评中心招聘31人笔试历年参考题库附带答案详解
- 2025年音乐节演唱会明星艺人歌手乐队演出场费价格表
- 餐饮业高层管理人员岗位职责
- mems探针卡可行性研究报告
评论
0/150
提交评论