版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
题目:止痛剂疗效评价预测摘要随着现代科学技术的开展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。某医药公司本着减少病痛患者的疼痛研制了一种新的止痛药,现通过医药实验来预测其疗效。本文根据该公司的医药实验所提供的数据进行深究,以得出一种模型来预测对于不同服药剂量、不同性别以及不同血压的病人服用该药起作用所需要的时间。这是一个多元线性回归问题,通过对该题题意的探究,我们采用统计回归方法进行解决。我们先用软件画出图中所给数据的散点图,可以分析出需要采用2次项来建立模型,如图4.3.2。再根据对该问题的初步认识建立一个根本模型:,用MATLAB软件解出模型,再通过残差图两次剔除数据并且回归,得到最终结果,其最正确模型为:,虽然模型看起来可用,但是作为药物,其适用范围只有85.14%,因此再考虑模型改良。在改良模型中,我们对几组变量均采用了0—1变量,以增加精确度。和根本模型相同,我们所建立的改良后的模型为:,还是采用MATLAB软件来解出模型,由于残差图中存在异常数据,剔除再回归,假设还是有异常数据,再剔除,再回归。通过三次回归,得到的最终结果如表5.2.4,此时其适用范围可以到达99.45%,所以最正确模型为改良后的模型,即:,对于该模型,只需要了解病人情况,获得的值代入模型就可以知道其病痛开始减轻的时间了。本文具有一定的实用性和科学合理性,只要该公司所给数据是真实可信的,那么可以在新药推广中实践。关键词:多元线性回归统计回归方法残差图模型改良0-1变量一、问题重述一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物实验,给患有同种病痛的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,7g和10g,并记录每个病人病痛明显减轻的时间〔以分钟计〕。为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试。通过比拟每个人病人的血压历史数据,从低到高分成三组,分别计作0.25,0.50,0.75。实验结束后,公司的记录结果见下表〔性别以0表示女,1表示男〕。请你为公司建立一个模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间。病人序号病痛减轻时间/min用药剂量/g性别血压组别135200.25243200.50355200.75447210.25543210.50657210.75726500.25827500.50928500.751029510.251122510.501229510.751319700.251411700.501514700.751623710.251720710.501822710.7519131000.252081000.502131000.7522271010.2523261010.502451010.75根本假设假设病人没吃其他止痛药;假设题目所给的数据真实可信;假设题目所给的调查结果能够反映止痛药对所有病人的效果;假设服用止痛剂前后,病人未服用其他抑制止痛药效果的药物。符号说明符号含义单位备注病痛减轻时间min用药剂量g性别女-0,男-1血压组别随机误差待估计的回归系数问题分析4.1问题背景随着现代科学技术的开展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。医药公司在确定药物使用剂量之前,都要进行药物实验,以防剂量服用不当而产生副作用。根据药物实验所取得的数据要进行详细分析,得出不同性别和血压的人最正确服用时间、剂量,以保证病人的平安。4.2概念分析止痛药,局部或完全缓解疼痛的药物。根据疼痛程度、规律及首次有效止痛时间,应按时给予止痛药,以保持药物在血液中的浓度,将疼痛刺激控制在痛阈之下。根据实际需要,在确保平安的前提下,药物剂量由小到大,直到病人止痛为止。比方恨不得病马上好,擅自加大药量;或者不把吃药当回事,想起来吃点,想不起来就算了,或者两次药并成一次吃,都是不对的。4.3数据分析要对该题深入了解,首先是要先进行数据分析,以便确定模型方向。根据题中所给数据,画出的散点图如下:〔图〕:由上图可知:对可用二次函数拟合,拟合后如图。图〔图〕:图〔图〕:图由以上散点图可以知道在模型建立中要采用2次项才能保证模型的可靠性。4.4问题分析本问题是一个在新药推广中,医药公司的新药研究部门设计了一种药物给患有同种疾病的病人使用后,根据病人的用药剂量、性别和血压组别,预测病痛时间减轻多少的统计回归问题。针对这个问题,我们采用了两种方法解答,并且用MATLAB软件的Regress求解。五、模型的建立与求解5.1问题的模型建立与求解根据题意需要,设根据散点图的分析,可以知道对可用二次函数拟合,所以有:,而对、可用线性模型表示:和,所以与之间的多元线性回归模型为:用MATLAB求解得到数据如表5.1:表5.1.1参数参数估计值参数置信区间63.1291[48.717377.5409]-10.2706[-14.9243-5.6169]5.6667[-0.021311.3546]-1.5000[-15.432512.4325]0.5111[0.13190.8903]=0.8275F=22.7903P=0.0000=44.3109由表5.1可以看出,因变量的82.75%由模型确定,拟合度不高,,值远超临界值,所以模型整体来看是可用的,但的置信区间含有零点,这两个个系数的解释是不可靠的。所以要对模型进行残差分析,首次回归所得图形如图5.1:出现两个异常数据,剔除第3和第24个数据后再次回归,结果如表5.1.2:参数参数估计值参数置信区间58.3561[46.002870.7094]-9.6490[-13.7231-5.5748]8.1419[3.188813.0950]-1.6471[-14.139410.8453]0.5078[0.17650.8392]=0.8594F=25.9679P=0.0000=29.8002的置信区间还是含有零点,再次进行残差分析,如图:图剔除第五个异常数据再次回归,结果如表5.1.3:参数参数估计值参数置信区间55.8121[44.391867.2324]-8.0962[-12.0605-4.1320]7.1311[2.553911.7083]-6.3868[-18.53485.7612]0.4025[0.08690.7181]=0.8514F=22.9153P=0.0000=24.1056残差图见图5.1.3:此时,该模型在大程度上都有了提升,也无异常数据,模型根本可用。所以最正确模型为:模型似乎可以使用了,但是为了得到更准确的模型,我们将对其进行改良。5.2模型的改良现对模型进行改良,在这里增加一个0—1变量:所以血压低〔0.25〕时可以用表示,血压中用表示,血压高用表示。线性回归假设用药剂量、性别、血压组别无交互作用,那么用MATLAB求得以下数据:参数参数估计值置信区间49.3652[39.730858.9996]-4.1373[-5.2888-2.9857]5.6667[-1.047912.3812]-0.7500[-8.97367.4736]-2.3750[-10.59865.8486]F=15.0126p=0.0000由此可见:置信区间都包含零点,解释不可靠,而且明显偏低,又偏高,所以该线性模型不可用。5.2.2增加交互项假设方程:首次回归,用MATLAB解得数据如表5.2.1:表5.2,1参数参数估计值参数置信区间56.2761[45.972166.5802]-9.2951[-12.2689-6.3213]2.2500[-6.939711.4397]24.3382[13.889934.7866]2.9706[-7.477813.4190]0.5111[0.28330.7389]1.0000[-0.17182.1718]-3.7647[-5.1999-2.3295]-0.6618[-2.09700.7734]-5.0000[-13.36853.3685]-2.7500[-11.11855.6185]=0.9600F=31.2308P=0.0000=15.0053由表5.4可以看出:由表二可以看出:置信区间都包含零点,再看残差图图:图第1组和第23组数据出现异常,剔除后回归。再次回归,得到的数据见表5.2.2:参数参数估计值参数置信区间60.3492[47.554973.1435]-9.4786[-12.4356-6.5215]1.0011[-8.227710.2298]19.2994[9.344729.2541]2.1418[-9.101713.3853]0.4913[0.29850.6841]0.8599[-0.22921.9491]-3.2731[-4.4996-2.0466]-0.8718[-2.32190.5782]-2.9107[-9.63503.8136]-3.6429[-11.12803.8422]=0.9818F=59.3390P=0.0000=7.9468表5.5中增大,说明回归有效,只是置信区间仍然包含零点,观察残差图图5.2.2:只有第22组数据出现异常,剔除后再一次进行回归。回归所的数据如表5.2.3:参数参数估计值参数置信区间68.1995[54.797581.6014]-11.3881[-14.5394-8.2368]-4.6058[-14.24215.0304]13.0185[2.494023.5430]-2.1172[-12.64178.4073]0.5974[0.40190.7928]1.6088[0.42142.7962]-2.4120[-3.7599-1.0640]-0.3477[-1.69561.0002]0.7492[-6.04587.5442]-1.4151[-8.21015.3799]=0.9868F=74.6792P=0.0000=5.7386本此回归之后,的置信区间还是存在零点,继续进行残差分析,如图:图同样按照之前的步骤再进行回归,结果如下表5.2.4:参数参数估计值参数置信区间71.6544[62.126681.1821]-12.4291[-14.7077-10.1505]-5.9647[-12.68540.7559]11.4307[4.081718.7798]-6.4184[-14.19811.3613]0.6694[0.52660.8122]1.7661[0.93872.5934]-2.2165[-3.1571-1.2760]0.0013[-0.95710.9598]1.5797[-3.14956.3090]1.4122[-3.62216.4464]=0.9945F=162.1908P=0.0000=2.6629表5.7中增大,说明回归有效,只是置信区间仍然包含零点,但是接下来的循环回归我们发现,的增长数非常小,所以到这第二次回归就已经足够了,从开始假设的线性模型到四次回归,不难看出、F的变化情况,即:由此可以得出,最优模型为:5.3模型的结果分析将原模型和改良后的模型进行比拟,不难发现,改良后的模型要比原模型大得多,适用范围也就广得多,采用改良后的模型疗效更好也更平安,因此最正确模型为:使用该模型时,只需用把用药剂量、性别、血压组别所对应的数据代入模型,就可以得出服药病痛减轻的大概时间。六、模型评价、改良与推广6.1模型的评价6.1.1优点1.本文的模型在建立的过程中充分考虑到止痛药与病人的重要相关因素,得出我们建立的模型中的最正确模型。2.充分利用MATLAB等软件进行画图求证,所以误差较小,数据准确合理。3.该模型实用性强,对现实有较强的指导意义。4.在求解模型时屡次回归,直到无异常数据,因此该模型准确度高。6.1.2缺点1.本文在解决问题中使用的数据大局部为实验值,本身存在误差,我们没有使用实际数据进行检验。2.在模型建立中,所建模型相对复杂,与建模要求中模型的简单、明了不符。6.2改良与推广1.我们建的模型不仅可用于医药公司新药的推广,也可用于其它资源的安排,还可用于诸如像工资薪金模型的其它类型的问题。2.由于题目给出的统计数据不是很精确,如果我们能对统计的方法进行改良,估计时间可以更加精确。这个模型比拟接近现实,它很有实用价值,可以为以后其他新药的推广提供参考。七、参考文献[1]数学模型〔第四版〕.姜启源,谢金星,叶俊.北京,高等教育出版社,2011[2]张立军任英华,多元统计分析实验,北京,中国统计出版社,2009.3附录Y对x1的散点图>>x1=[222222555555777777101010101010];>>y=[354355474357262728292229191114232022138327265];>>plot(x1,y,'*');拟合曲线>>x1=[222222555555777777101010101010];>>y=[354355474357262728292229191114232022138327265];>>p=polyfit(x1,y,2);>>x1x1=linspace(min(x1),max(x1));>>yy=polyval(p,x1x1);>>plot(x1,y,'o',x1x1,yy);Y对x2的散点图>>x2=[000111000111000111000111];>>y=[354355474357262728292229191114232022138327265];>>plot(x2,y,'*')Y对x3的散点图>>x3=[0.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.75];>>y=[354355474357262728292229191114232022138327265];>>plot(x3,y,'*');首次回归:>>x1=[222222555555777777101010101010];x2=[000111000111000111000111];x3=[0.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.75];y=[354355474357262728292229191114232022138327265];x=[ones(24,1),x1',x2',x3',(x1.^2)'];>>[b,bint,r,rint,stats]=regress(y',x,0.05)rcoplot(r,rint)%残差图5.1.1剔除第3和第24个异常数据再回归:>>x1=[222225555557777771010101010];x2=[0011100011100011100011];x3=[0.250.500.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.50];y=[354347435726272829222919111423202213832726];x=[ones(22,1),x1',x2',x3',(x1.^2)'];[b,bint,r,rint,stats]=regress(y',x,0.05)>>rcoplot(r,rint)%残差图5.1.2剔除第5个异常数据后再次回归:>>x1=[22225555557777771010101010];x2=[001100011100011100011];x3=[0.250.500.250.500.250.500.750.250.500.750.250.500.750.250.500.750.250.500.750.250.50];y=[3543474326272829222919111423202213832726];x=[ones(21,1),x1',x2',x3',(x1.^2)'];[b,bint,r,rint,stats]=regress(y',x,0.05)>>rcoplot(r,rint)%残差图5.1.3模型改良增加交互项后:首次回归:>>x1=[222222555555777777101010101010];x2=[000111000111000111000111];x3=[001001001001001001001001];x4=[010010010010010010010010];y=[354355474357262728292229191114232022138327265];x=[ones(24,1),x1',x2',x3',x4',(x1.^2)',(x1.*x2)',(x1.*x3)',(x1.*x4)',(x2.*x3)',(x2.*x4)'];>>[b,bint,r,rint,stats]=regress(y',x,0.05)>>rcoplot(r,rint)%残差图5.2.1剔除第1和第23个异常数据后再次回归:>>x1=[222225555557777771010101010];x2=[0011100011100011100011];x3=[0100100100100100100101];x4=[1001001001001001001000];y=[43554743572627282922291911142320221383275];x=[ones(22,1),x1',x2',x3',x4',(x1.^2)',(x1.*x2)',(x1.*x3)',(x1.*x4)',(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年广东省普通高等学校招收中等职业学校毕业生统一模拟考试语文题真题(解析版)
- 寒冷性脂膜炎的临床护理
- 鼻窦压痛的健康宣教
- 2021年工业机器人行业埃斯顿分析报告
- 汗孔角化病的临床护理
- 声音嘶哑的健康宣教
- 糖原贮积病Ⅱ型的临床护理
- 《酒店礼仪知识培训》课件
- 黑色素沉着的临床护理
- JJF(陕) 041-2020 宽带采集回放系统校准规范
- 2024秋国家开放大学《马克思主义基本原理》专题测试1-8参考答案
- 新概念英语第二册33课市公开课获奖课件省名师示范课获奖课件
- 企业国际化经营战略规划与实施方案
- 3.3-栈的应用-迷宫求解解析
- 慢性肾衰竭血液透析患者的流行病学调查分析
- 大学生体质健康标准与锻炼方法(吉林联盟)智慧树知到期末考试答案章节答案2024年东北师范大学
- 任职资格体系3-某公司营销销售族销售、供应、客服和职能任职资格
- 2012电池制造行业分析报告
- 2024年军队文职统一考试《专业科目》管理学试卷(网友回忆版)
- JT-T-973-2015路用非氯有机融雪剂
- 物业工作未来规划与展望
评论
0/150
提交评论