




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第17讲MedicalIR医疗信息检索12021/10/09提纲2
MedicalIR简介
TRECCDS任务简介
常用CDS方法介绍
DNRMforCDS提纲3
MedicalIR简介
TRECCDS任务简介
常用CDS方法介绍
DNRMforCDSMedicalIR简介有很多时候,为了更加准确地做出医疗决策,医生可能需要查阅一些相关的医疗文献。考虑到现有医疗文献的数量以及其增长的速度,快速而准确地定位所需要的医疗文献变得非常重要。MedicalIR的目标就是根据医生的信息需求〔如电子病历〕,从海量医疗文献中找到尽可能多的相关文献。与一般的IR任务〔如Web检索〕相比,MedicalIR任务的查询和文档长度都相对长很多;MedicalIR任务的查询和文档都较多地包含医疗领域特定的词汇和概念。4提纲5
MedicalIR简介
TRECCDS任务简介
常用CDS方法介绍
DNRMforCDSTRECCDS任务目的:使医疗信息更加容易获取,以及让电子病历(EHR)的使用变得更加有意义。TRECClinicalDecisionSupport(CDS)2021&2021A给定电子病历(EHR)作为查询,参赛者需要返回相关的医疗文献以满足查询所包含的信息需求。查询分为如下三类,每类表示不同的需求类型:Diagnosis::Whatisthepatient’sdiagnosis?Test:Whattestsshouldthepatient’sreceive?Treatment:Howshouldthepatientbetreated?
6常用CDS方法查询扩展:基于伪相关反响基于外部资源:如MeSH、DBpedia以及UMLS,一般直接将扩展词/概念参加到查询中,或者给予扩展词/概念更高的权重基于Google检索结果:从排名靠前的(如前10篇)的标题、摘要或者文档提取扩展词/概念将查询类型(Diagnosis,Test,Treatment)作为扩展词参加查询Fusion:对多个检索模型的结果进行合并基于检索模型评分进行fusion基于排序进行fusion使用专门针对长文档的检索模型:如SPUD9常用CDS方法考虑查询类型信息:首先训练分类器(如对Diagnosis和非Diagnosis分类),然后对初始检索结果进行分类,根据分类得分有一个排序,该排序可以与初始检索结果排序进行fusion。Re-ranking:基于learning-to-rank:用BM25、PL2和BB2等模型评分作为feature,用randomforest学习pointwise排序模型,或者用RankSVM学习pairwise排序模型,再用学习到的模型对初始检索结果重排基于position:根据位置信息为文档计算一个权重,并与初始评分求和,再对初始检索结果进行重排序引入语义信息:通过计算查询与文档之间的语义相似度评分,然后将该评分与初始检索评分进行插值,最后对初始检索结果进行重排10提纲11
MedicalIR简介
TRECCDS任务简介
常用CDS方法介绍
DNRMforCDS基于DNN的方法-DNRM考虑到查询包含的信息较少, 直接计算查询与文档之间的相似度不能到达很好的效果;现有的基于DNN的比较有效的检索模型都需要计算查询与文档的单词-单词相似度矩阵,计算复杂度较高;并且不考虑反响信息,检索效果也会受到一定影响;DNRM引入了两种相似度特征,一是查询词与文档的相似度,二是伪相关反响文档之间的相似度,然后通过多层感知机(MLP)学习一个评分,一定程度上克服了上述的两个问题。12IR:一个比照排序的问题哪个卡通形象更可爱?〔哪个文档更相关?〕转化为一个相似度计算的问题哪个与“标准答案〞更近似?DNRM根本思想将文档评分转化为一个与“标准答案〞计算相似度问题D2Q〔文档-查询〕相似度是一种弱匹配信号相对于文档,查询太短,覆盖的信息太少文档间相似度是一种“软匹配〔softmatching〕〞,考虑了文档的所有内容事实上一篇文档是否相关是由其内容决定的,而不是是否包含查询关键字“标准答案〞由K个初始排名靠前的文档组成将待评分文档与这K个文档的相似度作为K维特征输入一个前馈网络前馈网络输出最终文档评分YanhuaRanetal.ADocument-basedNeuralRelevanceModelforEffectiveClinicalDecisionSupport.BIBM2021.Toappear.模型结构 给定查询q和待排序文档d,Dq是q的伪相关反响文档集;通过计算待排序文档d与各查询词qt的相似度得到D2Q特征,通过计算d与伪相关反响文档文档di的相似度得到D2D特征;之后将D2Q特征和D2D特征分别输入到各自的MLP结构得到一个标量评分,然后将这两个评分合并得到最终语义评分,再将语义评分与初始检索模型评分线性插值得到最终评分。
DNRM模型结构DNRMforCDS
实验设置与baselines的比较:BM25,SEM-QD,DRMMDNRM模型多个变种的比较:只使用D2Q评分(DNRMQ);只使用D2D评分(DNRMD);D2D评分且与BM25插值(DNRMD-λ);使用D2Q与D2D评分且与BM25插值(DNRMDQ-λ)
DNRMforCDS
DNRMforCDS
实验结果实验结论:在大局部情况下,DNRMD-λ以及DNRMDQ-λ比baselines效果要好;对于长查询(Description)而言,总体上DNRMDQ-λ要比DNRMD-λ效果要好。DNRM模型能够取得优于BestTRECRun的结果参考文献SimpsonMS,VoorheesEM,HershW.Overviewofthetrec2021clinicaldecisionsupporttrack[R].LISTERHILLNATIONALCENTERFORBIOMEDICALCOMMUNICATIONSBETHESDAMD,2021.RobertsK,SimpsonMS,VoorheesEM,etal.OverviewoftheTREC2021ClinicalDecisionSupportTrack[C]//TREC.2021.YangC,HeB.Anovelsemantics-basedapproachtomedicalliteraturesearch[C]//BioinformaticsandBiomedicine(BIBM),2021IEEEInternationalConferenceon.IEEE,2021:1616-1623.Balaneshin-KordanS,KotovA,XistoR.WSU-IRatTREC2021clinicaldecisionsupporttrack:Jointweightingofexplicitandlatentmedicalqueryconceptsfromdiversesources[R].WayneStateUniversityDetroitUnitedStates,2021.SongY,HeY,HuQ,etal.Ecnuat2021cdstrack:Twore-rankingmethodsinmedicalinformationretrieval[C]//Proceedingsofthe2021TextRetrievalConference.2021.参考文献ChoiS,ChoiJ.SNUMedinfoatTRECCDStrack2021:Medicalcase-basedretrievaltask[R].SEOULNATIONALUNIV(REPUBLICOFKOREA),2021.CumminsR.ClinicalDecisionSupportwiththeSPUDLanguageModel[C]//TREC.2021.AbachaAB,KhelifiS.LISTatTREC2021ClinicalDecisionSupport
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 男女朋友搞笑合同协议
- 电力运维培训合同协议
- 2025至2030年中国立式小型上糊机数据监测研究报告
- 2025至2030年中国砂鼓砂套数据监测研究报告
- 2025至2030年中国电子自动数粒机数据监测研究报告
- 2025至2030年中国海棠王五号数据监测研究报告
- 2025至2030年中国泵配件数据监测研究报告
- 2025至2030年中国水洗营养面膜数据监测研究报告
- 2025至2030年中国桌缘户西刀数据监测研究报告
- 计算机及网络使用中应注意的保密问题
- 2024届清华大学强基计划数学学科笔试试题(附答案)
- 5、科技成果转化的组织实施与激励奖励制度
- 全国统一规范电子税务局概况介绍及操作辅导
- 工商企业管理毕业论文范文(4篇)
- 浙江省杭州市(2024年-2025年小学三年级语文)人教版开学考试(上学期)试卷(含答案)
- VDA6.3 2023 过程审核检查表-参考表单
- 【网络谣言型寻衅滋事罪的认定存在的争议探析8600字(论文)】
- 2024延迟退休政策详解
- IC反应器的设计11
- IEEE-30节点全套数据2
- 施工现场安全隐患检查表
评论
0/150
提交评论