数字媒体学院考博_第1页
数字媒体学院考博_第2页
数字媒体学院考博_第3页
数字媒体学院考博_第4页
数字媒体学院考博_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

张远鹏

102952014040117考生介绍江南大学2014年报考攻读博士学位研究生普通招考生PPT目录1. 基本信息2. 学习经历主要研究工作及成果攻读博士期间的科学研究计划基本信息姓名张远鹏

性别男

(电子照片)政治面貌

群众出生年月1984.10.12联系电话

报考类别定向

报考学院数字媒体报考专业

轻工信息技术报考导师(组)

王士同研究方向轻工信息技术

最后学历

研究生最后学位硕士外语语种及水平英语,CET6

外国语

考试

□申请免试

√参加考试本科毕业学校

安徽师范大学学校层次

省重点本科专业计算机科学与技术

硕士毕业学校江南大学

学校层次

211硕士专业计算机应用技术

学习经历2002.09-2006.07安徽师范大学计算机科学与技术专业2006.09-2008.08江南大学计算机应用技术专业2008.08-2009.08中国船舶重工业集团第723所2009.08-南通大学医学信息学系主要研究工作及成果论文成果:张远鹏,凌利峰,耿兴云等.关联规则在电子健康档案系统中的应用[J].中国数字医学,2011,4张远鹏,董建成,耿兴云等.区域电子健康档案系统的分布式应用程序框架模型研究[J],医学信息学杂志,2011,2张远鹏,董建成,耿兴云等.NET分布式技术在电子健康档案系统中的应用[J].中国数字医学,2010,10YuanpengZhang,

KuiJiang,

JianchengDong.NegationDetectioninChineseElectronicMedicalRecordBasedonRulesandWordCo-occurrence[C].FrontierandFutureDevelopmentofInformationTechnologyinMedicineandEducation,Volume269,

2014,

pp2215-2220张远鹏,王理,董建成.基于规则和词共现的中文电子病历否定检出[J].计算机应用与软件.已录用课题成果:2009.09-2012.09南通市科技计划项目《基于社区医疗卫生服务的居民健康档案应用平台建设》(XA2009001-1),排名第四,已经验收结题2011.12-2013.12南通大学自然科学基金《基于关联规则的电子健康档案海量数据的挖掘》,排名第一,在研2013.05-2014.12)江苏省教育科学研究院《高校思政课虚拟实验室建设的研究与实践》(2013-R-24890

)排名第三,在研2012.09-2015.09国家自然科学基金《基于Web的居民电子健康档案数据共享平台研究》(81271668)排名第八,在研攻读博士期间的科学研究计划一、自我评价本人2008年8月从江南大学信息工程学院硕士毕业以后,就职于中国船舶重工业集团公司第723研究所,主要从事软件开发工作,先后参与了多项重大国防军工项目的研发工作,如:(1)***型舰显控分机的操作和控制软件研发;(2)***型舰显控分机的数据接口软件的研发;(3)***型舰显控分机触控键盘软件的研发;(4)***型舰双搜索雷达协同控制软件的研发。目前,这些软件已经投入到舰船实际应用。

2009年8月,为了解决和妻子的两地分居,离开723所,就职于南通大学医学信息学系,从事该专业的教学和科研工作。直至今日,主要的开发和科研工作如下:(1)参与南通市重大科技创新项目《南通市居民电子健康档案共享平台》的研发工作;(2)参与2012年度国家自然科学基金面上项目《基于Web的居民电子健康档案数据共享平台研究》的申报,并立项(基金号:81271668);(3)主持南通大学2011年度校级自然科学研究项目《基于关联规则的电子健康档案海量数据挖掘》;(4)参与2013江苏省教育科学研究院课题《高校思政课虚拟实验室建设的研究与实践》申报,并立项;(5)主持南通大学杏林学院(独立学院)自然科学研究项目《.NET平台的区域电子健康档案系统的分布式应用程序框架模型研究》;(6)主持南通大学杏林学院(独立学院)教育研究项目《以社区医疗服务信息化为导向的全科医学专业教学改革》。攻读博士期间的科学研究计划二、攻读博士期间的科学研究计划本人目前就职于南通大学医学院医学信息学系,所以希望在博士期间,能够完成和医学信息学相关方面的研究。而目前文本中命名实体的识别是人工智能研究的一个重要领域,所以希望能够结合自己的工作背景,从中文电子病历文本中,完成对命名实体的识别工作。随着临床信息化的发展,电子病历开始在临床中逐渐普及,如何智能地利用其中的信息也越来越受到关注,不少临床决策支持系统(clinicaldecisionsupportsystem,CDSS)都将电子病历作为重要的知识来源。然而,以自然语言形式存在的病历信息成为信息智能利用的障碍,如何让计算机自动汇总患者信息,构建和挖掘大型临床数据库以服务于临床决策,成为临床信息化所亟需解决的问题。攻读博士期间的科学研究计划二、攻读博士期间的科学研究计划在病历中,命名实体的类别繁多,除了时间、人名、组织机构等常见的实体类别外,还有疾病、症状、手术操作、病因、病理、药品等特有的实体类别。目前,命名实体的识别方法主要有3种:基于词典的方法、基于规则的方法、基于机器学习的方法。基于词典的方法,需要建立具有广泛覆盖性的命名实体词典,并添加相应的个类,如缩写、同义词,变形词甚至通常错误词等注释内容,配合相应的匹配算法来实现对于文本中命名实体的识别,其缺陷是对于出现的新命名实体缺乏兼容能力,往往存在覆盖率不足的问题,特别是在医学领域,术语量非常庞大,国内尚缺乏能够有效支撑自然语言处理能力的中文医学术语词典。基于规则的方法,虽然在一定程度上弥补了基于词典方法不能识别未收录词的缺陷,但是对于特定领域需要专业知识的工程师和专家来说,建立针对性的识别规则库,规则的制定不仅需要消耗大量的时间和人力,而且所制定的规则可移植性差。相对于前两种方法,基于机器学习的方法具有更好的实用性,通常基于标注过的语料进行训练,然后基于训练结果来智能完成对于命名实体的识别。因此,该方法具有很好的移植性,所以希望在读博期间,能从基于机器学习的方法上寻找突破口,提高识别率。攻读博士期间的科学研究计划二、攻读博士期间的科学研究计划在实体命名识别研究中,常用的机器学习模型包括支持向量机(supportvectormachine,SVM)、隐马尔可夫(hiddenMarkovmodel,HMM)、最大熵马尔可夫(maximumentropyMarkovmodel,MEMM)、条件随机场(CRF)等。1)支持向量机:将识别问题看作是一个分类问题,通过构造一个超平面,以超平面间的距离作为最大边缘来把训练实例分割为两类,因此主要处理二元分类。2)隐马尔可夫:是一种被应用得较早的模型,在语音识别中获得广泛应用,在生物医学领域的实体识别研究中也有使用。3)最大熵马尔可夫:是一种较早就被应用并对NER系统有较大促进的指数线性模型,它解决了隐马尔可夫的问题,可以任意选择特征,但由于其在每一节点都要进行归一化,所以只能找到局部的最优值,同时也带来了标记偏见的问题,凡是训练语料中未出现的情况全都忽略。4)条件随机场:只需要考虑当前已经出现的观测状态特征,没有独立性的严格要求,并很好地解决了MEMM的标注偏见问题。它并不在每一个节点进行归一化,而是对所有特征进行全局归一化,因此可以求得全局的最优值。此外,在小规模的训练数据上,它也获得了理想的效果。攻读博士期间的科学研究计划二、攻读博士期间的科学研究计划目前在生物医学领域,基于条件随机场得方法用的相对比较多,而且效果也比其他的方法理想。Tsai等利用CRF对GENIAV3.02中的5类实体进行识别,其中蛋白质的F值达70.2%,彭春艳等在相似的实验中达到了73.7%的F值,这两个实验都证明CRF优于其他机器学习模型。Leaman等对生物医学文献中的多类实体进行识别,总体F值达81.96%,其中疾病的F值仅为54.84%。而在其随后针对Arizona疾病语料库(ArizonaDiseaseCorpus,AZDC)的研究中,疾病的F值提升到了77.9%。同样,基于AZDC语料库,Faisal等则采用了一系列针对疾病量身定制的特征,达到了81.8%的F值。在中医学领域,王世昆等在数据清洗和特征空间降维的基础上,对中医病案中的病症和发病机理进行智能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论