基于关键词共现的国内国际疾病分类领域研究热点分析(修改稿)_第1页
基于关键词共现的国内国际疾病分类领域研究热点分析(修改稿)_第2页
基于关键词共现的国内国际疾病分类领域研究热点分析(修改稿)_第3页
基于关键词共现的国内国际疾病分类领域研究热点分析(修改稿)_第4页
基于关键词共现的国内国际疾病分类领域研究热点分析(修改稿)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于关键词共现的国内国际疾病分类领域研究热点分析【摘要】目的 探讨国内国际疾病分类领域的研究主题和热点。方法 利用因子分析法、聚类分析法、多维尺度分析法和社会网络分析法对该领域的高频关键词共现矩阵进行分析。结果及结论 依据因子分析法提取的10个公因子将该领域的研究主题聚为10个类,同时利用多维尺度分析绘制主题图谱;社会网络分析结果表明利用病案信息研究医疗付费方式是该领域的核心主题,这一主题也将是该领域的未来研究趋势。【关键词】共词分析法;社会网络分析法;国际疾病分类;主题分类;核心主题1研究背景及问题疾病分类是病案信息管理的重要工具,目前世界上最为普及的分类方案当数国际疾病分类(Interna

2、tional Classification of Diseases,简称ICD)1。我国使用ICD已有20多年,众多学者对其进行了探讨与交流,随之涌现出大量文献,对这些文献进行统计分析可以了解该领域的学术热点及其发展趋势。国内利用文献计量分析法对ICD相关文献进行分析的论文数量甚少。2007年张浩等人2对2004-2006年内的文献通过频数进行定量分析。2008年崔雷教授3利用聚类分析探讨了2007年之前的研究热点。这些研究采集的数据均在2007年之前,且研究方法单一。故笔者欲采用共词分析法和社会网络分析法,多角度探讨该领域的研究主题。共词分析法,主要通过统计关键词两两之间在同一篇文献中出现的

3、频率,形成共词网络,进而揭示学科的发展动态 4。社会网络分析法是将关键词作为节点,共现关系构成节点间的连线,以构建社会网络关系图谱,进而发掘出关键词之间的关系5。关键词是作者学术思想及学术观点的凝结 6,两个关键词在同一篇文献中同时出现称为关键词共现。故笔者选取国内国际疾病分类领域相关文献,通过分析关键词共现矩阵来揭示该领域的研究热点。2数据来源及处理2.1数据来源为了尽可能保证查全率,以“疾病编码、疾病分类、ICD-10编码、ICD-10、ICD-10编码质量、ICD分类、双重编码、ICD植入术、ICD-9、ICD-9-CM-3、疾病分类编码、主要编码、疾病分类统计、手术操作分类、疾病分类标

4、准、单病种、编码质量、编码员、编码工作、单病种付费、主导词、手术编码、手术名称、编码原则、诊断名称、ICD编码、手术操作、DRGs、疾病/ 分类、ICD-10主要诊断、ICD疾病编码、主要诊断编码、国际疾病分类、疾病分类报表”等34个词语为关键词在CNKI中进行检索(检索截止日期2012年12月4日),去掉重复文献、不相关文献(包括与该主题无关的文献、会议记录、会议通知等)和关键词缺失文献,剩余1345篇文献的关键词作为本文的研究对象。2.2数据预处理关键词是作者自行选择的自然语言,因此会存在一些不规范现象7,为了让研究结果更加准确,笔者采用归并、拆分、吸收和丢弃四种方法对关键词进行人工处理,

5、共得到2758个关键词,结合公式8,选取频次大于13的62个高频关键词,如表1所示: QUOTE 注:公式中I1代表频次为1的关键词的数量表1 高频关键词表关键词频次关键词频次关键词频次关键词频次国际疾病分类377主导词选择56精神障碍26剖宫产术15疾病分类366编码员素质55统计报表26临床表现15ICD-10334分类编码53循环系统疾病23编码质量15疾病编码200世界卫生组织46编码错误23主要症状14病案首页156ICD45疑难编码21脑血管病14ICD-9-CM-3139疾病构成分析45传染病21急性心肌梗塞14住院患者121病案管理人员42疾病构成比20根本死因14统计分析10

6、4医院管理37出院诊断20分类方法14ICD-9102诊断名称36推广使用19疾病名称13主要诊断选择100手术名称36形态学编码18编码步骤13病案管理99消化系统疾病35病死率18统计数据13疾病诊断84编码规则34诊断标准17解剖部位13临床医护人员80准确性31外部原因17肺源性心脏病13死因分析62呼吸系统疾病29临床诊断17并发症13恶性肿瘤59疾病分类统计28DRGs16损伤和中毒59病案室27医疗保险162.3构建共现矩阵通过统计高频关键词两两共现情况,得到一个6262的对称矩阵,非主对角线上的值Cij为关键词的共现频次,主对角线上的值取最大值+1。以频次构建的原始矩阵反映的是

7、一种绝对的表象,要想真正揭示关键词之间的共现关系,还需要引入关键词共现相对强度指标,故笔者采用Dice指数对关键词进行包容化处理,将原始矩阵转化为相似矩阵。Dice指数9-10可以直观地反映出两个词之间的相似程度,计算公式为: QUOTE 注:公式中Cij表示关键词i和j的共现频次,Ci和Cj分别表示关键词i和j的频次。得到的相似矩阵中近似于0的值过多,为稀疏矩阵,为方便后续分析,笔者用1与相似矩阵中的全部数据相减,得到相异矩阵。相异矩阵中的值越大表示关键词对的关系越不密切,反之关系越密切。2.4分析方法和工具本文采用的分析方法主要有因子分析法11、聚类分析法12、多维尺度分析13和社会网络分

8、析法14。其中前3种分析方法主要通过SPSS17.0来实现,而社会网络分析法通过UCINET来完成。3研究结果分析3.1类数的确定利用SPSS17.0对上述相似矩阵进行因子分析,结果见表2。按照提取因子的方差累积百分比超过60%的原则,结合表2可知,提取符合条件的因子个数为10,这10个因子的方差累积贡献率为62.545%,即这10个因子能够解释全部信息的62.545%,由此确定主题类数为10类。表2 相似矩阵因子分析结果(部分)成份初始特征值合计方差的 %累积 %111.65018.79018.79026.79010.95129.74133.7175.99635.73743.0834.973

9、40.70952.7344.41045.12062.6404.25749.37772.3283.75453.13182.1043.39456.52591.9583.15759.682101.7752.86262.545 3.2聚类结果分析依据上述因子分析结果,将关键词相似矩阵采用快速聚类法聚为10类,结果见表3。表3 高频关键词聚类结果类数包含关键词第一类ICD、ICD-10、ICD-9、ICD-9-CM-3、损伤和中毒、外部原因、疾病编码、分类编码、国际疾病分类、疾病分类、分类方法、推广使用、世界卫生组织第二类主要诊断选择、主导词选择、编码规则、编码步骤、准确性、编码错误、编码员素质、编码质

10、量第三类住院患者、临床表现、主要症状、出院诊断、诊断标准、临床诊断、疾病名称、诊断名称、疾病诊断、手术名称、临床医护人员第四类病案首页、病案管理人员、病案管理、病案室第五类肺源性心脏病、急性心肌梗塞、剖宫产术第六类传染病、脑血管病、精神障碍、恶性肿瘤、并发症、形态学编码、解剖部位第七类循环系统疾病、呼吸系统疾病、消化系统疾病第八类疑难编码第九类DRGs、医疗保险第十类疾病构成比、疾病构成分析、疾病分类统计、统计分析、统计数据、病死率、死因分析、根本死因、统计报表、医院管理 为了更直观地展示聚类结果,笔者对上述构建的相异矩阵进行多维尺度分析,以构建主题图谱如图1所示。图1 多维尺度分析结果由聚类

11、分析和多维尺度分析结果可知,该领域的研究可以分为10个大类,各类所包含的关键词详见表3。第一类由13个关键词组成,表达了ICD的基本情况,这与我国使用的国际疾病分类是由世界卫生组织出版的ICD编译而成这一事实密切相关,学者主要探讨ICD的基本情况,让更多人认识ICD。第二类由8个关键词组成,主要介绍了编码人员在使用ICD时的重点注意事项。第三类由11个关键词组成,是ICD的临床影响因素。第四类由4个关键词组成,是对病案管理的研究。ICD是病案首页规范化、标准化的基础,可以使病案管理更具科学性和系统性。第五类由3个关键词组成,是指临床两种常见单病种及产科多种剖宫产术式在ICD中的广泛应用。第六类

12、由7个关键词组成,其中形态学编码和解剖部位都与恶性肿瘤相关,体现了恶性肿瘤的编码因形态学和解剖部位的不同而有所差异。由此可以看出,传染病、脑血管病、精神障碍和恶性肿瘤及其引起的各种并发症的编码是学术界关注的热点话题。第七类由3个关键词组成,主要探讨循环、呼吸和消化3方面系统性疾病的编码。第八类包含了疑难编码一个关键词,表明探讨某一疑难疾病如何编码或某种疑难杂症的编码体会也是学术界关注的热点话题,多为病案编码人员对自己编码工作的总结。第九类由DRGs和医疗保险两个关键词组成,体现了对病案信息利用的研究。DRGs(诊断相关分组)旨在利用ICD对医疗费用进行控制,依据病人住院所需的医疗服务数量及资源

13、消耗强度对病人进行分类,同一DRGs组中的每个病人,保险机构均按固定支付标准支付给医院,而不再按实际医疗费用来支付。这一类是目前的研究热点,同时也将是未来的研究趋势。第十类由10个关键词组成,体现了ICD在疾病统计及医院管理中的应用。ICD在编制和使用中都以满足统计需要为前提,Janssen F.15曾指出,ICD编码的变化可以在特定疾病长期死亡率统计趋势中导致巨大的变化。同时,通过疾病统计生成的各种统计报表,可以为医院管理提供宏观指导,也将继续是学术界关注的热点。3.3核心主题分析通过共词分析确定了该领域的研究热点为10大类,笔者借助社会网络分析法探讨10类主题之间的联系。将上述构建的原始矩

14、阵依据类所包含的关键词转化为类间共现矩阵,利用UCINET绘制社会网络关系图谱如图2,其中节点的大小代表该主题在整个网络中的地位,节点越大越接近中心地位,属于核心主题。图2 各主题的社会网络关系图由图2可以看出,第九类和第三类是整个网络的核心节点,其中前者与图中所有节点都有联系,核心地位更为突出。表明在医疗费用持续上涨带来财政支出压力不断增大的环境下,我国医疗管理部门及学者对医疗费用支付体系的研究越来越重视,相应地目前世界范围内运用较成熟的按诊断分类与定额付费制(DRGs-PPS)的医疗付费方式引起了众多学者的关注。由于医疗费用支出日益高涨,符合我国国情的DRGs研究将是今后我国学者继续努力的

15、方向。4结论本文利用共词分析法和社会网络分析法探讨了国内国际疾病分类领域的研究热点及核心主题,结果表明,该领域的热点主要分为10类,其中利用病案信息研究医疗付费方式是目前学术界关注的热点,同时也将是该领域的未来研究趋势。参 考 文 献1 刘爱民.病案信息学M.北京:人民卫生出版社,2009,223-2322 张浩,赵宇,陶翠.国内近3年国际疾病分类研究文献的计量分析J.中国病案,2007,8(9):8-103 张浩,苏晗,崔雷.利用共词聚类分析法探讨国际疾病分类相关研究文献的热点J.医学信息学杂志,2008(8):10-144 钟伟金,李佳.共词分析法研究(一)共词分析的过程与方式J.情报杂志

16、,2008,27(5):70-725 朱庆华,李亮.社会网络分析法及其在情报学中的应用J.情报理论与实践,2008(2):179-1836 郭树行,谈斯奇.关键词共现研究趋势分析J.科技资讯,2011(32):204-2057 唐伟.基于关键词共现的国内用户研究主题探讨J.知识管理论坛,2013(2):16-228 Donohue,J.C.Understanding scientific Literature:A Bibliographic Approach,The MIT press,cambridge,19739 吴晓秋,吕娜.基于关键词共现频率的热点分析方法研究J.情报理论与实践,201

17、2,35(8):115-11910齐彬,吕婷. 共现分析技术在生物医学信息文本数据挖掘中的应用J.中华医学图书情报杂志,2009,18(3):41-4311Dhanarai C,Lyles M A. Managing tacit and explicit knowledge transfer in IJVs:The role of relational embedded mess and the impact on performanceJ.Journal of International Business Studies,2004,35(3):428-44212韩永青,黄科舫.基于聚类技术的政务信息资源整合研究J.图书情报工作,2010,54(8):11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论