基于数据挖掘技术的医保欺诈行为的主动发现_第1页
基于数据挖掘技术的医保欺诈行为的主动发现_第2页
基于数据挖掘技术的医保欺诈行为的主动发现_第3页
基于数据挖掘技术的医保欺诈行为的主动发现_第4页
基于数据挖掘技术的医保欺诈行为的主动发现_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于数据挖掘技术的医保欺诈行为的主动发现【摘 要】随着数据挖掘技术的不断开展与成熟,对数据挖掘的研究和应用逐渐深化到各个行业。在医疗保险领域,医保诈骗的现象时有发生,造成医药基金的损失,损害广阔参保人的利益。运用数据挖掘技术,构建较为完好的医保数据仓库,实现医保信息化的构建,进而更为高效的使用和管理医保基金。本文通过比照研究病人的所购药品金额和药品数量,结合医嘱时间,病人科室等工程,利用EXCEL,SPSS进展数据的挑选整理及描绘性统计分析,建立检测模型,挑选出异常值。异常值的检测即为主动发现医疗欺诈检测。【关键词】数据挖掘技术;医保欺诈一、问题背景一关于医保欺诈的手段分析医保欺诈及违规行为主

2、要分为医疗保险参保患者需方的欺诈、违规行为,医疗保险效劳供方医疗机构和药店和参保患者合谋的欺诈、违规行为,医疗保险效劳供方的欺诈、违规行为。根据表格数据工程和特点,主要可以发现以下医保欺诈行为:1.冒名顶替。是指非参保患者以其他参保人身份在定点医疗机构就医,包括门急诊、住院、加床等。详细在数据中的表达为:同一个人持多张医保卡就医。2.贩卖药品。指医保患者通过医保卡多看病,多取药的方法,然后将药品贩卖,到达骗取医保基金的目的。二医保数据挖掘我们通常将数据挖掘的任务主要分为描绘和预测两大类。预测任务是通过一些自变量属性为目的建立模型,用自变量的取值来预测目的变量的取值。描绘任务那么是对数据潜在联络

3、或形式的概括,包括关联分析,聚类,异常检测等。此题主要是针对医保欺诈的检测。欺诈检测是医保基金风险防控中重要的一项任务,通常根据专家知识分析可能的欺诈行为,并利用数据挖掘算法进展检测和验证。二、识别医保欺诈行为一识别单次购药金额高且购药数量多和单次购药金额过高但购药数量少的行为在医疗保险的诈骗过程中,骗保人会反复使用医保卡购置药品,再将购置的药品以高价出售,以此牟利。因此,当某位患者单次购药金额高且屡次购药或者虽然购药数量少但单次金额过高,那么意味着该患者有恶意骗保的可能。1.识别单次购药金额高且购药数量多的行为1数据挑选。在费用明细中,只保存病人ID、药品数量和总价格。2数据排序,数据分组。

4、将病人ID及按升序排列,对每一个病人购置药品数量和总价进展单独分析。3通过数据透视表将属于同一病人ID的药物费用加总。用=COUNTIF函数计数,用=SUMIF函数进展加和。1将同一病人ID下各药品价格加总,即可求出单次购置药品的金额。将同一病人ID所对应的各药品数量加总,即可求出单次购置药品的数量。对“费用明细中药品价格,购药种类,每种药品的数量等数据带入上述公式进展计算,得出每位患者单次购药的总价格和药品总数量。2运用SPSS对单次购置的药品金额进展描绘性统计,取显著性程度= 1%,按照“经历法那么约有99%的样本值的平均数落在±3个标准差的置信区间内,置信区间的上限为175.6

5、480。超出该范围的部分认为有诈骗的嫌疑。结论:经过上述挑选过程后,可以识别出具有诈骗嫌疑的病人ID。经过挑选,大约有28.62%的病人有该种诈骗嫌疑。2.识别单次购药金额过高且购药数量少的行为在医疗诈骗中,单次购药金额过高同时购药数量少的诈骗手段也常见。类似解决上一问的做法,本文从药品总价和药品数量入手,挑选出异常值。以此确定存在医疗诈骗行为的病人ID。1首先,对药品购置金额按照降序排列,利用SPSS制作药品购置金额的散点图,如图表组合二,观察其特点。发现异常值大概在前1%左右,这些异常值可能是由医疗诈骗行为导致的。2再从药品购置数量中挑选出低于428的数据,与1%的异常值取交集,即可得到采

6、取单次购药金额过高且购药数量少手段的病人ID。分析结果如下表所示。结论:使用上述方法,可以找到在医疗过程中,单笔金额过高且数量少的数据所对应的病人ID,通过核实病例信息,医嘱子类,可以最终确定医疗诈骗行为,结果显示,该部分的嫌疑人数量占到0.999%。二识别同一人持有不同医保卡购药的行为在医疗诈骗的过程中,通过借取,租用多张医保卡,反复购置药品再出售牟利,也是一种常见的手段。这种方法由于病人ID不同,较难区分而更加隐蔽。本文假设,由于个人身体条件差异导致对药物数量的需求差异较大,且不同种类药物单价也不一样。因此,每次就医所购置的药品总金额应当具有一定差异。当出现药品总金额一样的情况时,那么视为具有医疗欺诈的嫌疑。这里使用雷同价格挑选法。统计一样金额出现的频数,并按其大小进展降序排列。1将一样的药品总金额及其对应的频数列成表格2将频数按降序排列4通过对药品金额进展描绘性统计,从频数发现一样金额出现次数在七次以内的占总体的95.3%。可知,由于病人的医疗行为具有独立性,且不同种类药物之间单价差距大,在不同患者的医疗过程中,药品总金额大量一样的频率比较低。假设将金额

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论