![基于数据挖掘技术的医保欺诈行为的主动发现_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-2/17/0add4b70-babb-495e-9fc6-23a02936e9c2/0add4b70-babb-495e-9fc6-23a02936e9c21.gif)
![基于数据挖掘技术的医保欺诈行为的主动发现_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-2/17/0add4b70-babb-495e-9fc6-23a02936e9c2/0add4b70-babb-495e-9fc6-23a02936e9c22.gif)
![基于数据挖掘技术的医保欺诈行为的主动发现_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-2/17/0add4b70-babb-495e-9fc6-23a02936e9c2/0add4b70-babb-495e-9fc6-23a02936e9c23.gif)
![基于数据挖掘技术的医保欺诈行为的主动发现_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-2/17/0add4b70-babb-495e-9fc6-23a02936e9c2/0add4b70-babb-495e-9fc6-23a02936e9c24.gif)
![基于数据挖掘技术的医保欺诈行为的主动发现_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-2/17/0add4b70-babb-495e-9fc6-23a02936e9c2/0add4b70-babb-495e-9fc6-23a02936e9c25.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于数据挖掘技术的医保欺诈行为的主动发现【摘 要】随着数据挖掘技术的不断开展与成熟,对数据挖掘的研究和应用逐渐深化到各个行业。在医疗保险领域,医保诈骗的现象时有发生,造成医药基金的损失,损害广阔参保人的利益。运用数据挖掘技术,构建较为完好的医保数据仓库,实现医保信息化的构建,进而更为高效的使用和管理医保基金。本文通过比照研究病人的所购药品金额和药品数量,结合医嘱时间,病人科室等工程,利用EXCEL,SPSS进展数据的挑选整理及描绘性统计分析,建立检测模型,挑选出异常值。异常值的检测即为主动发现医疗欺诈检测。【关键词】数据挖掘技术;医保欺诈一、问题背景一关于医保欺诈的手段分析医保欺诈及违规行为主
2、要分为医疗保险参保患者需方的欺诈、违规行为,医疗保险效劳供方医疗机构和药店和参保患者合谋的欺诈、违规行为,医疗保险效劳供方的欺诈、违规行为。根据表格数据工程和特点,主要可以发现以下医保欺诈行为:1.冒名顶替。是指非参保患者以其他参保人身份在定点医疗机构就医,包括门急诊、住院、加床等。详细在数据中的表达为:同一个人持多张医保卡就医。2.贩卖药品。指医保患者通过医保卡多看病,多取药的方法,然后将药品贩卖,到达骗取医保基金的目的。二医保数据挖掘我们通常将数据挖掘的任务主要分为描绘和预测两大类。预测任务是通过一些自变量属性为目的建立模型,用自变量的取值来预测目的变量的取值。描绘任务那么是对数据潜在联络
3、或形式的概括,包括关联分析,聚类,异常检测等。此题主要是针对医保欺诈的检测。欺诈检测是医保基金风险防控中重要的一项任务,通常根据专家知识分析可能的欺诈行为,并利用数据挖掘算法进展检测和验证。二、识别医保欺诈行为一识别单次购药金额高且购药数量多和单次购药金额过高但购药数量少的行为在医疗保险的诈骗过程中,骗保人会反复使用医保卡购置药品,再将购置的药品以高价出售,以此牟利。因此,当某位患者单次购药金额高且屡次购药或者虽然购药数量少但单次金额过高,那么意味着该患者有恶意骗保的可能。1.识别单次购药金额高且购药数量多的行为1数据挑选。在费用明细中,只保存病人ID、药品数量和总价格。2数据排序,数据分组。
4、将病人ID及按升序排列,对每一个病人购置药品数量和总价进展单独分析。3通过数据透视表将属于同一病人ID的药物费用加总。用=COUNTIF函数计数,用=SUMIF函数进展加和。1将同一病人ID下各药品价格加总,即可求出单次购置药品的金额。将同一病人ID所对应的各药品数量加总,即可求出单次购置药品的数量。对“费用明细中药品价格,购药种类,每种药品的数量等数据带入上述公式进展计算,得出每位患者单次购药的总价格和药品总数量。2运用SPSS对单次购置的药品金额进展描绘性统计,取显著性程度= 1%,按照“经历法那么约有99%的样本值的平均数落在±3个标准差的置信区间内,置信区间的上限为175.6
5、480。超出该范围的部分认为有诈骗的嫌疑。结论:经过上述挑选过程后,可以识别出具有诈骗嫌疑的病人ID。经过挑选,大约有28.62%的病人有该种诈骗嫌疑。2.识别单次购药金额过高且购药数量少的行为在医疗诈骗中,单次购药金额过高同时购药数量少的诈骗手段也常见。类似解决上一问的做法,本文从药品总价和药品数量入手,挑选出异常值。以此确定存在医疗诈骗行为的病人ID。1首先,对药品购置金额按照降序排列,利用SPSS制作药品购置金额的散点图,如图表组合二,观察其特点。发现异常值大概在前1%左右,这些异常值可能是由医疗诈骗行为导致的。2再从药品购置数量中挑选出低于428的数据,与1%的异常值取交集,即可得到采
6、取单次购药金额过高且购药数量少手段的病人ID。分析结果如下表所示。结论:使用上述方法,可以找到在医疗过程中,单笔金额过高且数量少的数据所对应的病人ID,通过核实病例信息,医嘱子类,可以最终确定医疗诈骗行为,结果显示,该部分的嫌疑人数量占到0.999%。二识别同一人持有不同医保卡购药的行为在医疗诈骗的过程中,通过借取,租用多张医保卡,反复购置药品再出售牟利,也是一种常见的手段。这种方法由于病人ID不同,较难区分而更加隐蔽。本文假设,由于个人身体条件差异导致对药物数量的需求差异较大,且不同种类药物单价也不一样。因此,每次就医所购置的药品总金额应当具有一定差异。当出现药品总金额一样的情况时,那么视为具有医疗欺诈的嫌疑。这里使用雷同价格挑选法。统计一样金额出现的频数,并按其大小进展降序排列。1将一样的药品总金额及其对应的频数列成表格2将频数按降序排列4通过对药品金额进展描绘性统计,从频数发现一样金额出现次数在七次以内的占总体的95.3%。可知,由于病人的医疗行为具有独立性,且不同种类药物之间单价差距大,在不同患者的医疗过程中,药品总金额大量一样的频率比较低。假设将金额
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第10课 古代的村落、集镇和城市 教学设计-2024-2025学年高二历史统编版(2019)选择性必修2
- 第9课《为家庭开销做预算》(教学设计)长春版四年级下册综合实践活动
- 全国泰山版初中信息技术七年级下册第四章第二节《计算数据》教学设计
- 全国上海科教版初中信息技术七年级第一学期第一单元活动二《获取并鉴别信息》教学设计
- 第2课 俄国的改革(教学设计)-2024-2025学年九年级历史下册素养提升教学设计(统编版)
- 第8课 欧洲的思想解放运动 教学设计-2024-2025学年高一历史统编版(2019)必修中外历史纲要下册
- 2025年水及电解质平衡调节药项目合作计划书
- 综合性学习:岁月如歌-我们的初中生活(教学设计)九年级语文下册同步高效课堂(统编版)
- 11 宇宙生命之谜 教学设计-2024-2025学年统编版语文六年级上册
- 18文言文二则《铁杵成针》教学设计-2023-2024学年语文四年级下册统编版
- 出租共享菜园合同范例
- 八年级班主任学生心理健康计划
- 2025年第六届全国国家版图知识竞赛测试题库及答案
- 2025年三方买卖协议标准版本(2篇)
- 【历史】唐朝建立与“贞观之治”课件-2024~2025学年统编版七年级历史下册
- 2025年度文化演艺代理合作协议书4篇
- 2024化工园区危险品运输车辆停车场建设规范
- 05G359-3 悬挂运输设备轨道(适用于一般混凝土梁)
- 第一章 公共政策分析的基本理论与框架
- 云南省地质灾害群测群防手册
- 部编人教版二年级道德与法治下册全册教案+知识点总结
评论
0/150
提交评论