版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、建立在医保欺诈中的应用模型摘要:本文围绕医保欺诈的识别而展开讨论,运用层次分析法和模糊综合评价相结合的方法对可能的医保欺诈进行判断。首先,对附件中大量数据进行筛选整理得到所需可用的数据。然后,根据层次分析法确定模型的准则层、方案层并确定各识别因子的权重。接着,结合模糊综合评价确立的各识别因子的隶属函数和医保欺诈度阈值,建立了医保欺诈识别模型,找出了可能的医保欺诈。对于医保欺诈的识别,首先运用EXCEL中数据透视表、VLOOKUP函数等对附件中多张表的大量数据进行筛选整理,提炼出病人ID号、性别、年龄、所对应的账单号、处方中药物的种类、单张处方费用、单张处方拿药次数、单张处方总费用、单张医保卡的
2、使用次数等与欺诈有关的数据。然后,根据层次分析法确定医保诈骗识别模型的准则层:单张医保卡使用次数和单张处方总费用,方案层:病人年龄、性别,处方中药物种类、单张处方费用、单张处方拿药次数,并确定各识别因子的权重 。接着运用模糊统计法确立各识别因子的隶属函数,并设定结点阀值作为检测判断的依据,最后,运用matlab语言对附件中的数据进行判断,得到可能的医保欺诈的数据。该模型可以在一定程度上可以识别医保诈骗。关键字:医疗保险;诈骗识别;层次分析;模糊综合评价一、问题重述医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况
3、等造成医疗保险基金损失的行为。骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。下面这些情况都有可能是医保欺诈:单张处方药费特别高,一张卡在一定时间内反复多次拿药等。请根据附件中的数据,找出可能的欺诈记录。注:数据中病人姓名、身份证号、电话号码、医保卡号为非真实数据。数据见2.1 2.2 2.3 2.4 2.5 2.6二、问题分析医疗保险是为补偿疾病所带来的医疗费用的一种保险,关系到国家民生和发展的重大问题,而从全国范围来看,医保欺诈呈逐年递增态势;医保欺诈不仅扭曲了保险定价机制,损害保险经营的最大诚信原则,而且还严重威胁医保基金安全,妨碍医保政策
4、的有效实施。因此寻找一种行之有效的欺诈识别尤为重要。在本题中,数据量巨大,同时欺诈样本及相关函数不易寻找,而层次分析法不依赖样本,同时可将定量与定性相结合,与题意相符,同时结合模糊综合评价会使结果更准确;因此,对于本题,运用层次分析法和模糊综合评价相结合的方法进行医保欺诈的判断。首先,初步确定刷卡次数多、高药费现象中存在医保欺诈的概率高,以此为标准运用数据透视表、vlookup等函数对附件中的数据进行删选整理,剔除掉数据缺失严重、信息与本模型无关的数据,最后得到变量包含医嘱项、医嘱子类、病人ID、性别、年龄、单价、医嘱数量、总额、账单号的Excel表格;然后,运用层次分析法确定医保欺诈模型的两
5、个一级指标:单张医保卡使用次数和单张处方产生的总费用,对应二级指标分别为:病人年龄、性别和药物种类数、单张处方费用、单张处方使用次数,构成医保欺诈识别体系;通过查阅资料构造成对比较阵,并计算其权向量进行一致性检验,确定有效矩阵。然后运用模糊综合评价的思想,结合资料,建立各二级指标的隶属度函数,根据所占权重最大的指标确定欺诈阈值,将整理所得数据运用matlab进行计算输出,得到可能存在欺诈的数据。最后对模型进行检验,对模型进行分析和改进。三、模型假设1、医保欺诈只是患者单方面行为,不存在医患合谋和医疗机构“引至欺诈”情况;2、单张处方产生总药费越高越有欺诈可能;1、 单张卡在一定时间内配药次数越
6、多越有欺诈可能;4、数据准确、真实、不存在错误记录情况。四、符号说明符号含义续表2个一级指标i=1,25个二级指标i=1,2j=1,2,33个成对比矩阵i=1,2,3矩阵i行j列的数值=矩阵按行求和矩阵的最大特征值W5个指标最终权重CI一致性检验指标 RI随机一致性指标CR一致性比率t1欺诈程度阈值五、模型的建立与求解 5.1 模型的准备 5.1.1 数据预处理对于附件中的数据进行数据挖掘,运用数据透视表、vlookup等函数剔除掉数据丢失严重、无意义、与模型无关的数据,最后对数据进行整合,得到自变量分别为医嘱项、医嘱子类、病人ID、性别、年龄、单价、医嘱数量、总额、账单号的Exce
7、l表格。 5.1.2 层次分析法1层次分析法(AHP)是将决策问题按总目标、各层子目标、评价准则直至具体的备投方案的顺序分解为不同的层次结构,然后得用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最优方案。这里所谓“优先权重”是一种相对的量度,它表明各备择方案在某一特点的评价准则或子目标,标下优越程度的相对量度,以及各子目标对上一层目标而言重要程度的相对量度。层次分析法比较适合于具有分层交错评价指标的目标系统,而且目标值又难于定量描述的决策问题。其用法是构造判断矩阵,求出其最大特征值。及其
8、所对应的特征向量W,归一化后,即为某一层次指标对于上一层次某相关指标的相对重要性权值。层次分析法主要步骤:1、建立层次结构模型;2、构造成对比较阵,从层次结构模型的第2层开始,对于从属于上一层每个因素的同一层诸因素,用成对比较法和19比较尺度(表1)构造成对比较阵,直到最下层;3、计算权向量并做一致性检验;4、计算组合权向量并做组合一致性检验;5、构造判断矩阵;6、计算权重向量;7、计算权重向量;8、一致性检验,其中,随机一致性指标RI和判断矩阵的阶数(表2)有关。表1-比例标度表重要性标度含义1表示两个元素相比,具有同等重要性2表示两个元素相比,前者比后者稍重要3表示两个元素相比,前者比后者
9、明显重要4表示两个元素相比,前者比后者强烈重要5表示两个元素相比,前者比后者极端重要2,4,6,8表示上述判断的中间值倒数若元素i与元素j的重要性之比为, 则元素j与元素i的重要性之比为=1/表2-平均随机一致性指标RI标准值n1234567891011RI000.580.901.121.241.321.411.451.491.51 5.1.2 模糊综合评价法2模糊综合评价法是一种基于模糊数学的综合评标方法。该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。它具有结果清晰,系统性强的特点,能较好地解决模糊的、难
10、以量化的问题,适合各种非确定性问题的解决。由于评价因素的复杂性、评价对象的层次性、评价标准中存在的模糊性以及评价影响因素的模糊性或不确定性、定性指标难以定量化等一系列问题,使得人们难以用绝对的“非此即彼”来准确的描述客观现实,经常存在着“亦此亦彼”的模糊现象,其描述也多用自然语言来表达,而自然语言最大的特点是它的模糊性,而这种模糊性很难用经典数学模型加以统一量度。因此,建立在模糊集合基础上的模糊综合评判方法,从多个指标对被评价事物隶属等级状况进行综合性评判,它把被评判事物的变化区间做出划分,一方面可以顾及对象的层次性,使得评价标准、影响因素的模糊性得以体现;另一方面在评价中又可以充分发挥人的经
11、验,使评价结果更客观,符合实际情况。模糊综合评判可以做到定性和定量因素相结合,扩大信息量,使评价数度得以提高,评价结论可信。模糊综合评价法主要步骤:1、模糊综合评价指标的构建2、采用构建好权重向量3、构建评价矩阵,建立适合的隶属函数从而构建好评价矩阵。4、评价矩阵和权重的合成,采用适合的合成因子对其进行合成,并对结果向量进行解释。 5.2 医保欺诈模型的建立 5.2.1 层次模型建立医保欺诈识别模型的建立过程主要分指标筛选和指标权重确定两部分。建立医保欺诈识别体系,根据医保诈骗的现象,单张处方产生总费用特别高,一张卡在一定时间内反复多次拿药等都可能是医保诈骗,充分考虑医保诈骗几个方面因素,将欺
12、诈分析可能性作为目标,放在层次模型的顶端,选取每张医保卡刷卡次数和单张处方产生总费用用为两个一级指标,每个一级指标下又分别有年龄、性别和单张处方药物种类数、单张处方费用、单张处方使用次数五个二级指标行成一个递阶的层次机构,构成医保欺诈识别体系(图1)。图1-欺诈分析的层次结构 5.2.2 构造成对比较阵从医保诈骗的主动发现层次结构的第2层开始,用成对比较法和19比较尺度构造成对比较阵先对第二层的五个指标开始进行两两对比,得到成对比矩阵,再对第三层的从属于上一层的每一个因素的同一层诸因素,用成对比较法和19比较尺度构造成对比较阵,。得到如下矩阵:A-B矩阵如下:=-C矩阵如下:=-C矩阵如下:=
13、 5.2.3 计算权向量并作一致性检验通过一致性检验的步骤,首先对于每一个成对比矩阵计算最大特征根及对应的特征向量,其次利用一致性指标、随机一致性指标和一致性比率做一致性检验。最后,若通过,特征向量(归一化后)即为权向量:若不通过,需重新构造成对比矩阵。 5.2.3.1 运用和法求最大特征根步骤如下:1.将A的每一列向量归一化得2.对于按行求和得3.将归一化即为近似特征向量;4.计算作为最大特征根的近似值。 5.2.3.2 一致性指标CI:因为判断矩阵是计算权重的根据,所以要求矩阵大体上具有一致性,避免出现“甲比乙极端重要,乙比丙极端重要,而丙又比甲极端重要”的讳背常识的判断,这将导致评价失真
14、,因此,要对判断的相容性和误差进行分析。一般认为,l或2阶判断矩阵总是具有完全一致性的。但是对于2阶以上的判断矩阵就需进行一致性检验。设相容性指标为CI (Consistency Index),即有当CI=0时,A阵是一致阵,如果CI越大A一致性越差。 5.2.3.3 计算一致性指标CR一致性指标CR愈小,判断矩阵的一致性愈好,当CR<0.1时,一般认为判断矩阵的一致性是可以接受的,否则需要调整判断矩阵,使其具有满意的一致性。只有当CR<0.1时,才认为A 的不一致程度在容许的范围内,则该矩阵可以通过检验;当CR>0.1时,则通不过一致性检验,需要重新构造对比矩阵。按照如上面
15、的步骤,运用matlab进行编程处理4,得到各判断矩阵的各层次各层次单排序计算及一致性检验结果如表3所示:(代码见附录1)表3-各层次单排序计算及一致性检验结果判断矩阵特征向量CICRA-B200续表-C200-C3.03490.01740.031从上表明显的看到所有的CR都小于0.1,所以都能通过一致性的检验。 5.2.3.4 层次总排序及其一致性检验设B层,对上层(A层)中因素的层次单排序一致性指标为,随机一致性指标为,则层级总排序的一致性比率为:当CR<0.1时,认为层次总排序通过一致性检验。CR=(0.25*0+0.75*0.0174)/0.25*0+0.75*0.58)=0.0
16、3<0.1所以层次总排序通过一致性检验。根据指标体系结构图1所给的关系,结合各判断矩阵计算出的指标权重,计算出5个指标最终权重排序,从而构建出指标层的权重向量(表4)表4-各个指标权重分配一级指标二级指标最终权重一张卡使用次数年龄016性别0.04单张处方总药费配药种类数0.04864单张处方的药费0.46888单张处方使用次数0.282485个评价指标的最终权重向量:W=(0.16,0.04,0.04864,0.46888,0.28248) 5.2.4 医保欺诈度度评分模型建立医保欺诈度评分函数,为了避免像其他研究人一样会出现评分标准不合理的问题,我们根据附件1中已有的数据进行统计计算
17、,结合我们现在的实际情况,采用模糊数学中隶属度函数的思想,建立了下面的可信度函数,从而保证了量化指标评分的连续性。 5.2.4.1 建立年龄的隶属度函数。根据整理的数据,统计出各段年龄和所开处方次数以及拿药次数,剔除掉人数的影响,以及得出平均每个人多拿药的次数,利用excel作图如下(图2):图2-年龄与平均每人多拿药次数的关系根据实际情况以及有关资料5,0-20岁的小孩子以及60岁以上的老人不太可能实行欺诈,因此,求得年龄的隶属度函数及同理求得其它二级指标的隶属度函数。 5.2.4.2 确定医保欺诈度阈值6医保欺诈度阈值的确定主要看患者单张处方产生总费用以及取药次数是否在合理范围之内。达到这
18、个标准可作为是否欺诈的阈值t1。取占权重最大的前两项指标单张处方的药费、单张处方取药次数,则可计算欺诈可能性为:t1=0.46888+0.28248=0.75136所以当患者的得分为大于t1时,则实行欺诈的可能性大。 5.2.5 模型的求解运用matlab对题目数据进行求解在整理所得表格中随机选取两条记录如表5所示表5ID处方金额药物种类拿药次数性别年龄处方总药费100024119.8811132119.88476882371.542321458545.42运用matlab计算得到:第一条记录欺诈度t=0.2619488,小于t1,所以没有发生医保欺诈;第二条记录欺诈度t=0.8448976,
19、大于t1,所以发生了医保欺诈。将所有数据输入得到最后结果,部分结果如表6所示:表6ID年龄性别药物种类次数药费欺诈度是否欺诈(1为欺诈)6678480.650.40.050.980.840.79312216678980.650.40.050.980.840.79312216679470.650.60.050.980.840.80112216679530.650.40.050.980.840.79312216679830.650.40.050.980.840.79312216692150.650.40.050.980.840.79312216693870.650.40.050.980.840.7
20、9312216695660.650.40.050.980.840.79312216706270.650.60.050.980.840.80112216729160.650.60.050.980.840.80112216745100.650.40.050.980.840.79312216750920.650.60.050.980.840.80112216751720.650.40.050.980.840.79312216755590.650.40.050.980.840.79312216766050.650.60.050.980.840.80112216766980.650.60.050.980
21、.840.80112216799870.650.40.050.980.840.79312216807530.650.40.050.980.840.79312216818210.650.40.050.980.840.79312216828430.650.40.050.980.840.79312216847590.650.40.050.980.840.79312216923150.650.40.050.980.840.79312216923230.650.60.050.980.840.80112211704610.20.60.050.980.840.72912201725150.20.60.050
22、.980.840.72912201746560.20.40.050.980.840.72112201763730.20.60.050.980.840.72912201772830.20.40.050.980.840.72112201786210.20.40.050.980.840.72112201791570.20.60.050.980.840.72912201832680.20.60.050.980.840.72912201844880.20.40.050.980.840.72112201857500.20.40.050.980.840.72112201869460.20.60.050.98
23、0.840.72912201873980.20.60.050.980.840.72912201951490.20.60.050.980.840.72912201958580.20.40.050.980.840.72112202005230.20.60.050.980.840.72912202074190.20.60.050.980.840.72912202367510.20.40.050.980.840.72112202392610.20.60.050.980.840.72912202869000.20.60.050.980.840.72912203484170.20.40.050.980.8
24、40.7211220 5.2.6 结果分析将结果以形象直观的饼图(图3)形式表现出来,可以看出:欺诈率为1图3-欺诈比例其中,所得欺诈结果中,单张处方费用大于300所占的比例为100(图4)图4-各单张处方费用比例单张处方使用次数大于1所占比例为100(图5)图5-各单张处方使用次数所占比例年龄在20与60之间所占比例为98(图6)图6-各年龄段所占比例单张处方产生总费用比例(图7)为图7-单张处方产生总费用比例根据结果可得:年龄在40-60之间,且单张处方费用大于100,单张处方重复使用这些现象极有可能为医保欺诈;这与该模型先前判断相符,从理论上,该模型可在一定程度上进行医保欺诈的判断。相关
25、部门可在年龄,单张处方使用次数等方面加强监控,及时发现可能存在的医保欺诈行为,但因该模型存在一定的主观意识,具有一定的误差,所以在初步判断后还应进行进一步的确定,例如根据此人的教育背景,工作、婚姻状况以及保单信息等进行判断。但更重要的是,有关部门应加强相关法律建设,完善医保体系,提升人们的法制意识和综合素质,增强医务人员的责任意识,从根本上杜绝医保欺诈的可能,促进医疗体系健康有序的发展。 5.3 模型的评价 5.3.1 模型的优点 1、本文中层次分析法把医保欺诈判断作为一个系统,按照分解、比较判断,综合的思维方式进行决策,层次分析法中得每一层的权重设置最后都会直接或者间接的影响到结果,而且每个
26、层次中的每个因素对结果的影响都是量化的,非常的清晰、明确; 2、该模型简洁实用,既不单纯追求高深数学,又不片面地注重行为、逻辑、推理,而是把定性方法与定量方法有机地结合起来,使复杂的系统分解、简明,计算简便,并且所得结果简单明确,容易为决策者了解和掌握,具有很高的理论和实践价值; 3、所需定量数据信息较少,层次分析法主要是从评价者对评价问题的本质、要素的理解出发,比一般的定量方法更讲求定性的分析和判断。由于层次分析法是一种模拟人们决策过程的思维方式的一种方法,层次分析法把判断各要素的相对重要性的步骤留给了大脑,只保留人脑对要素的印象,化为简单的权重进行计算,提高了判断效率; 4、层次分析法不需
27、要欺诈样本对模型进行训练和检验,局限性较小,应用范围较广。 5.3.2 模型的缺点层次分析法中人的主观判断、选择 、偏好对结果的影响很大,判断失误可能导致决策的失误。 5.4、模型的改进与推广 5.4.1 模型的改进7由于层次分析法主观意识较强,在请多个专家进行评价时,最好采取独立的方式,相互之间不能干扰,否则,容易受“大专家”意见的主导,使多专家失去意义。对于多个专家评价结果的综合,可以在2个环节上进行:一是对判断矩阵中的指标进行综合;另是对最终结果进行加和和归一化处理.两者各有利弊,前者工作量不大,只进行简单的矩阵加和即可,不增加矩阵特征根计算,但很难保持判断矩阵的一致性;后者计算工作量大
28、,要计算多个矩阵的特征根,但容易保证各矩阵的一致性。通过以上方法可以提高权重可信度。 5.4.2 模型的推广该模型可有效检测出医保中发生的诈骗现象,同时这一模型可以推广到其他类型的保险行业中,例如人寿保险,机动车险等;通过对大数据进行挖掘,运用层次分析法和模糊综合分析结合的方法得到各指标的权重,这样即可通过模型确定是否存在欺诈行为。除了保险行业外,在其他方面该模型也同样可以发挥作用,例如,对某几所企业进行评级,可以将识别因子进行分层,构造各识别因子的权重和隶属度函数,确定级别阈值,最后计算得出企业级别。如果可以从相关机构获取欺诈样本,那么可以采取logistic回归和BP神经网络结合的方法,运
29、用spss软件对样本进行logistic回归分析提取具有模型显著性的识别因子;将所得识别因子对构建的bp神经网络模型进行训练,并选取检验样本对模型的有效性进行预测检验;最后根据研究结果提出针对性的反欺诈措施和建议。相比于层次分析模型,bp神经模型更为客观,准确8。参考文献1层次分析法(运筹学理论) 2015.5.5.2模糊综合评价法 2015.5.5.3周建涛,秦炳山,宋晓东,意外、健康保险欺诈概率识别,河北经贸大学学报,2014年06期,138-142,2014.4卓金武,MATLAB在数学建模中的应用,北京航空航天大学出版社,2014,19-20.5谢季坚,刘承平,模糊数学方法应用,华中科技大学出版社,2003年,73-96.6李春霞,李文高,特征树阈值检测算法应对电信欺诈,软件,2011年第32卷,8-13,2011.7樊文刚,侯丽红,层次分析法的改进,科技情报开发与经济,2005年第15卷,153-154,2005.8杨超,基于BP神经网络的健康保险欺诈识别研究,青岛大学硕士学位论文,2014.附录附录1a=1 1/8 1/7;8 1 2;7 1/2 1; %读入判断矩阵C一次输录B x,y=eig(a); %求出特征值和特征向量 Jmax=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度360借条合同多(信用保险合作协议)3篇
- 2024物流配送服务合同服务范围
- 2024年食堂就餐卡使用规定
- 2024年网络安全防护系统采购合同
- 2025年度金融产品代理销售合同2篇
- 2024年退房时房屋损害赔偿合同
- 2024版HR干货目标责任书
- 2024年生产线融资租赁
- 2024野生动物保护项目融资与投资合作协议3篇
- 2024年财务数据录入与保管协议3篇
- 二级MS操作题真题
- (正式版)CB∕T 4550-2024 船舶行业企业安全设备设施管理规定
- 正规光伏屋顶租赁合同
- DZ∕T 0201-2020 矿产地质勘查规范 钨、锡、汞、锑(正式版)
- 2024年(中级)嵌入式系统设计师软考试题库(含答案)
- 小小科学家《物理》模拟试卷A(附答案)
- 2023年检验科室间质评年度总结
- 配件供应技术服务和质保期服务计划方案
- 中药房培训课题
- 供电方案审批流程
- 球墨铸铁管行业分析及市场研究报告
评论
0/150
提交评论