2019第十二届阶段优秀1209队题_第1页
2019第十二届阶段优秀1209队题_第2页
2019第十二届阶段优秀1209队题_第3页
2019第十二届阶段优秀1209队题_第4页
2019第十二届阶段优秀1209队题_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于统计建模的车险业数字研关键 R聚类;因子分析;卡方检验;车险;驾驶人行 要的本质是对未来可能发生事故的风险做对冲,以起到分散风险的作用。车险作为的一种,它可以分散机动车辆在行驶过程中可能发生的未知风险和损失。现如今,车险已占据市的重要份额,且随着大数据技术的发展,车险行业也开始了新一轮。如何利用销售机会和出险时机收集客户的驾驶习惯相关数据,大力推进电销和网销,提高销售效率和减少客户等待时间,进一步提高客户的续保概率就变得越来越重要。因此,本文在研读大量相关文献的基础上,对驾驶习11RKWR聚类-车。响整来进一步售。O参赛队号所选题目:CTheessenceofinsuranceistohedgetheriskofpossibleaccidentsinthefutureinordertospreadtherisk.Asakindofinsurance,vehicleinsurancecandispersetheunknownrisksandlossesthatmayoccurinthedrivingprocessofmotorvehicles.Nowadays,carinsurancehasoccupiedanimportantshareoftheinsurancemarket,andwiththedevelopmentofbigdatatechnology,thecarinsuranceindustryhasalsobegunanewroundofchanges.Howtousesalesopportunitiesandriskopportunitiestocollecttherelevantdataofcustomers'drivinghabits,vigorouslypromoteelectricitymarketingandonlinemarketing,improvesalesefficiencyandreducecustomerwaitingtime,andfurtherimprovetheprobabilityofcustomerrenewalhasemoreandmoreimportant.Therefore,thispaperisstudyingOnthebasisoftativeliture,thefollowingworkhasbeendoneontheinformationofdrivinginviewofproblemone,firstofall,onthebasisofliturestudy,11customerdrivinghabitsareselectedfromthreeaspects:vehicleusage,drivingperformanceandtravelbehavior.Then,basedontheRclusterysismethod,thedrivinghabitsindexisclassified,andtheK≤Wtestmethodisusedtotesttherationalityoftheclassification.Finally,thefactorysisoftheindicatorsineachcategoryiscarriedout,andtheindexscreeningmodelofdriver'scarinsuranceevaluationbasedonRclusteringandfactorysisisestablished,andthemaindrivinghabitindexesinthreeaspectsarescreenedout.Soastoprovidethecorrespondingquicklyandaccurayforthecustomer,increasethesatisfactionofthecustomer,andeffectivelyprovidethecorrespondingforthecustomer.Improvethesalesefficiencyofautoinsurance.forquestion2,firstofall,wedesignaquestionnaireaccordingtothedrivinghabitsindicatorsofthethreeaspectsofquestion1,andcollecttherelevantdataofcustomers'drivinghabits.Atthesametime,Thequestionofwhetherornottorenewtheinsuranceisaddedtothisquestionnaire;Then,throughtheestablishmentofchi-squaretestmodel,thepairwisecorrelationysisofalltheproblemsiscarriedout,thefactorsthataffecttheinsuranceratearefoundout,andtheinsurancerateisadjustedtofurtheradjustthepremium.Finally,weyzethedrivinghabitcharacteristicsofcustomerswhoarewillingtorenewinsurance,andimprovetheprobabilityofcustomerrenewalbyreducingpremiumsandaccurayfindingoutthetwomethodsofcustomerinviewofthethirdproblem,byreadingalargenumberofrelevantlitureandclassicalcases,wesummarizetheproblemsexistingintheautoinsurancemarketundertheenvironmentofbigdata,andmakeadetailedysis,andputforwardsometargetedsuggestionsfortheCEOofthecarinsurance 一、问题重 二、问题分 三、符号说明及模型假 符号说 模型假 四、问题一的模型建立与分 指标体系的构 指标体系构建的原 指标筛选模型的构 R聚类分析法与因子分析法的基础介 R聚类分析原理及目 因子分析模型的基本介 基于R聚类-因子分析的驾驶人车险评价指标筛选模 R聚类对车险指标类别的提 指标分类数目合理性判定的K-W检 各个类别中指标的因子分 基于R聚类-因子分析的驾驶人车险评价指标体系分 小 五、问题二的问卷设计与模型应 车辆费率的概 保费的费率相关研究现 交通事故致因相关理 事故因果连锁理 能量意外转移理 基于信息处理的人事故模 方案设 分类变量的相关性程度指 卡方检验模型的建立与分 数据规范化过 基于卡方检验的相关性算法描 基于卡方检验相关性分析建模过 基于卡方检验客户驾驶行为因子相关性的计算过 小 六、给车险公司CEO的....................................................................................................................七、总结与建 八、模型的优缺 参考文 附录 关于出险客户的驾驶习惯的问卷...................................................................................................附录 关于出险客户的驾驶习惯的数据统计 一、问题重近年来,国际行业稳步发展,车险占财险保费最大。且随着有关车险政策地了解客户,制定和服务方案。考虑到和商为了保护自身利益,经常隐瞒一些,所以很多公立合理的数学模型,对搜集哪三个方面的进行讨论。给公司的CEO写一封1–2页长短的信,陈述一下对车险业在大数据环境下 二、问题分公司提高汽车销售的效率,同时降低客户等待时间,增加客户的满意度这一问公司带来的利益,所以对已车险的客户进行续保概率分析就比较重要。由于激惯来提高客户的续保概率。针对汽车现在存在的现象进行如下分析:R聚类-因子分析的驾驶人性较强的因子,通过对保费进行调整及精准,提高客户的续保率。问题三需要我们对公司的CEO以信的形式,通过分析大数据技术在车险经营三、符号说明及模型为了便于描述问题,我们用一些符号来代替问题中所涉及的一些变量,如表1符号含义表符 含 符 含 行驶区域道路信X 行驶里X

X平均速VPhi的调整X瞬时速度最大jX连续2小时以上时间占XX紧急加/占工作日出行时间fX节假日出行时间占p显著性水平临界四、问题一的模型建立与分的增长;与此同时,这一改变也导致了车险的人越来越多,使得汽车在整个保险行业内占据的比例越来越大[1-3]。尤其近年来,汽车市场具有广阔的发展前景,成进电销和网销。该车险电销模式与传统的方式相比,销售和网络销售具有不可比拟的优势,电销具有统一的管理模式,能有效保单的配送、、理赔等各项工行为相关的信息作为变量,利用R[7-8]和因子分析法[9-10],建立数学模型,来择出最优的保单类型。因此,给出本小问的具体流程图,如图1所示。1驾驶人车险评价建模流程2汽车及个人的基本信息相关因 变量类 变量描汽车属 车 数值变 车辆安全性 多元分类变 车驾驶员属数值变定性变——驾驶人二元分类变数值变.2.女—驾驶人车数值变—3相关因变量类变量描汽车使用多元分类变行驶里数值变—单段行程数值变—离最大驾驶表平均速数值变年行驶总路程/年行驶时瞬时速度数值变—大小时以上数值变间占紧急加数值变所有加/中急加/占速占出行习工作日出数值变车辆的行驶时间时间占节假日出数值变—时间占数值变该时间段为每天7:00-数值变该时间段为每天20:00-标准化为Vijmin(Vijp (4- max(V)min(V 标。负向指标标准化为max(Vij)p (4- max(V)min(V 小,标准化后的数值越接近1.聚类分析是将或指标分类,使得同一类中的对象之间的相似性比与其它类的对象的相似性更强的法。聚类分析认为,所研究的样品或指标间存在程度不同的相统计量,以这些统计量作为划分类型的依据[11]。针对问题一,我们使用R聚类法进行分析。通过R聚类,将同一准则层内的指标分类,使不同类别的指标反映所要评价的不同特点,指标聚为一类,同时也为了避免建立的指标体系所涵盖的准则层的1个或2个准则层内的2X1,X2X3X4X5X6X7X8X9X10和X113R成果,选取i个指标,记为Xi(i1,2,,11),并将其看成个i类别。案,根据(4-3)计算每一类离差平方和Sm Sm( X(t)Xm)(X(t (4- t小合并方案进行重新分类,分为k类。kk S(X(t)Xm)(X(t)X rt的合理性,有必要进行K-W检验。K-WK-W检验的原假设为:不同指标在数值特征上不存在显著差异。若某类指标的显著性水平sig值大于0.05,则可接受原假设,那么聚R113为3类是合理的。为11XiaijFj (4-i1ji个指标在第j个公因子上的负载,称为因子载荷;i为仅影响指标Xi的特殊因子。 a1jA

a2jA,A,A

(4-

11j

X1 F1 X F X 2

,F2

2X F 11 m 1)k11Cov(F,)0

D(F)

0 DD()

22

I 11在条件3)中,各个车险初始因子存性关系,因子分析的目的在于找出能够表A的特征值记为j,其中jj个公因子Fjjj

k (4-将特征值j按从大到小顺序排列,根据各因子的方差贡献率和累计方差贡献率(累假设我们提取k个公因子是合适的,其前k个特征值对应的公因子构建因子分析模型, 那么j与aij

k (4-最后对计算的因子载荷aij进行分析,利用因子载荷aij的绝对值反映了指标Xi子的相关性,其中|aij|越大,表明该指标对我们所要分析的结果具有显著性影响,那么就要保留;|aij|越小,表明该指标对我们所要分析的结果影响并不显著,那么就应该给系的原始信息。在这里,我们假设提取的k个公因子具有较强的代表性,可以根据11给出客户合理的汽车。R11个指标涉及1所示。在这里,我们假设提取的k11个选取的驾理的汽车。通过R聚类和因子分析相结合,筛选出各个类别中信息含量最大的指标,构建113个方面的驾驶人车险评价R聚类,将同一准则层内的指标分类,使不同类别的指标反映驾驶人车R聚类-因子分析的驾驶人车险评价指标体系能够用很少的指标五、问题二的问卷设计与模型应以我们可以研究影响费率的客户驾驶习惯因子,利用相关的统计模型调整费析第16个问题与前15个问题间的相关性,来直接说明与费率相关的客户驾驶习惯因的相关理论进行一一介绍,然后在此基础上设计问卷与数学模型。车辆费率是指车主缴纳的费用与金额的比率。对于公司而言,车由中国业制定的。目前,费率方案有A、B、C三套,各个公司根据固定保费和费率[14]。其计算为:基准保费=固定保费+金额×费率(5-1)影响汽车费用的因素如下[15]:(如追碰撞事故)记录进行调取。如果去年全年无出险记录,则此次续费公司会给予车主一定的。同时,如果出险一次以上车险事故,则不予,而且还需要公司为了可以留住客户,获取更大的营业额,公司会有一定的停保措施。例如车主外地出差、旅游等,连续几个月未驾驶车辆,公司如果判断理由合理,则会暂时停掉,待车主正常驾驶车辆时,则恢复。录,那么公司需要上调该车主费率。车型、车价、使用性质等与车辆属性相关的特征;另一类为从人因素,包括驾驶员的性别、、驾龄等驾驶员本身的特质[16]。 车主一样承担较高的保费;另一方面,对的状行驾驶行为评分,并根据不同的评分区间来确定保费的或惩罚系数。譬如,Peng[18]整后的费率与实际损失之间进行关联。[19]使用了包括车型、车辆价格、驾驶员性中的,设计了更为合理的驾驶行为评分方法,并通过聚类分析和关联分析等方法将调整系数尚需进一步验证。CripeFiete[20]以出险概率为因变量,以车辆行驶里程数为自变量,构造了单位行驶里程的风险因子曲线(RiskPerFactor,RMF)作为费率调整系数,RMF曲线呈U型,表明行驶里程过高或过低均具有更高的风险。第一,社会、遗传因素(M),由于人所处的社会环境的不同,以及遗传因素的不同第二,人的缺点(P。由于人的遗传因素以及外界社会环境因素导致,会对人造成第三,人的不安全因素以及物的不安全状态被定位为(H。上述两者可能是造成事第四,事故(D。事故是由于物体、或者一些不安全状态对人造成了、突发或者失控。必须对能量进行控制[23]。正常情况下,能量可以按照人们预定的约束条件动、转定生产体系中的能量源,然后确定因为能量失控而的情况,进而提出相应的转基于信息处理的人事故模面提出了事故理论有一个共同的观点,如认为人的因素是造成事故的主要因们的受环而常的是的导致故对于程则种因素导致的综合结果[25]。没有的反馈,则会导致直面。在释放阶段,如果处理信息的过程是正确,虽然无法有效的消除,但是可以控制的释放,尽可能将损失一般要达到95%的置信率,通常不低于300个样本。确保结果的真实性和准确性。具体问卷表见附录Ⅰ,及具体回收后数据统计表见附录Ⅱ。在问卷表中,衍生出来的,主要包括列联系数,PhiGramer’sV、Lambda列联系数主要去除了参与计算的数据量的大小的影响如(5-2)所示式中,2是是通过卡方统计得到的卡方统计量,n是参与计算的数据量的大小。该相关性指标的计算结果在01之间,其表示相关性程度的大小。 2 2式中,2是是通过卡方统计得到的卡方统计量,n是总观察频数。其计算结果的大小表如如V (5-是或者中的最小值减去1. 系数也是系数,表示的是将一个因子,作为自变量,另一个因子作为 fimn

(5-01之间,从小到大代表相关性卷相关的客户驾驶习惯因子进行两两之间的卡方检验之前,需要对数据进行规范化操作。具体规范化过程如下:于问题2,由于是续性变量,所以它按区间划分,具体划分按对于问题4,由于车辆行驶总里程是续型变量,我们主要根据按照车辆新旧对于问题7和问题8,平均车速和瞬时车辆行驶最大速度是一个离散型变量,一般6个区间来具体分析出现的车辆在不同路面的行车速度情况。对于问题10和11,驾驶人的紧急变道以及紧急加的问题可以看出驾驶人的驾为工作日和节假日,然后进一步细分为白天和夜晚,然后使用统计量-频率来划分为4问卷的统计方法来进一步分析建模,具体的统计方法见5.5部分与表4.表4问 单选题 方题 统计方 统计目 操作步 统计 关联量单分的次数分配→次数分配计百分无选描述二因子Pearson题分交叉多因子表格的→交叉卡方检验是由英计学家KarlPearson最初,其原理是以Pearson卡方401,卡方检验的判断才足够准确。当对准化后的程度较大时,计算出来的值较大,则先前零假设,可以判断这两个算出来的值较小,则不能先前零假设,可以判断这两个变量因子没有关联关

c(f0fef2 f

j

(5- fe期望频数的计算如下所示feRT*CT*nRT (5-说,卡方检验中的自由度计算结果为:将两个因子分别减1,并在此基础上相乘。例如若计算没有进行任何限制,a*b个单元格将描述所有的变量。但在计算期望值时,每个即a*b-a-b。可以发现,其中还存在另外一个约束,也就是单元格中所有行的期望值与所有列的期望值总是相等的。因此,在此基础上之前的计算还需加1.总言之,自由度最后计算结果为a*b-a-b+1,简化后的计算结果为(a-1)*(b-1).0.05RTCT,并算出各行列交叉值所占对应行业的百分比、百分比4卡方检验相关性分析的算法流程p值小于临界值时,则先前零假设,可以判断这两个变量因子是相互关联的;们依次比较,找出其中相关性强并未在率的研究中实际应用的因子成员组合。的的在根据问题1得到的驾驶员三个方面的主要信息,设计问卷,能够在驾驶人出险后及时的六、给车险公司CEO您好!很荣幸能借此机会为贵公司提出些许建议。根据我们的和分析,如今,随着车联网和大数据技术不断发展,商业车险势在必行,借助车联网和大数据技术进行产品和服务的创新,成为了不少公司选择的突破口。根据数据资料表明,20172027人行为的车险。学者[26],在未来的车险系统中,与车辆和驾驶员行为相关的信息都应该被全面的收集并反映在保费计算中。因此,车险公司要想在大数据环境下寻求发展,必须在风险评估中进行,不能仅仅考虑从车因素,而应将驾驶员行为驶习惯良好,另一位习惯驾驶时通,但两人被定义为同一风险等级,缴纳同样的构建车联网所需的成本较高,同时,需大量的无线设备和通讯工具,这使得完善车联网信息系统所需成本巨大。车联网的构建往往需要汽车生产大数据时代背景下,越来越多的公司大数据技术在行业的重要价险或行业的相关业务知识。数据未得到有效保有效地促进了大数据技术在车险行业的应用。但同时,这也了一系列客户私密信息安全问题。车辆网系统的数据量庞大,涉及较多的客户个人隐私信息,这些信息一旦,不但损害了车险客户的基本权益,也给车险公司带来不小的麻烦,失去了客户车险公司在时更应着重驾驶人行为习惯,将驾驶人行为习惯指标作为风险评定和保费的重要因素可利用OBD设备和UBI技术实现人的驾驶行为习惯,设计更合理的驾驶车辆产品,有针对性的为客户考虑。共同构建和车联网。实现数据的共享,合理利用车联网数据信息,使收集大数据人才是各公司的争夺对象,为此,需要创新人才培养模式。一、在大数据技术不断发展的环境下,互联网安全、技术同样要与时俱利用大数据分析技术为贵公司在市场赢来一席之地。七、总结与建1RK-WR分析的驾驶人车险评价指标筛选模型能够用很少的指标反映出大部分初始因子的原始21得到的结论,即驾驶人三个方面的主要信息,设阐述车险公司在大数据环境下的,并通过我们的研究,给车险公司CEO提出些许建议,以帮助车险公司在大数据环境下得到更好的发展。八、模型的优缺RRR参考文[1.[J].[2].影响我国汽车健康发展的因素分析[J].时代汽车,2018(10):188-[3].汽车市场需求影响因素研究[J].统计与管理,2017(04):104-[4陈艳茜叶红刘省波.浅析车险人伤理赔服务水平的提升[J].保险职业学院学[5].提高车险经营管理能力的策略[J].纳税[6].调控车险结构提高车险经营效益[J].金融理论与实践,2009(06):93-, ,.基于R聚类-灰关联优势分析的绿色经济评价指标体系构建[J].科技,[8徐百超胡富松.基于R聚类对黎族青年体质派生指标特征的分析[J].海南医学,2015,26(17):2536-[9].基于因子分析的产险公司车险业务的绩效评价[J].统计与决策,2013(07):53-,,迟国泰.基于因子分析的绿色产业评价指标体系构建模型及实证[J].,, 权.多元统计分析与应用[M].:科学,李志恒. 推进机动车辆保险费率市场化改革势在必行[J]. 金融理论与实践,2012,39(506):83-86. 论加快我国机动车辆费率市场化的进程 财经科学,2002,04:76-曾辉,范兴华.关于我国机动车辆保险费率厘定因素的思考[J]. 统一化车辆费率与消费者福利探析 价格,2006,10:12-,刘,肖争艳.非寿险精算学(第三版)[M]. 大学机械振动与冲击标准化技术.GB/T13441.1-2007机械振动与冲击于全身振动的评价第1部分:一般要求[S].:中国标准,2007.J,N,H,eta.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论