【原创】R语言药物关联规则apriori模型分析代码_第1页
【原创】R语言药物关联规则apriori模型分析代码_第2页
【原创】R语言药物关联规则apriori模型分析代码_第3页
【原创】R语言药物关联规则apriori模型分析代码_第4页
【原创】R语言药物关联规则apriori模型分析代码_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【原创】附代码数据有问题到淘宝找“大数据部落”就可以了可以看到数据中一共有这些变量:colnames(trans.list)1住院号流水号3病案号姓名5付款方式合同单位7是否特病住院次9性别出生年月日11年龄”新生儿月份”13新生儿体重新生儿入院体重15婚姻职业17出生地民族19国籍”身份证号21”出生地.省市23”县”籍贯.省”25市.1现住址.省27市.2县.129 X邮编31户口地址.省市.333县.2X.135邮编.1工作单位及地址37工作单位电话工作单位邮编39入院日期入院途径41”入院科别出院科别”43”出院日期出院科别”45住院天数门.急.诊诊断”47门.急.诊诊断ICD入院诊断

2、”49入院诊断ICD.10病理诊断51病理诊断ICD.10其他诊断53其他诊断ICD.10出院诊断55出院诊断ICD.10入院病情57损伤.中毒药物过敏59过敏药物名称日期61”手术.操作编码手术.操作名称”63”手术级别”手术.操作日期65麻醉方式”切口种类67愈合等级尸检69血型Rh71出院诊断2”入院病情273出院诊断3入院病情3【原创】附代码数据 有问题到淘宝找“大数据部落”就可以了75 77 79 81 83 85 87 89 91 93 95 97 99 101 103 105 107 109 111 113 115出院诊断4入院病情4出院诊断5入院病情5出院诊断6”入院病情6出院

3、诊断7”入院病情7”手术2手术3手术4离院方式”医嘱转院.拟接受医疗机构医嘱转社区.拟接受医疗机构”出院31大再入院计划目的入院前昏迷.天小时分钟”入院后昏迷.天小时.1分总费用床费护理费西约中成药草药放射化验输氧输血诊疗手术接生其他检查麻醉婴儿陪床费其他卫材X.2选取其中的不同科室疾病住院天数变量trans.list1=trans.list,c(入院科别“出院科别”,住院天数)table(trans.list1$入院科别)library(ggplot2)datats= table (trans.list1$ 入院科别)datats产科病房儿科二病房儿科一病房耳鼻咽喉头颈病房577742488

4、617放射治疗科病房风湿免疫科病房妇科病房肝胆胰外科病房117417771371【原创】附代码数据 有问题到淘宝找“大数据部落”就可以了肛肠科病房305668骨外科病房303和平骨外科病房1047和平呼吸内科病房和平泌尿外科病房和平内分泌科病房和平普外科病房和平神经内科病房2587903081494和平消化内科病房和平心血管内病房和平眼科二病房和平眼科三病房576141512221105和平眼科四病房和平眼科一病房领面外科病房呼吸内科病房12031415611182急诊观察室急诊外科病房介入科病房泌尿外科病分泌内科病房棋盘山结核病二科棋盘山结核病三科棋盘山结核病一科1

5、440549493561棋盘山精神病科乳腺外科病房神经内科二病房神经内科一病房735104412191760神经外科病房肾内科病房生物治疗科病房太原康复医学病房560723839372太原综合内科病房危重症医学科胃肠外科病房消化内科病房2716010321124心血管内科二病房心血管内科一病房新生儿病房胸心外科病房1111162113924血液内科病房肿瘤内科病房2351480datats= as.data.frame (datats)ggplot ( data= datats, aes( x= Vari, y= Freq, fill= Vari) + geom_bar (colour= bl

6、ack , stat= identity ) +ggtitle (State)【原创】附代码数据有问题到淘宝找“大数据部落”就可以了苒耳*产4科片江帆审周 七*科,民WWfertHftSJ 咤JRM 儿同一 E 区,田斗山用土凡置地国“店 E* 箭1前寻HUKWIWRiU:t-UA;H 出孑屏贴为愀胸片 M干.|酊,直笛I*甲巧即, 看单/收三疆W 田平甲闻三事用 光车日日刊H 如甲歌出一工 承皿善利前前等百鼻TX 曲用也集AHM*H -* 一“九再触宙 CL-i二 W *UL叮称现工总 喻_骷午摘一日 MST3HWKflWZW评1WW aiiws 主1转&片畤(M; 直净,年亨,医 宜片色痔

7、修工 右事尹件 MW心七片T也二H 白也内醇一 ,普 mix,弟串弟K 斯牌曲料翻H 肿科工住院天数 =5,低,ifelse (trans.listrans.list1$住院天数=ifelse (trans.list1$t1$住院天数=10,中,高) trans.list1= as.data.frame (trans.list1)trans.list1=na.omit(trans.list)str (trans.list1)data.frame: 39361 obs. of 3 variables:$入院科别:Factor w/ 50 levels 产科病房,儿科二病房,.:24 24 24

8、2424 24 24 24 24 24 .$出院科别:Factor w/ 46 levels ,儿科二病房,.:1 1 1 1 1 1 1 1 1 1.$住院天数:chr 中中中低.trans.list1trans.list1= = NAWarning in -.factor(*tmp*, thisvar, value = NA): invalid facto rlevel, NA generated删除缺失值trans.list1= na.omit (trans.list1)for(i in 1: ncol (trans.list1)trans.list1,i=as.factor (tran

9、s.list1,i)trans.list1 - sapply(trans.list1,as.factor)transfer dat to factor【原创】附代码数据有问题到淘宝找“大数据部落”就可以了coerce into transactionstransl - as (trans.listl, transactions )查看频繁项集频繁项集的所有非空子集也必须是频繁的。即如果项集 A不满足最小支持度阈值MinSup port ,则A不是频繁的,如果将项集B添加到项集A中,也就是A ? B也不可能是频繁 的。该性质是一种反单调性的性质,也就是说如果一个集合不能通过测试,则它的所有超 集

10、也都不能通过相同的测试。frequentsets= eclat (trans1, parameter= list (support= 0.04 , minlen= 2) get fr equent setsEclatparameter specification:tidLists support minlen maxlen target extFALSE 0.04210 frequent itemsets FALSEalgorithmic control:sparse sort verbose7 -2 TRUEAbsolute minimum support count: 66create i

11、temset .set transactions .96 item(s), 1654 transaction(s) done 0.00s.sorting and recoding items . 11 item(s) done 0.00s.creating bit matrix . 11 row(s), 1654 column(s) done 0.00s.writing . 19 set(s) done 0.00s.Creating S4 object . done 0.00s.inspect (frequentsets )察看求得的频繁项集 review frequent setsitems

12、 出院科别=危重症医学科,住院天数二高 入院科别二心血管内科二病房,住院天数二中【原创】附代码数据有问题到淘宝找“大数据部落”就可以了( ( ( (入院科别二心血管内科二病房,出院科别二心血管内科二病房 入院科别二心血管内科一病房,出院科别二心血管内科二病房 入院科别二心血管内科一病房,住院天数二中入院科别二心血管内科一病房,出院科别二心血管内科二病房,住院天数二中入院科别=神经内科二病房 入院科别=神经内科二病房 入院科别=神经内科二病房 入院科别=神经内科二病房 入院科别=神经内科二病房 入院科别=神经内科一病房 入院科别=神经内科一病房 入院科别=神经内科一病房 入院科别=神经内科一病房

13、,出院科别=神经内科二病房,出院科别=神经内科二病房,住院天数二高,住院天数二中,出院科别=神经内科二病房,出院科别=神经内科二病房,住院天数二高,住院天数二中,出院科别=神经内科二病房,住院天数二高,住院天数二中,住院天数二中出院科别二心血管内科二病房,住院天数二高 出院科别二心血管内科二病房,住院天数二中 出院科别=神经内科二病房,住院天数二高 出院科别=神经内科二病房,住院天数二中support0.051995160.051390570.077992740.059854900.079806530.100967350.048972190.079201930.058041110.085247

14、880.139661430.084643290.051995160.093712210.136638450.050181380.100967350.090689240.16384522inspect ( sort (frequentsets, by=support)根据支持度对求得的频繁项集排序并察看(等价于 inspect(sort(frequentsets)1:10)【原创】附代码数据有问题到淘宝找“大数据部落”就可以了items 出院科别=神经内科二病房,住院天数二中 入院科别=神经内科二病房,出院科别=神经内科二病房 入院科别=神经内科一病房,出院科别=神经内科二病房 入院科别二心血管

15、内科一病房,出院科别二心血管内科二病房 出院科别二心血管内科二病房,住院天数二中 入院科别=神经内科一病房,住院天数二中 出院科别=神经内科二病房,住院天数二高 入院科别=神经内科二病房,住院天数二中 入院科别=神经内科一病房,出院科别=神经内科二病房,住院天数二中 入院科别二心血管内科一病房,住院天数二中 入院科别=神经内科二病房,出院科别=神经内科二病房,住院天数二中 入院科别二心血管内科二病房,出院科别二心血管内科二病房 入院科别二心血管内科一病房,出院科别二心血管内科二病房,住院天数二中 入院科别=神经内科二病房,住院天数二高 出院科别=危重症医学科,住院天数二高 入院科别=神经内科一

16、病房,住院天数二高 入院科别二心血管内科二病房,住院天数二中 出院科别=心血管内科二病房,住院天数二高 入院科别=神经内科二病房,出院科别=神经内科二病房,住院天数二高 support0.163845220.139661430.136638450.100967350.100967350.093712210.090689240.085247880.084643290.079806530.079201930.077992740.059854900.058041110.051995160.051995160.051390570.050181380.04897219建立apriori模型Apriori

17、是关联规则模型中的经典算法,是由R.Agrawal和R.Srikant 于1994年提出的为布尔关联规则挖掘频繁项集的原创性算法。Apriori使用一种称作逐层搜索的迭代【原创】附代码数据有问题到淘宝找“大数据部落”就可以了方法,k项集用于搜索k+1项集。该算法主要用于在交易数据、关联数据或其他信息载体 中,查找存在于项目集合或对象集合之间的频繁模式、关联性或因果结构。rules 住院天数=高0.05199516住院天数=高= 出院科别二危重症医学科0.05199516入院科别二心血管内科二病房 = 出院科别二心血管内科二病房 0.07799274出院科别二心血管内科二病房 = 入院科别二心血

18、管内科二病房 0.07799274入院科别=心血管内科二病房 = 住院天数=中0.05139057住院天数=中= 入院科别=心血管内科二病房 0.05139057confidence lift0.6323529 1.3073900.1075000 1.3073900.7588235 4.1559410.4271523 4.1559410.5000000 1.2143910.1248164 1.214391查看规则质量quality ( head (rules)support confidence lift0.05199516 0.6323529 1.3073900.05199516 0.107

19、5000 1.3073900.07799274 0.7588235 4.1559410.07799274 0.4271523 4.1559410.05139057 0.5000000 1.2143910.05139057 0.1248164 1.214391查看规则的支持度rules 【原创】附代码数据 有问题到淘宝找“大数据部落”就可以了2 住院天数=中=3 入院科别=神经内科二病房=4 出院科别=神经内科二病房=5 入院科别=神经内科一病房=6 出院科别=神经内科二病房=7 入院科别=心血管内科一病房=8 出院科别=心血管内科二病房=9 出院科别=心血管内科二病房=10 住院天数=中=11

20、 入院科别=神经内科一病房=12 住院天数=中=13 出院科别=神经内科二病房=14 住院天数= iWj =15 入院科别=神经内科二病房=16 住院天数=中=17 入院科别=神经内科一病房,出院科别=神经内科二病房=18 入院科别=神经内科一病房,住院天数=中=19 出院科别=神经内科二病房,住院天数=中=20 入院科别=心血管内科一病房=21 住院天数=中=22 入院科别=神经内科二病房,出院科别=神经内科二病房=23 入院科别=神经内科二病房,住院天数=中=24 出院科别=神经内科二病房,住院天数=中=25 入院科别=心血管内科二病房=26 出院科别=心血管内科二病房=27 入院科别=心

21、血管内科一病房,出院科别二心血管内科二病房=28 入院科别=心血管内科一病房,住院天数=中=29 出院科别=心血管内科二病房,住院天数=中=30 入院科别=神经内科二病房=31 住院天数= iWj =32 出院科别=危重症医学科=33 住院天数= iWj =34 入院科别=神经内科一病房=35 住院天数= iWj =36 入院科别=心血管内科二病房=37 住院天数=中=38 出院科别=心血管内科二病房=39 住院天数= iWj =40 入院科别=神经内科二病房,出院科别=神经内科二病房=rhssupport confidence lift1 住院天数=中0.16384522 0.5840517

22、 1.4185338【原创】附代码数据有问题到淘宝找“大数据部落”就可以了 出院科别=神经内科二病房 出院科别=神经内科二病房 入院科别=神经内科二病房 出院科别=神经内科二病房 入院科别=神经内科一病房出院科别二心血管内科二病房入院科别二心血管内科一病房0.16384522 0.3979442 1.41853380.13966143 0.8953488 3.19160990.13966143 0.4978448 3.19160990.13663845 0.8464419 3.01727370.13663845 0.4870690 3.0172737 0.10096735 0.6987448

23、3.8269002 0.10096735 0.5529801 3.8269002住院天数=中0.10096735 0.5529801 1.3430678出院科别=心血管内科二病房 0.10096735 0.2452276 1.3430678住院天数=中0.09371221 0.5805243 1.4099666 入院科别=神经内科一病房 0.09371221 0.2276065 1.4099666住院天数=高0.09068924 0.3232759 0.6683728 出院科别二神经内科二病房 0.09068924 0.1875000 0.6683728住院天数=中0.08524788 0.5465116 1.3273572 入院科别=神经内科二病房 0.08524788 0.2070485 1.3273572住院天数=中0.08464329 0.6194690 1.5045547出院科别二神经内科二病房 0.08464329 0.9032258 3.2196885入院科别=神经内科一病房 0.08464329 0.5166052 3.2002432住院天数=中0.07980653 0.5523013 1.3414189 入院科别二心血管内科一病房 0.07980653 0.1938326 1.3414189住院天数=中0.07920193 0.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论