中医证型关联规则挖掘_第1页
中医证型关联规则挖掘_第2页
中医证型关联规则挖掘_第3页
中医证型关联规则挖掘_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

借助患者病理信息,挖掘患者的症状与中医证型之间的关联关系,对治疗提供依据,挖掘潜在证素步骤:问卷采隼数据,形成原始数据数据预处理(数据清洗、属性规约、数据交换)对:采用关联规则算法,调整参数,训练得到关系模型结合业务,结果分析『应用实际对:采用关联规则算法,调整参数,训练得到关系模型结合业务,结果分析『应用实际1、 数据获取1) 拟定调查问卷表并形成原始指标表2) 定义纳入标准与排除标准3) 将收集回来的问卷表整理成原始数据2、 数据预处理数据清洗(1)数据清洗:对数据进行有效性检宜r整理成为原始数据1400———= 125312001000800600 4(X) onn10469300发放间卷总数耳收问卷数有效问卷数 |属性规约属性规约:将数据的73个属性取其重要属性,剔除无关属性,最终的属性为:6种证型得分、分期的属性值患者编号肝气郁结证得分热毒缢结证得分冲任失调证猬分气血两虚证得分脾胃虚弱证得分肝肾阴虚证得分TNM分期20140001730723h(1817.H4

数据变换1)属性构造属性构造:采用证型系数代昔具体单证型的证養得分,证型系数二该证型得分/该证型总分肝气郁结证型系数热毒绘结证型系数冲任失调证型系数气血两虚证型系数脾胃虚筋证型系数鼾肾阴虚证型系数0.1750.6820.1710.5350.4190.4470.30.7730.29303720.4420.1320」0.0910.2930.2790J630.3952)数据离散化由于Apriori关联规则无法处理连续型数值变量,需要将原始数据离散化,采用聚类算法将各个证型系数离散化处理,将每个属酸成4类。袁8・9肝气郁结证型系数商散表范也标识肝气郁结证型系数范国范H3内元素的个数AI(0.0.179]244A2(0.179,0.258]355A3(0.258.0.35]278A4(0.35,0.504]53表8「0热痺蕴结证型系数离敵表范加标识结证型系数范国范EB内元素的个数BI[0,0.151325范18标识热毒勇结证型系数范83范囤内元素的个数B2(0.15.0.296]396B3(0.296.0.485]1801)4(0.485,0.78;29表冲任失调证型系数离散表范圈标识冲任失调证型系数范BI范圉内元素的个数CI(0,0.2011296C2(0.201,0.288)393C3(0.2«&0.415]206C4(0.415.0.61135表8・12气血两虚证型系数离散表范图标识气血两虚证型系数范围范围内元索的个数D1(0.0.172]283D2(0.172*0.251]37503(0.251,0.357]228D4(0.357,0.552] 144»8-13脾胃虚弱证型系数禹敵袁范因标识脾好虑弱证型系数范si范!B内元素的个越El(0.0.154]285E2(0」54.0256】307E3(0.256.0.375]244E4(0375.0.526194表&44肝肾阴虚证型系釵鹰玻表范K1标识肝肾阴虚证5!系数范IB范图内元轰的个敛FI(0.0.I7S]200F2(0.178.0.261]237F3(0.261.0353J265F4(0353.0.607]228#读取数据datafile<-read・csv(”・/data/data・csv",header=T)#参数初始化type<-4#数据离散化的分组个数index<-8#TNM分期数据所在列typelabel<-cfA*,"B","C",〃D〃,"E","F") #数据离散化后的标识前缀set.seed(1234) #固定随机化种子cols<-ncol(datafile[,1:6])#取六种证型列数rows<-nrow(datafile[,1:6])#行数disdata<-matrix(NA,rows,cols+1) #初始化#聚类离散化for(iin1:cols){cl<-kmeans(datafile[,i],type,nstart=20) #对单个属性列进行聚类disdataE,iZ〈-paste(typelabel[i],cl$cluster)}disdataL,cols+ <-datafile[,index]disdataE,cols+1J<~paste("H",disdataC,cols+1],seq="”)#导出数据colnames(disdata)〈-cC肝气郁结证型系数热毒蕴结证型系数:”冲任失调证型系数气血两虚证型系数:〃脾胃虚弱证型系数:〃肝肾阴虚证型系数U“TNM分期〃)write・csv(disdata, file="・/tmp/processedfile・csv",quote=F,:row.names=F)3、模型构建

閘幣建模参数閘幣建模参数library(arules)it读入数据a<-read.csv(z/./data/processedfile.csv,z,header=TRUE)#读入数据trans<-as(a,"transactions")#将数据转换为transactions格式inspect(trans[1:5]) #观测trans数据集中前5行数据items#调用Apriori算法rules<-apriori(trans,parameter=list(support=0.06,confidence=0.75))#生成关联规则rulesrules#显示rules中关联规则条数inspect(rules)#观测rules中关联规则>inspect(rules)#sAQjrules中关联删01lhs rhs supportconfidenceliftcount{冲任共過证坐系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论