下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
python关联规则算法源代码_Python实现关联规则分析Apriori算法#-*-coding:utf-8-*-importsysreload(sys)sys.setdefaultencoding("utf8")defload_data_set():data_set=[[‘beer‘,‘babydiapers‘,‘shorts‘],[‘babydiapers‘,‘shorts‘],[‘babydiapers‘,‘milk‘],[‘beer‘,‘babydiapers‘,‘shorts‘],[‘beer‘,‘milk‘],[‘babydiapers‘,‘milk‘],[‘beer‘,‘milk‘],[‘beer‘,‘babydiapers‘,‘milk‘,‘shorts‘],[‘beer‘,‘babydiapers‘,‘milk‘]]returndata_setdefcreate_C1(data_set):C1=set()fortindata_set:foritemint:item_set=frozenset([item])C1.add(item_set)returnC1defis_apriori(Ck_item,Lksub1):foriteminCk_item:sub_Ck=Ck_item-frozenset([item])ifsub_CknotinLksub1:returnFalsereturnTruedefcreate_Ck(Lksub1,k):Ck=set()len_Lksub1=len(Lksub1)list_Lksub1=list(Lksub1)foriinrange(len_Lksub1):forjinrange(1,len_Lksub1):l1=list(list_Lksub1[i])l2=list(list_Lksub1[j])l1.sort()l2.sort()ifl1[0:k-2]==l2[0:k-2]:Ck_item=list_Lksub1[i]|list_Lksub1[j]ifis_apriori(Ck_item,Lksub1):Ck.add(Ck_item)returnCkdefgenerate_Lk_by_Ck(data_set,Ck,min_support,support_data):Lk=set()item_count={}fortindata_set:foriteminCk:ifitem.issubset(t):ifitemnotinitem_count:item_count[item]=1else:item_count[item]+=1t_num=float(len(data_set))foriteminitem_count:if(item_count[item]/t_num)>=min_support:Lk.add(item)support_data[item]=item_count[item]/t_numreturnLkdefgenerate_L(data_set,k,min_support):support_data={}C1=create_C1(data_set)L1=generate_Lk_by_Ck(data_set,C1,min_support,support_data)Lksub1=L1.copy()L=[]L.append(Lksub1)foriinrange(2,k+1):Ci=create_Ck(Lksub1,i)Li=generate_Lk_by_Ck(data_set,Ci,min_support,support_data)Lksub1=Li.copy()L.append(Lksub1)returnL,support_datadefgenerate_big_rules(L,support_data,min_conf):big_rule_list=[]sub_set_list=[]foriinrange(0,len(L)):forfreq_setinL[i]:forsub_setinsub_set_list:ifsub_set.issubset(freq_set):conf=support_data[freq_set]/support_data[freq_set-sub_set]big_rule=(freq_set-sub_set,sub_set,conf)ifconf>=min_confandbig_rulenotinbig_rule_list:big_rule_list.append(big_rule)sub_set_list.append(freq_set)returnbig_rule_listif__name__=="__main__":"""Test"""data_set=load_data_set()L,support_data=generate_L(data_set,k=3,min_support=0.2)big_rules_list=generate_big_rules(L,support_data,min_conf=0.7)forLkinL:print"="*50print"frequent"+str(len(list(Lk)[0]))+"-itemsets\t\tsupport"print"="*50forfreq_setinLk:printf
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省扬州市2024-2025学年高二(上)学业水平合格性模拟考试物理试卷(含答案)
- 河北省衡水市2024-2025学年高三上学期期末物理试题(无答案)
- 2022年高考物理大一轮总复习(江苏专版-)题库-第二章-相互作用-第2课时
- 安徽省合肥第四十六中学2024-2025学年九年级第一学期12月份月考语文试卷(含答案)
- 【KS5U原创】新课标2021年高二物理暑假作业5《恒定电流二》
- 2021贵阳市高考英语阅读、阅读表达一轮自练题(5)-及答案
- 四年级数学(除数是两位数)计算题专项练习及答案
- 【全程复习方略】2021年春高中物理选修3-4-课时达标·效果检测-12.2-波的图像
- 2022部编版四年级语文下册全册一课一练同步练习(有答案)+知识点归纳
- 2025年0096北京美欣科技有限公司
- GB/T 40417-2021电子特气六氟丁二烯
- GB/T 3641-1983P3型镀锌金属软管
- GB/T 34281-2017全民健身活动中心分类配置要求
- GB/T 10183-2005桥式和门式起重机制造及轨道安装公差
- 采购合同管理概述
- 旅游法实施细则
- 高等教育阶段儿童文学专业知识讲座课件
- 篮球比赛报名表范本
- 河北省沧州市药品零售药店企业药房名单目录
- 2022心理学课题论文开题报告范文
- 自行招用保安员单位备案申请材料
评论
0/150
提交评论