版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关联分析(笔记)事物之间的关联关系包括:简单关联关系、序列关联关系。关联关系简单关联关系序列关联关系简单关联规则:属于无指导学习方法,不直接用于分类预测,只揭示事物内部的结构Spssmodeler提供了APriori、GRI、Carma等经典算法。APriori和Carma属于同类算法。序列关联:关联具有前后顺序,通常与时间有关SPSSModeler提供了sequence算法;数据格式如下:按照事务表存储,同事需要时间变量。
IDCONTENTIDCONTENTTIME1oo-i香肠1200-1花生米1300-1饮料24001啤酒35002饮料16002啤酒27002香肠3003面包1g003饮料210003香肠311003啤酒312004花生米113004214004315004香肠416005117005香肠21B005花生米219005面包320006花生米1CustomerGuidURLCategorySequencelD10.000Loan2.00020.000Kits3.00030.000Insurance1.00041.000NewsNorthAmerica1.00051.000Football2.00061.000Football3.00071.000Baseball4-.000S1.000Basketball5.000g2.000Weather1.000102.000Weather2.000-1-12.000Weather3.000122.000Weather4-.000■132.000Weather5.000U2.000Weather6.0003.0Q0ShoppingComputer1.Q00163.0Q0NewsEurope2.Q00173.000NewsAsia3.000184.000NewsNorthAmerica1.000194.000Weather2.000205.000Flight1.000简单关联规则要分析的对象是事务事务的储存方式有事务表和事实表两种方式。事务表顾客ID项集1A1D2B2D3A3C事实表顾客ID项目A项目B项目C项目D110012010131010两种表均表明,顾客1购买了AD两种物品,顾客2购买了BD两种物品,顾客三购买了AC两种物品。关联规则有效性的测度指标1、支持度support:所有购买记录中,A、B同时被购买的比例。2、置信度confidence:在购买A的事务中,购买B的比例。关联规则实用性的测度指标1、提升度lift:(在购买A的事务中,购买B的比例)/(所有事务中,购买B的比例)
2、置信差3、置信率、正态卡方、信息差等等简单关联关系实例例1数据格式:事实表算法:Aprioricardidvaluepmsthodsexhomeownincomeagefruitvegfreshneat|dairy|cannedvegcannedmemt139S0S42.712CHEQUEMNO2700046FTTFF26736225357CASHFNO3000020FT二FF310S7220.618CASHMNO1320036FF二TF42674823.688CARDFNO1220026FFTFF59160918.813CARDMYES1100024FF-FF6266304Gl487CARDFNO1500035FT=FF76299514.047CASHFYES2030030TF-FF33876522.203CASHMYES2440022FF-FF[1W:[1:H#亠尉T^le室段!Tablei適—►鑒BA&KETS.txt11字段
所有购买项目均选入前项antecedent和后项consequent。输出结果的最低支持度是10%;本例设定的划分频繁项集的标准大于最小支持度10%。最小置信度是80%;前项最多项目数:5本例中,三项以上没有超过10%的支持度,所以不能形成三项以上的频繁项集,最大的频繁项集大小是2。后项前项规则ID实例支持变%置信度轴规则支捋%握升]部署能Rfrozenmealbeermrinedveg216716.7S7.42514.62.39521cannedvegbeerfrozenmeal17017085.89214.62.83424beerfrozenmealcannedveg317304.393U.62.3827结论解释:实例:包含前项beer、cannedveg的样本有167个,在1000个样本中前项支持度为16.7%。规则支持度:同时购买beer、cannedveg、frozenmeal三项的支持度为14.6%。规则置信度:购买beer、cannedveg的客户中,87.425%的人有购买frozenmeal。规则2下,购买frozenmeal的可能性比购买frozenmeal的支持度提高2.895倍。
例2数据格式:事实表算法:Apriori本例前项选择性别和家乡,旨在不同性别和地区客户的购买行为是否存在频繁项集由于AGE是数据类型变量,所以前项不能选入AGE,可在GRI算法中选入AGE。cardidvaluepmethodsexhomeownincomeagefruitvegfreshmeat|dairy|cannedvegcannedmeM13980842.712CHEQUEMNO2700046FTTFF26736225357CASHFNO3000028FT-FF31087220.618CASHMNO1320036FF二TF42674823.683CARDFNO1220026FFTFF59160918813CARDMYES1100024FF-FF6266304&4S7CARDFNO1M0035FT-FF76299514.047CASHFYES2000030TF-FF03S76522.203CASHMYES2440022FF二FFBASKETS.bd/11宇段I/
字段模型专家注解⑪自动◎自定曳最低条件支捋度:最小规则置信度〔附字段模型专家注解⑪自动◎自定曳最低条件支捋度:最小规则置信度〔附最犬前项數:回恨包含标志娈量的再值优化:(©速度◎内存优化:后项规则ID实例支持度%置信度轴规则支捋%提升部署能力frozenmealsex2408|48.3|42.32820.91.418279cann百dv^gsex243a4S.S4077919.91.34623.9beersex-43843.3O..1I6419.61.371292Sex=M序列关联规则实例例1数据格式:事务表时间变量:time算法:sequenceIDCONTENTTIME1001香肠|12001花生米13001饮料2斗0013500216002嘛酒27002香肠30003面包19003210003香肠311003嗥酒312004花生米113004饮料214004哩酒315004香肠4-16005啤酒1-17005香肠2-18005花生米2-19005面包350006花生米121006面包2
前项后项实例支持度%置信厘%规则支持%饮料啤酒466.667100.066.667饮料香肠366.66775.050.Q啤酒香肠383.33360.050.0饮料=》啤酒:规则支持度66.7%,规则置信度100%。0使用分区数据0使用分区数据饮料=》香肠:规则支持度50%,规则置信度75%。啤酒=》香肠:规则支持度50%,规则置信度60%。将最下置信度调整为30%,结果为:
前项后项实例支捋度骑规则支持阴饿料啤酒466.667100.066.667I香肠366.66775.050.0啤酒383.33360.050.0花生米饮料266.66750.033.333花生米面包266.66750.0站.333花生米嘛酒266.66750.033.333俄料啤酒香肠266.66750.033333例2本例是客访问网页的数据,包括浏览的内容和顺序等信息。模型旨在发现各类网页的浏览是否存在某种序列关系。Customerguide:客户IDURKcategory:网页浏览内容sequencelD:浏览顺序,即时间顺序。CustomerGuidURLCategorySequencelD|AgeGenderMaritalStatus;1o.oaoLoan2.00010-1&MS20.000Kits3.0QQ10-1&MS3o.oaoInsurance1.00010-15Ms4i.oaoNewsNorthAmerica1.00010-1&Fs5i.oaoFootball2.00010-1&Fs61.000Football3.00010-15Fs7i.oaoBaseball4.00010-1&Fs8i.oaoBasketball5.00010-15Fs92.000Weather1.00020-3&FM102.000Weather2.00020-5&FMcustomer2穆型容称:◎自动@自逹文URLCalegory悬小规则支捋度(呦:最小规则置信度〔呦:〔完整规则}穆型容称:◎自动@自逹文URLCalegory悬小规则支捋度(呦:最小规则置信度〔呦:〔完整规则}最犬序列大小:使用分区数据苗项百项室例主捋雀嗝规则主捋%Ria
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CFHR1通过调控TNF-α分泌增加足细胞损伤的研究
- 二零二五年度农村集体土地拆迁补偿合同4篇
- 二零二五年度风力发电机组安装与运行管理合同3篇
- 二零二四年度装配式建筑泥水班组劳务分包服务合同3篇
- 2025年度酒店窗帘改造与升级服务合同3篇
- 二零二五年度瓷砖国内运输配送与区域市场拓展合同4篇
- 二零二四年生态公园绿化苗木采购与生态修复合同3篇
- 玩具运输合同税率策略
- 二零二五版首付分期购房合同范本解析手册3篇
- 房屋代购合同范本wps
- 化学-河南省TOP二十名校2025届高三调研考试(三)试题和答案
- 智慧农贸批发市场平台规划建设方案
- 林下野鸡养殖建设项目可行性研究报告
- 2023年水利部黄河水利委员会招聘考试真题
- Python编程基础(项目式微课版)教案22
- 01J925-1压型钢板、夹芯板屋面及墙体建筑构造
- 欠电费合同范本
- 2024年新高考地区数学选择题填空压轴题汇编十八含解析
- 大型商场招商招租方案(2篇)
- 2022年袋鼠数学竞赛真题一二年级组含答案
- 三氟乙酰氯(CAS:354-32-5)理化性质及危险特性表
评论
0/150
提交评论