版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章
基础案例问题描述数据预处理关联规则挖掘问题描述第7章
为了探讨国际上主要股票价格指数之间的涨跌关联情况,选取12个主要国家或者地区中具有代表性的股票价格指数交易数据,数据表包括国际股票价格指数基本信息表和国际股票价格指数日交易数据表。IndexcdIdxnmeDJI美国道琼斯工业指数FCHI法国CAC40指数FTSE英国富时100指数GDAXI德国DAX指数HSI中国香港恒生指数KS11韩国KOSPI指数MCIX俄罗斯Micex指数N225日本日经225SENSEX印度孟买30指数STI富时新加坡海峡时报指数TWII中国台湾加权指数000300中国沪深300指数IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………………………其中字段依次为指数代码、交易日期、开盘指数、最高指数、最低指数、收盘指数。数据区间从2010年1月至2019年8月。问题:在一国或地区由于受某事件的影响造成其主要股票价格指数下跌幅度较大时,另一国或地区的主要股票价格指数在同期是否也会有较大幅度的下跌?注意,这里下跌幅度较大定义为:跌幅大于等于0.5%。数据预处理第7章
(1)计算各指数的跌幅指标数据,其中跌幅计算公式为:
(当日收盘指数−上日收盘指数)/上日收盘指数为了便于关联规则挖掘,我们将跌幅指标数据转化为0、1布尔值,即跌幅大于等于0.5%记为1,否则为0。图中第一行代表了中国沪深300指数的跌幅数据,其中2010年1月5日的值为0,表示跌幅没有超过0.5%,而2010年1月6日的值为1,表示当日跌幅超过了0.5%。数据预处理第7章
(2)各指数交易日期做一致化处理。事实上,不同国家或地区的交易日期并不完全相同,为了便于挖掘有意义的关联规则,需要在所有指数交易日均相同的情况下进行挖掘。这里以中国沪深300指数交易日为筛选基准。显示12个国际指数,2010年1月至2019年8月的共同交易日一共1569个,基于一致化的交易日期,就可以构造关联规则挖掘所需的布尔数据集了。数据预处理第7章
(3)构造关联规则挖掘所需的布尔值数据集,其结果如下。道琼斯工业指数DJI在2010年1月15日的收盘指数跌幅在0.5%以上,中国沪深300指数当日的收盘指数跌幅低于0.5%,而且12个国际指数交易日期也做了一致化处理,下面将基于该数据集挖掘关联规则。关联规则挖掘第7章
采用第5章介绍的一对一关联规则挖掘算法,最小支持度设置为大于0.1,最小置信度为大于0.6。c=list(Data.columns)c0=0.6#最小置信度s0=0.1#最小支持度list1=[]#预定义定义列表list1,用于存放规则list2=[]#预定义定义列表list2,用于存放规则的支持度list3=[]#预定义定义列表list3,用于存放规则的置信度forkinrange(len(c)):forqinrange(len(c)):
#对第c[k]个项与第c[q]个项挖掘关联规则
#规则的前件为c[k]
#规则的后件为c[q]
#要求前件和后件不相等ifc[k]!=c[q]:c1=Data[c[k]]c2=Data[c[q]]
I1=c1.values==1I2=c2.values==1
t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1&I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度
#取置信度大于等于c0的关联规则ifco>=c0andsp>=s0:list1.append(c[k]+'--'+c[q])list2.append(sp)list3.append(co)#定义字典,用于存放关联规则及其置信度、支持度
R={'rule':list1,'support':list2,'confidence':list3}#将字典转化为数据框R=pd.DataFrame(R)#将结果导出到ExcelR.to_excel('rule1.xlsx')关联规则挖掘第7章
IDrulesupportconfidence1DJI--FCHI0.13001910.682DJI--GDAXI0.12109620.6333333333FCHI--FTSE0.19184190.6644591614FCHI--GDAXI0.22498410.7792494485FTSE--FCHI0.19184190.7757731966FTSE--GDAXI0.18419380.7448453617GDAXI--FCHI0.22498410.8364928918GDAXI--FTSE0.18419380.6848341239KS11--HSI0.13957930.63662790710KS11--N2250.1389420.6337209311STI--HSI0.14404080.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年碎石运输企业财务管理合同模板3篇
- 2024货车租赁合同范文
- 2024年版汽车零部件生产与供应合同
- 2024建筑劳务给排水分包合同范本
- 2024建筑工地钢筋原材料采购与验收合同
- 2025年度新型建筑材料销售合作合同范本3篇
- 2024食堂食材采购与劳务承包合作协议3篇
- 2024饲料行业市场调研与数据分析服务合同范本3篇
- 2024校服采购合同模板
- 2025年度电网接入与转供电服务合同3篇
- COPD(慢性阻塞性肺病)诊治指南(2023年中文版)
- 气相色谱仪作业指导书
- 中医院医院等级复评实施方案
- 跨高速桥梁施工保通专项方案
- 铁路货车主要轮对型式和基本尺寸
- 译林版南京学校四年级英语上册第一单元第1课时storytime导学单
- 理正深基坑之钢板桩受力计算
- 员工入职培训
- 铺种草皮施工方案(推荐文档)
- 10KV高压环网柜(交接)试验
- 综合单价的确定
评论
0/150
提交评论