版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章
基础案例案例介绍周最小最大交易日获取股票价格指数周收益率计算案例介绍第7章
计算上证A股指数(代码:000002)2017年的周收益率。周收益率=(周最大交易日收盘指数−周最小交易日收盘指数)/周最小交易日收盘指数本案例使用了交易日历表和指数日交易数据表MarkettypeClddtDaywkState12017-01-032O12017-01-043O12017-01-054O12017-01-065O12017-01-091O12017-01-102O12017-01-113O12017-01-124O12017-01-135O……………………IndexcdIdxtrd01Idxtrd050000022017-01-033283.450000022017-01-043307.450000022017-01-053314.390000022017-01-063302.790000022017-01-093320.530000022017-01-103310.490000022017-01-113284.370000022017-01-123266.040000022017-01-133259.27………………周最小和最大交易日获取第7章
由于我们获取的数据为日行情交易数据,无法直接计算周收益率,需要对交易日历数据进行处理,即找出每周的最大交易日和最小交易日。从交易日历表的星期(Daywk)字段可以看出,当前星期值比下一个星期值大,其对应的交易日即为本周的最大交易日,下一个星期值对应的交易日即为下周的最小交易日。算法如下:输入:交易日历数据表date。输出:周最小交易日和最大交易日列表list1和list2。Step1:定义空的列表list1和list2,将交易日历表中的首个交易日添加到list1中。Step2:从第2个交易日开始至倒数第2个交易日,如果其星期值大于下一个交易日的星期值,
则将其交易日添加到list2中,下一个交易日添加到list1中。Step3:将最后的交易日添加到list2中。周最小和最大交易日获取第7章
importpandasaspdx=pd.read_excel('TRD_Cale.xlsx')list1=['2017-01-03']list2=[]fortinrange(1,len(x)-1):p=x.iloc[t-1,[2]][0]q=x.iloc[t,[2]][0]ifq<p:list1.append(x.iloc[t,[1]][0])list2.append(x.iloc[t-1,[1]][0])list2.append('2017-12-29')周收益率计算第7章
获得每周的最小交易日列表list1和最大交易日列表list2后,可以通过循环的方式,依次取最大交易日和最小交易日对应的收盘指数,利用前面介绍的公式计算即可获得周收益率指标数据。data=pd.read_excel('IDX_Idxtrd.xlsx')importnumpyasnpr=np.zeros(len(list1))foriinrange(len(list1)):p1=data.loc[data['Idxtrd01'].values==list1[i],'Idxtrd05'].valuesp2=data.loc[data['Idxtrd01'].values==list2[i],'Idxtrd05'].valuesr[i]=(p2-p1)/p1第0周的最大交易日2017年1月6日对应的收盘指数3302.76,减去第0周最小交易日2017年1月3日对应的收盘指数3283.45,再除以第0周最小交易日2017年1月3日对应的收盘指数3283.45,就可以得到周收益率指标数据为:0.00589015。周收益率计算第7章
importpandasaspdA=pd.read_excel('IDX_Idxtrd.xlsx')A['Idxtrd01']=pd.to_datetime(A.iloc[:,1])A['month']=A['Idxtrd01'].dt.monthA['week']=A['Idxtrd01'].dt.isocalendar().weekA_w=A.iloc[:,[2,4]]A_m=A.iloc[:,[2,3]]p1=A_w.groupby(['week'])['Idxtrd05'].first().valuesp2=A_w.groupby(['week'])['Idxtrd05'].last().valuesw_r=(p2-p1)/p1可参考第3章中的时间元素提取和分组统计方法进行计算,其方法更加简洁,但是结果可能存在一些差异。第7章
基础案例案例介绍指标计算案例介绍第7章
找出“计算机、通信和其他电子设备制造业”所有上市公司2015年~2017年连续3年净利润增长率都在40%以上的公司。当期净利润增长率=(当期净利润−上期净利润)/上期净利润。本案例使用的数据表包括:计算机、通信和其他电子设备制造业公司利润表和股票行业基本信息表StkcdAccperB0020001010000162014-12-3152623527.860000162015-12-31-12568193150000162016-12-3195673028.030000162017-12-3150570251560000202014-12-317687620.270000202015-12-31-4200845.61………………StkcdStknmeNnindnmae000016深康佳A计算机、通信和其他电子设备制造业000020深华发A计算机、通信和其他电子设备制造业000021深科技计算机、通信和其他电子设备制造业000045深纺织A计算机、通信和其他电子设备制造业000050深天马A计算机、通信和其他电子设备制造业000063中兴通讯计算机、通信和其他电子设备制造业000066中国长城计算机、通信和其他电子设备制造业000068华控赛格计算机、通信和其他电子设备制造业………………指标计算第7章
上市公司净利润增长率指标计算的基本思路如下:首先需要选择满足2014年~2017年都存在利润数据的上市公司,不满足条件的删除。其方法是将data2.xlsx中的Stkcd列转化为序列,采用值统计函数value_counts()即可实现筛选。其次对满足条件的股票代码,采用循环的方式,依次取得4年的净利润数据,将其转化为Numpy数据组的形式,假设记为d,则3年的净利润增长率=(d[1:]-d[0:-1])/d[0:-1]。最后将结果整理为数据框的形式展现出来。指标计算第7章
#1.数据准备importpandasaspddt=pd.read_excel('data2.xlsx')code=dt['Stkcd'].value_counts()code=list(code[code==4].index)info=pd.read_excel('info.xlsx')S=pd.Series(info.iloc[:,1].values,index=info.iloc[:,0].values)#2.预定义列表,用于存放各年的净利润增长率,并赋值计算list1=[]list2=[]list3=[]list4=[]fortinrange(len(code)):d=dt.iloc[dt.iloc[:,0].values==code[t],2].values
r=(d[1:]-d[0:-1])/d[0:-1]iflen(r[r>0.4])==3:list1.append(S[code[t]])list2.append(r[0])list3.append(r[1])list4.append(r[2])#3.结果转换为数据框D={'2015':list2,'2016':list3,'2017':list4}D=pd.DataFrame(D,index=list1)第7章
基础案例案例介绍绘图数据计算绘图及图形保存案例介绍第7章
本案例主要介绍股票日收盘价格、成交量的走势图以及月交易量分布饼图的绘制技能,并进一步介绍了子图的绘制方法。股票代码交易日期收盘价交易量6000002017-01-0316.3162371256000002017-01-0416.33296587346000002017-01-0516.3264376466000002017-01-0616.18171955986000002017-01-0916.2149087456000002017-01-1016.1979967566000002017-01-1116.169193332……………………(1)绘制股票代码600000日期为2017年1月3日—2017年1月20日的收盘价格走势图。(2)绘制股票代码600000日期为2017年1月3日—2017年1月24日的交易量柱状图。(3)计算股票代码600000,2017年1月—11月的交易量,并绘制其饼图。(4)将以上的价格走势图、柱状图、饼图在同一个figure上以子图的形式绘制出来。任务如下:绘图数据计算第7章
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltdata=pd.read_excel('trd.xlsx')dt=data.loc[data['股票代码']==600000,['交易日期','收盘价','交易量']]I1=dt['交易日期'].values>='2017-01-03'I2=dt['交易日期'].values<='2017-01-20'dta=dt.iloc[I1&I2,:]y1=dta['收盘价']x1=range(len(y1))I3=dt['交易日期'].values>='2017-01-03'I4=dt['交易日期'].values<='2017-01-24'dta=dt.iloc[I3&I4,:]y2=dta['交易量']x2=range(len(y2))D=np.zeros((11))list1=list()forminrange(11):m=m+1ifm<10:m1='2017-0'+str(m)+'-01'm2='2017-0'+str(m)+'-31'mon='0'+str(m)else:m1='2017-'+str(m)+'-01'm2='2017-'+str(m)+'-31'mon=str(m)I1=dt['交易日期'].values>=m1I2=dt['交易日期'].values<=m2D[m-1]=dt.iloc[I1&I2,[2]].sum()[0]list1.append(mon)绘图及图形保存第7章
1.股票价格走势图绘制plt.figure(1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盘价',fontproperties='SimHei')plt.title(u'收盘价走势图',fontproperties='SimHei')plt.savefig('1')绘图及图形保存第7章
2.交易量分布柱状图plt.figure(2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趋势图',fontproperties='SimHei')plt.savefig('2')绘图及图形保存第7章
3.月交易量分布饼图plt.figure(3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小数点后两位plt.title(u'月交易量分布图',fontproperties='SimHei')plt.savefig('3')绘图及图形保存第7章
4.收盘价走势图、交易量分布图和月交易量饼图组成的3×1子图plt.figure(4)plt.figure(figsize=(14,6))plt.subplot(1,3,1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盘价',fontproperties='SimHei')plt.title(u'收盘价走势图',fontproperties='SimHei')plt.subplot(1,3,2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趋势图',fontproperties='SimHei')plt.subplot(1,3,3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小数点后两位plt.title(u'月交易量分布图',fontproperties='SimHei')plt.savefig('4')第7章
基础案例案例介绍图像绘制案例介绍第7章
今有中小板股票002001~002020共20个,以及2016年5月1日—2016年8月1日的交易数据StkcdTrddtClsprc0020012016-05-0320.990020012016-05-0420.420020012016-05-0520.490020012016-05-0618.70020012016-05-0918.670020012016-05-1019.07………………其中字段依次表示股票代码、交易日期、收盘价。任务如下:(1)计算每只股票10日移动平均收盘价格数据。(2)绘制每只股票收盘价走势图和移动平均收盘价走势图,并用子图的形式表示出来。案例介绍第7章
说明:每个figure按照2×2划分,即每个figure绘制4只股票的收盘价走势图和移动平均价格走势图,20只股票则需要5个figure,使用循环的方式实现。提示:可以考虑使用Python中的取余运算来实现,取余符号为%,例如:0%4=01%4=12%4=23%4=34%4=05%4=16%4=27%4=38%4=09%4=1……凡是取余为0的时候都需要创建一个figure,在这个figure中绘制4个子图。图形绘制第7章
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplttrd=pd.read_excel('trd.xlsx')#获取股票代码,并转化为列表的形式c=trd['Stkcd'].value_counts()code=list(c.index)#动态计算需要q个figure,#其中每个figure绘制4个子图,每个子图代表一个股票#初始值设置q=0q=0#循环对每一个股票绘制其图形foriinrange(20):
#第i个股票的收盘价记为p,并计算其移动平均价
#构造绘图的横轴和纵轴坐标值
p=trd.loc[trd['Stkcd'].values==code[i],'Clsprc']
avg_p=p.rolling(10).mean()
x1=np.arange(0,len(p))
y1=p.values
y2=avg_p[9:]
x2=np.arange(9,len(p))
#如果i与4整除,代表需要重新建一个figure(每个figure有4个子图)
ifi%4==0:
q=q+1
plt.figure(q)
plt.figure(figsize=(8,6))
plt.subplot(2,2,i%4+1)
plt.tight_layout()#用于设置图像外部边缘自动调整
plt.plot(x1,y1)
plt.plot(x2,y2)
plt.savefig(str(q))图形绘制第7章
第7章
基础案例案例介绍指标计算模型求解案例介绍第7章
沪深300指数作为中国股票价格指数的代表,也是中国股指期货的标的指数,对其走势预测具有积极的现实意义与应用价值。今有沪深300指数2014年的交易数据。IndexcdIdxtrd01Idxtrd02Idxtrd03Idxtrd04Idxtrd05Idxtrd060003002014-01-022323.432325.992310.652321.98451942.90003002014-01-032311.972314.842280.892290.78597826.50003002014-01-062286.372286.372229.332238.646630040003002014-01-072222.312246.792218.6522384375310003002014-01-082240.642262.582228.422241.91513488.50003002014-01-092236.972258.892220.82222.22559870.40003002014-01-102216.522224.492200.222204.85541692.90003002014-01-1322072222.072183.62193.68501227.70003002014-01-142192.842214.122179.912212.85540499.50003002014-01-152210.022215.92193.82208.94489624……………………………………字段依次表示指数代码、交易日期、开盘价、最高价、最低价、收盘价、成交量。案例介绍第7章
计算如下指标:A1(收盘价/均价):收盘价/过去10个交易日的移动平均收盘价。A2(现量/均量):成交量/过去10个交易日的移动平均成交量。A3(收益率):(当日收盘价−前日收盘价)/前日收盘价。A4(最高价/均价):最高价/过去10个交易日的移动均平均收盘价。A5(最低价/均价):最低价/过去10个交易日的移动平均收盘价。A6(极差):最高价−最低价(衡量波动性)。A7(瞬时收益):收盘价−开盘价。Y(决策变量):后交易日收盘价−当前交易日收盘价,如果大于0,记为1;如果小于等于0,记为−1。同时对指标A1~A7做标准化处理:(当前值−均值)/标准差,最终得到以下标准的数据结构形式。IDA1A2A3A4A5A6A7Y123……取后30行数据作为测试样本,剩下的数据作为训练样本,分别利用神经网络、支持向量机、逻辑回归模型进行训练及测试,获得对应模型的准确率和预测准确率。指标计算第7章
1.计算特征指标X,即A1~A7importpandasaspdtd=pd.read_excel('index300.xlsx')A1=td['Idxtrd05']/td['Idxtrd05'].rolling(10).mean()A2=td['Idxtrd06']/td['Idxtrd06'].rolling(10).mean()A3=td['Idxtrd08']A4=td['Idxtrd03']/td['Idxtrd05'].rolling(10).mean()A5=td['Idxtrd04']/td['Idxtrd05'].rolling(10).mean()A6=td['Idxtrd03']-td['Idxtrd04']A7=td['Idxtrd05']-td['Idxtrd02']X={'A1':A1,'A2':A2,'A3':A3,'A4':A4,'A5':A5,'A6':A6,
'A7':A7}X=pd.DataFrame(X)X=X.iloc[9:-1,]#注意X从第10行数据开始,至倒数第1行指标计算第7章
2.计算决策变量Y#错位相减,获得指数的涨跌额,即收盘指数序列中的第2个元素至最后一个元素对应减去第1个元素至倒数第1个元素Y=td['Idxtrd05'].values[1:]-td['Idxtrd05'].values[:-1]#Y与X的下一个交易日对应,故Y的值从第11行数据开始#由于错位相减是从第2行开始的,故指标从第10行开始取Y=Y[9:]#走势标识设置Y[Y>0]=1Y[Y<=0]=-1#对应的Y值Y=Y.reshape(len(Y),1)模型求解第7章
1.训练样本与测试样本的划分x_train=X.iloc[:len(X)-30,:]Y_train=Y[:len(Y)-30]x_test=X.iloc[len(X)-30:,:]Y_test=Y[len(Y)-30:]2.模型训练与求解#支持向量机模型fromsklearnimportsvmclf=svm.SVC(kernel='rbf')clf.fit(x_train,Y_train)rv1=clf.score(x_train,Y_train);R=clf.predict(x_test)R=R.reshape(len(R),1)Z=R-Y_testRs1=len(Z[Z==0])/len(Z)第7章
基础案例案例介绍案例分析及计算案例介绍第7章
以申万行业分类表中“计算机”行业所有上市公司2015年的盈利能力指标数据为基础字段名称指标名称说明F050502B净资产收益率B净利润/股东权益平均余额(X1)F050102B资产报酬率B(利润总额+财务费用)/平均资产总额(X2)F050202B总资产净利润率B净利润/总资产平均余额(X3)F051201B投入资本回报率(净利润+财务费用)/(资产总计−流动负债+应付票据+短期借款+一年内到期的非流动负债)(X4)F051501B营业净利率净利润/营业收入(X5)F053301B营业毛利率(营业收入−营业成本)/营业收入(X6)F051401B营业利润率营业利润/营业收入(X7)F052101B成本费用利润率(利润总额)/(营业成本+销售费用+管理费用+财务费用)(X8)采用K-均值聚类算法,将上市公司分为5类,并计算每类公司当年的总利润平均增长率每类公司当年的总利润平均增长率=(该类公司当年的总利润平均值-该类公司上年的总利润平均值)/该类公司上年的总利润平均值。每类公司当年的总利润平均值=(该类别中所有公司当年利润之和)/该类别的公司数量案例分析及计算第7章
1.获取2015年所有公司股票的财务指标数据importpandasaspdimportnumpyasnpdata=pd.read_excel('财务指标数据.xlsx')data2=data.iloc[:,[0,2,3,4,5,6,7,8,9]]案例分析及计算第7章
2.对财务指标数据进行清洗#去掉小于0的指标值和nan值data2=data2[data2>0]data2=data2.dropna()3.对财务指标数据进行异常值处理#数据转化为Numpy数组的形式,同时每个大于其均值8倍的指标视为异常值,并删掉data2=data2.valuesforiinrange(1,9):data2=data2[data2[:,i]<8*np.mean(data2[:,i]),:]案例分析及计算第7章
4.选择“计算机”行业所有上市公司的数据(本步骤可以通过内连接关联获取)从预处理过的财务指标数据中选择申万行业分类表中“计算机”行业所有上市公司的数据。其处理过程分两步。(1)获取申万行业分类表中“计算机”行业所有上市公司的股票代码。
dta=pd.read_excel('申万行业分类.xlsx')
#申万行业分类表中“计算机”行业所有上市公司股票代码
stkcd=dta.loc[dta['行业名称'].values=='计算机','股票代码'].values案例分析及计算第7章
4.选择“计算机”行业所有上市公司的数据执行算法如下:Step1:获取预处理过的财务指标数据data2中的所有代码,s=data2[:,0]。Step2:s循环地与申万行业分类表中“计算机”行业所有上市公司股票代码stkcd做存在性判断。Step3:得到满足判断条件的逻辑数组I,以I作为逻辑索引,取data2表中的元素即可。s=data2[:,0]I=s==stkcd[0]foriinrange(1,len(stkcd)):I1=s==stkcd[i]I=I|I1ddata=data2[I,:]#申万行业分类表中“计算机”行业所有上市公司股票代码对应的财务数据#提取申万行业分类表中“计算机”行业所有上市公司股票码对应的财务指标数据X,用来做主成分分析。X=ddata[:,1:](2)从预处理过的财务指标数据中选择满足条件的数据。案例分析及计算第7章
5.对指标数据X做标准化处理#这里采用极差法进行标准化。fromsklearn.preprocessingimportMinMaxScalerscaler=MinMaxScaler()scaler.fit(X)X=scaler.transform(X)6.对标准化后的X做主成分分析fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)#累计贡献率为95%Y=pca.fit_transform(X)#提取的主成分tzxl=ponents_#返回特征向量gxl=pca.explained_variance_ratio_#返回主成分方差百分比(贡献率)#对主成分Y做标准化处理(极差法)scaler=MinMaxScaler()scaler.fit(Y)Y=scaler.transform(Y)案例分析及计算第7章
Y1=0.3583×X1+0.3777×X2+0.4025×X3+0.4337×X4+0.375×X5+0.2696×X6+0.3205×X7+0.2508×X8Y2=0.3593×X1+0.1897×X2+0.1434×X4+0.4053×X4−0.3458×X5−0.658×X6−0.2331×X7−0.2076×X8Y3=0.0673×X1+0.0213×X2−0.0006×X3+0.32×X4−0.3328×X5+0.6801×X6−0.4713×X7−0.3118×X8Y1-综合盈利能力因子;Y2-产品竞争力因子;Y3-管理能力因子案例分析及计算第7章
7.K-均值聚类分析fromsklearn.clusterimportKMeansmodel=KMeans(n_clusters=5,random_state=0,max_iter=1000)model.fit(Y)c=model.labels_#类标签center=model.cluster_centers_#聚类中心center=pd.DataFrame(center)center.columns=['Y1','Y2','Y3']案例分析及计算第7章
7.K-均值聚类分析Fs=pd.Series(c,index=ddata[:,0])Fs=Fs.sort_values()co=pd.read_excel('公司基本信息表.xlsx')co1=pd.Series(co['Stknme'].values,index=co['Stkcd'].values)foriinrange(5):
q=co1[Fs[Fs==i].index]
q=pd.DataFrame(q)
q.to_excel('c'+str(i)+'.xlsx')类别股票代码0科远股份、合众思壮、易联众、初灵信息、数码科技、御银股份、长亮科技、新国都、安硕信息、汇金股份、北信源、创业软件、华平股份、久其软件、华力创通、银之杰、方直科技、美亚柏科、榕基软件、东方通、英飞拓、新北洋、旋极信息、中威电子、科大讯飞、迪威迅、威创股份、新开普、立思辰、任子行、辉煌科技、天玑科技、远光软件1运达科技、朗玛信息、华铭智能、东方国信、捷成股份、兆日科技、二三四五、康拓红外、联络互动、思维列控、拓尔思、东方网力、世纪瑞尔2深科技、中科金财、太极股份、常山北明、浩丰科技、润和软件、航天长峰、高伟达、证通电子、川大智胜、宝信软件、南天信息、皖通科技、金财互联、四方精创、神州泰岳、万达信息、云赛智联、索菱股份、飞利信、方正科技、京天利、同有科技、汉鼎宇佑、创意信息、达实智能、数字政通、达华智能、千方科技、紫光股份、汉邦高科、易华录、石基信息、荣之联、中远海科、天源迪科、华胜天成、海兰信、朗科科技、东软集团、荣科科技、同方股份、赛为智能、南威软件、*ST中安3博彦科技、中科创达、久远银海、金桥信息、华东电脑、华宇软件、蓝盾股份、浙大网新、浪潮软件、真视通、捷顺科技、航天信息、金证股份、银信科技、浪潮信息、信息发展、飞天诚信、佳都科技、聚龙股份、卫士通、信雅达、神州信息、广电运通、浩云科技、新大陆、中科曙光、东华软件、神思电子、卫宁健康、恒华科技、汉得信息4赢时胜、广联达、超图软件、用友网络、恒生电子、绿盟科技、四维图新、启明星辰案例分析及计算第7章
8.计算每类公司2015年总利润平均值增长率rd=pd.read_excel('利润数据.xlsx')r_c=[]#预定义每个类别总利润平均增长率forninrange(5):#获得第n类股票代码列表cn=list(Fs[Fs==n].index)#预定义第n类股票2014年和2015年的总利润值r1_n=0r2_n=0#循环地对第n类中的每个股票进行计算fortincn:#第n类股票中第t只股票I1=rd['Accper'].values=='2014-12-31'I2=rd['Accper'].values=='2015-12-31'I3=rd['Stkcd'].values==tindex1=I1&I3index2=I2&I3
#第n类股票中第t只股票2014年的利润值r1=rd.loc[index1,'B002000101'].values#第n类股票中第t只股票2015年的利润值r2=rd.loc[index2,'B002000101'].valuesiflen(r1)>0:r1_n=r1_n+r1iflen(r2)>0:r2_n=r2_n+r2#第n类股票2015年的总利润平均值p2=r2_n/len(cn)#第n类股票2014年的总利润平均值p1=r1_n/len(cn)#将总利润平均增长率添加到r_c中r_c.append((p2-p1)/p1)#将每个类别的总利润平均增长率添加到聚类中心后面列r_c=np.array(r_c)dt=np.hstack((center.values,r_c))dtt=pd.DataFrame(dt)dtt.columns=['Y1','Y2','Y3','r_c']案例分析及计算第7章
8.计算每类公司2015年总利润平均值增长率中r_c列为各类公司的总利润平均增长率。从图7-21中可以看出,第2类(index为1)上市公司的综合盈利能力最强,而且其产品竞争力和管理能力也相对较好,最终结果也可以看出,当年的总利润平均增长率也最高第7章
基础案例问题描述数据预处理关联规则挖掘问题描述第7章
为了探讨国际上主要股票价格指数之间的涨跌关联情况,选取12个主要国家或者地区中具有代表性的股票价格指数交易数据,数据表包括国际股票价格指数基本信息表和国际股票价格指数日交易数据表。IndexcdIdxnmeDJI美国道琼斯工业指数FCHI法国CAC40指数FTSE英国富时100指数GDAXI德国DAX指数HSI中国香港恒生指数KS11韩国KOSPI指数MCIX俄罗斯Micex指数N225日本日经225SENSEX印度孟买30指数STI富时新加坡海峡时报指数TWII中国台湾加权指数000300中国沪深300指数IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………………………其中字段依次为指数代码、交易日期、开盘指数、最高指数、最低指数、收盘指数。数据区间从2010年1月至2019年8月。问题:在一国或地区由于受某事件的影响造成其主要股票价格指数下跌幅度较大时,另一国或地区的主要股票价格指数在同期是否也会有较大幅度的下跌?注意,这里下跌幅度较大定义为:跌幅大于等于0.5%。数据预处理第7章
(1)计算各指数的跌幅指标数据,其中跌幅计算公式为:
(当日收盘指数−上日收盘指数)/上日收盘指数为了便于关联规则挖掘,我们将跌幅指标数据转化为0、1布尔值,即跌幅大于等于0.5%记为1,否则为0。图中第一行代表了中国沪深300指数的跌幅数据,其中2010年1月5日的值为0,表示跌幅没有超过0.5%,而2010年1月6日的值为1,表示当日跌幅超过了0.5%。数据预处理第7章
(2)各指数交易日期做一致化处理。事实上,不同国家或地区的交易日期并不完全相同,为了便于挖掘有意义的关联规则,需要在所有指数交易日均相同的情况下进行挖掘。这里以中国沪深300指数交易日为筛选基准。显示12个国际指数,20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四年级数学(三位数乘两位数)计算题专项练习及答案
- 二年级数学计算题专项练习集锦
- 徐州工程学院《数字媒体艺术赏析》2022-2023学年第一学期期末试卷
- 投资股票市场的基本分析计划
- 战胜主管年度工作计划的常见困难
- 研发质量控制与风险管理培训
- 开展传统文化教育的计划
- 徐州工程学院《计算机辅助设计(二)(Premere、AfterEffects)》2021-2022学年第一学期期末试卷
- 徐州工程学院《服装工业制版》2022-2023学年第一学期期末试卷
- 邢台学院《色彩》2021-2022学年第一学期期末试卷
- 中国2型糖尿病防治指南(2020年版)
- 汽车4S店安全标准化之隐患排查与治理制度
- 《古兰》中文译文版
- NBT47013-2015承压设备无损检测
- 2023全国日语高考答题卡word版
- 初中数学浙教版七年级上册第3章实数3.4实数的运算 全国一等奖
- GB/T 2794-2022胶黏剂黏度的测定
- GB/T 8488-2001耐酸砖
- GB/T 4744-2013纺织品防水性能的检测和评价静水压法
- GB/T 23703.2-2010知识管理第2部分:术语
- GB/T 17587.3-2017滚珠丝杠副第3部分:验收条件和验收检验
评论
0/150
提交评论