mysql日志和数据存储系统-for vip user_第1页
mysql日志和数据存储系统-for vip user_第2页
mysql日志和数据存储系统-for vip user_第3页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

38-MySQL:⽇志和数据系 推进 。 对于简单的、⼩规模的数据,例如orderbook信息,我们完全可以把数据存在txt、csv⽂件中,这样做简 观的⽅式出现了,我们可以把每天的数据存在个⽂件中,这样就暂时缓解了尴尬。这节课,我们就以MySQL这种传统型关系数据库为例,讲 担 L属于典型的关系型数据库(S),所谓的关系型数据库,就是指建⽴在关系模型基础上的数据 ⾏则 ⾄于操作MySQL, Python连接数据库的⽅式有好多种,这⾥我简单介绍其中两种。我们以Ubuntu为例,假设你的系统中已经安装过MySQLServer。(安装MySQL可以参考这篇⽂章https ,n接SL的 是SQLhn叫Sb基于⽀持h于C,在Wns⽤,版本 c。SQL来操作数据库,那么我优先推荐使⽤这个框架。sudosudoaptgetinstallpython3devpipinstallmysqlclient importimportconn=alhost',port=3306,)cur=conn.cursor()CREATETABLEpricetimestampTIMESTAMPNOTNULL,BTCUSDFLOAT(8,2),PRIMARYKEYINSERTINTOpriceVALUES("20190714代码的思路很清晰PRIMARYKEYINSERTINTOpriceVALUES("20190714个主要的原因就是,这样可以把集合操作转换成单个记录处理的⽅式。如果⽤SQL语⾔从数据库中检索 ⽤⼾在MySQL内逐⾏ 个条了简化代码突出重点,我只保留了timestamp和price。 mit()来提交更改,然后close()掉连接就可以了LrM这⾥所说的ORM(ObjectRelationalMap ,简称ORM),是Python对象与数据库关系表的种映射关系,有了ORM后,我们就不再需要写SQL语句,⽽可以直接使⽤Python的数据结构了。ORM框架的优点,是提⾼了写代码的速度,同时兼容多种数据库系统,如 这些数据库;⽽付出的代价,可能就是性能上的些损失。接下来要讲的peewee,正是其中种基于Python的ORM框架,它的学习成本⾮常低,可以说是ORMpippipinstall importfrompeeweeimportdb=MySQLDatabase('mysql',user='your_username',importfrompeeweeimportdb=MySQLDatabase('mysql',user='your_username',classtimestamp=peewee.DateTimeField(primary_key=True)BTCUSD=peewee.FloatField()classdatabase=deftest_peewee():price=Price(timestamp='2019060713:17:18',MySQL张数据表;只要对其中每Python显⽽易⻅,peeweeSQL能有效减少出bug的概率。不过,事实上,作为名数据科学家,或者作为名量化从业者(quant),你要处理的数据远⽐这些复杂 握数据处理的⽅法。当然,如果你已经错过学⽣时期的话,现在开始也是个不错的选择,毕竟,逐渐形成数据库有了量化数据存⼊后,接下来,我们便可以开始进⾏些量化分析了。这块⼉也是个很⼤的学术领域,叫做时间序列分析,不过就今天这节课的来说,我们仅做抛砖引⽟,列举个⾮常简单的例⼦,即求过去个⼩时BC/USD的最⾼价和。importimportimportnumpyasconn=MySQLdb.connect()cur=conn.cursor()timestamp> interval60BTCUSD=np.array(cur.fetchall())print(BTCUSD.max(),代码看起来很)cur=conn.cursor()timestamp> interval60BTCUSD=np.array(cur.fetchall())print(BTCUSD.max(), 系时 了 。是开 ⾏Lr开进 责将各个模块的log收集起来,然后发送到收集系统中。收集系统整理过后,再将信息存到⽇志系统。当然,除了简单的消息队列,我们还能⽤很多⼯具,⽐如阿⾥云的Logtail、Apache的FlumeAgent等等。⽽到了后期,对于⽇志系统来说,越来越需要注意的就是效率和分析效率。随着使⽤的增加,数据会越来越多,因此我们可以考虑对些数据进⾏压缩和保存。⽽越是久远的数据,越是粗粒度的数据,被调⽤的 测,这样就可以得到历史数据易的收益率等数据。回测系统对于评估 测往往需要⼤量的资源,所以选取好数据库、数据⽅式,优化数据连接和计算,就显得⾄关重要。分,则应于控和警系。这种式对数据实性要求⾼ 些,于, 种⽅就来 ,也就是硅⾕⼤公司所说的“oncall”。旦发⽣意外,负责⼈会迅速收到 当然,现在已经有了不少开源的⼯具可以在云端使⽤,其中AWS属于全球领先的云计算平台。如果你的服 系统。我们从基础的MySQL的使⽤⽅法讲起, 最后给你留道思考题。量化交易需要的数据量不是很⼤,但是有可能出现调⽤频率极⾼的情况,例如回测系统。那么,你能想到哪些优化⼿段,来降低调⽤代价吗?欢迎留⾔和我讨论,也欢迎你把这篇⽂章出SCAR20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论