《数据采集与处理技术》课件-4.7 Kafka与MySQL的组合使用_第1页
《数据采集与处理技术》课件-4.7 Kafka与MySQL的组合使用_第2页
《数据采集与处理技术》课件-4.7 Kafka与MySQL的组合使用_第3页
《数据采集与处理技术》课件-4.7 Kafka与MySQL的组合使用_第4页
《数据采集与处理技术》课件-4.7 Kafka与MySQL的组合使用_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章分布式消息系统Kafka目

录4.1Kafka简介4.2Kafka在大数据生态系统中的作用4.3Kafka与Flume的区别与联系4.4Kafka相关概念4.5Kafka的安装和使用4.6使用Python操作Kafka4.7Kafka与MySQL的组合使用4.7Kafka与MySQL的组合使用4.7Kafka与MySQL的组合使用这里通过一个实例来演示Kafka与MySQL的组合使用。需要完成的任务是,把JSON格式数据放入Kafka发送出去,然后,再从Kafka中获取到JSON格式数据,对其进行解析并写入到MySQL数据库。请参照第2章的内容完成MySQL数据库的安装,并学习其使用方法。4.7Kafka与MySQL的组合使用编写一个生产者程序producer_json.py:#producer_json.pyfromkafkaimportKafkaProducerimportjson

producer=KafkaProducer(bootstrap_servers='localhost:9092',value_serializer=lambdav:json.dumps(v).encode('utf-8'))#连接kafka

data={"sno":"95001","name":"John","sex":"M","age":23}

producer.send('json_topic',data)#发送的topic为json_topicproducer.close()4.7Kafka与MySQL的组合使用编写一个消费者程序consumer_json.py:#consumer_json.pyfromkafkaimportKafkaConsumerimportjsonimportpymysql.cursors

consumer=KafkaConsumer('json_topic',bootstrap_servers=['localhost:9092'],group_id=None,auto_offset_reset='earliest')formsginconsumer:msg1=str(msg.value,encoding="utf-8")#字节数组转成字符串dict=json.loads(msg1)#字符串转换成字典#连接数据库connect=pymysql.Connect(host='localhost',port=3306,user='root',#数据库用户名passwd='123456',#密码db='school',charset='utf8')

4.7Kafka与MySQL的组合使用#获取游标cursor=connect.cursor()

#插入数据sql="INSERTINTOstudent(sno,sname,ssex,sage)VALUES('%s','%s','%s',%d)"data=(dict['sno'],dict['name'],dict['sex'],dict['age'])cursor.execute(sql%data)mit()print('成功插入数据')

#关闭数据库连接connect.close()4.7Kafka与MySQL的组合使用在Windows系统中启动MySQL服务,然后,打开MySQL数据库的命令行界面,输入如下SQL语句创建数据库school:mysql>CREATEDATABASEschool;创建好数据库school以后,可以使用如下SQL语句打开数据库:mysql>USEschool;使用如下SQL语句创建一个表student:mysql>CREATETABLEstudent(->snochar(5),->snamechar(10),->ssexchar(2),->sageint);4.7Kafka与MySQL的组合使用使用如下SQL语句查看已经创建的表:mysql>SHOWTABLES;在Windows系统中启动Zookeeper服务和Kafka服务,然后,先执行生产者程序producer_json.py,再执行消费者程序consumer_json.py,执行成功以后,使用如下命令查看MySQL数据库中新插入的记录:mysql>SELECT*FROMstudent;可以看到,一条记录已经被成功地插入到了MySQL数据库。4.8本章小结Kafka是一个分布式、分区的、多副本的、多订阅者、基于Zookeeper协调的分布式日志系统,主要应用场景是日志收集系统和消息系统。LinkedIn于2010年把Kafka贡献给了Apache基金会并成为顶级开源项目。Kafka能够以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论