




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章分布式消息系统Kafka目
录4.1Kafka简介4.2Kafka在大数据生态系统中的作用4.3Kafka与Flume的区别与联系4.4Kafka相关概念4.5Kafka的安装和使用4.6使用Python操作Kafka4.7Kafka与MySQL的组合使用4.7Kafka与MySQL的组合使用4.7Kafka与MySQL的组合使用这里通过一个实例来演示Kafka与MySQL的组合使用。需要完成的任务是,把JSON格式数据放入Kafka发送出去,然后,再从Kafka中获取到JSON格式数据,对其进行解析并写入到MySQL数据库。请参照第2章的内容完成MySQL数据库的安装,并学习其使用方法。4.7Kafka与MySQL的组合使用编写一个生产者程序producer_json.py:#producer_json.pyfromkafkaimportKafkaProducerimportjson
producer=KafkaProducer(bootstrap_servers='localhost:9092',value_serializer=lambdav:json.dumps(v).encode('utf-8'))#连接kafka
data={"sno":"95001","name":"John","sex":"M","age":23}
producer.send('json_topic',data)#发送的topic为json_topicproducer.close()4.7Kafka与MySQL的组合使用编写一个消费者程序consumer_json.py:#consumer_json.pyfromkafkaimportKafkaConsumerimportjsonimportpymysql.cursors
consumer=KafkaConsumer('json_topic',bootstrap_servers=['localhost:9092'],group_id=None,auto_offset_reset='earliest')formsginconsumer:msg1=str(msg.value,encoding="utf-8")#字节数组转成字符串dict=json.loads(msg1)#字符串转换成字典#连接数据库connect=pymysql.Connect(host='localhost',port=3306,user='root',#数据库用户名passwd='123456',#密码db='school',charset='utf8')
4.7Kafka与MySQL的组合使用#获取游标cursor=connect.cursor()
#插入数据sql="INSERTINTOstudent(sno,sname,ssex,sage)VALUES('%s','%s','%s',%d)"data=(dict['sno'],dict['name'],dict['sex'],dict['age'])cursor.execute(sql%data)mit()print('成功插入数据')
#关闭数据库连接connect.close()4.7Kafka与MySQL的组合使用在Windows系统中启动MySQL服务,然后,打开MySQL数据库的命令行界面,输入如下SQL语句创建数据库school:mysql>CREATEDATABASEschool;创建好数据库school以后,可以使用如下SQL语句打开数据库:mysql>USEschool;使用如下SQL语句创建一个表student:mysql>CREATETABLEstudent(->snochar(5),->snamechar(10),->ssexchar(2),->sageint);4.7Kafka与MySQL的组合使用使用如下SQL语句查看已经创建的表:mysql>SHOWTABLES;在Windows系统中启动Zookeeper服务和Kafka服务,然后,先执行生产者程序producer_json.py,再执行消费者程序consumer_json.py,执行成功以后,使用如下命令查看MySQL数据库中新插入的记录:mysql>SELECT*FROMstudent;可以看到,一条记录已经被成功地插入到了MySQL数据库。4.8本章小结Kafka是一个分布式、分区的、多副本的、多订阅者、基于Zookeeper协调的分布式日志系统,主要应用场景是日志收集系统和消息系统。LinkedIn于2010年把Kafka贡献给了Apache基金会并成为顶级开源项目。Kafka能够以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年活性氧化铝项目规划申请报告
- 2025年茶艺师职业技能鉴定理论试卷(茶艺行业产业链延伸篇)
- 2025年初中历史七年级下册阶段检测试卷:历史知识与能力测评
- 2025年消防安全知识培训考试题库:消防设施操作案例分析试题库
- 时光荏苒我的成长故事记事12篇
- 2025年PETS二级英语听力训练试卷:短篇听力与对话解析
- 2025年翻译资格考试俄语二级笔译模拟试题卷
- 2025年电工特种作业操作证考试试卷:电力系统稳定运行与控制试题
- 智能物流2025:自动驾驶卡车在物流运输中的智能车载网络扩展报告
- 线下演出市场2025年复苏趋势下的演出市场创新技术应用前景报告
- 体育场馆物业管理操作规范
- 24春国开电大《旅游学概论》形考任务1-4试题及答案
- 人工智能导论智慧树知到期末考试答案章节答案2024年哈尔滨工程大学
- 【钦州市S区居民饮用水安全现状、问题及优化建议探析8300字(论文)】
- 生命伦理学:生命医学科技与伦理智慧树知到期末考试答案章节答案2024年山东大学
- JT∕T1180.4-2018交通运输企业安全生产标准化建设基本规范第4部分:道路普货运输
- 房地产企业目标成本管理研究
- 单位食堂供餐方案(2篇)
- 新课标小学生必背古诗75首(带拼音)
- 2022-2023学年高教版(2021)中职数学基础模块下册-指数函数与对数函数-单元测试卷
- 高中数学知识
评论
0/150
提交评论