数据分析工具：Apache Druid：Druid数据可视化与仪表板构建

上传人：k*** IP属地：辽宁上传时间：2024-09-19 格式：DOCX 页数：28 大小：35.63KB 积分：6 举报 版权申诉

数据分析工具：Apache Druid：Druid数据可视化与仪表板构建_第2页

数据分析工具：Apache Druid：Druid数据可视化与仪表板构建_第3页

数据分析工具：Apache Druid：Druid数据可视化与仪表板构建_第4页

数据分析工具：Apache Druid：Druid数据可视化与仪表板构建_第5页

已阅读5页，还剩23页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据分析工具：ApacheDruid：Druid数据可视化与仪表板构建1数据分析工具：ApacheDruid：Druid数据可视化与仪表板构建1.1简介与准备工作1.1.1ApacheDruid简介ApacheDruid是一个开源的数据存储和查询系统，专为实时分析大规模数据集而设计。它能够处理PB级别的数据，提供低延迟的数据查询和聚合功能，非常适合实时监控和交互式数据探索。Druid支持多种数据源，如CSV、JSON文件，以及数据库如MySQL、PostgreSQL等，能够快速摄取和查询数据。1.1.2安装与配置Druid安装Druid下载Druid：访问ApacheDruid的官方网站，下载最新版本的Druid压缩包。解压：将下载的压缩包解压到指定目录。启动Druid：在解压后的目录中，运行bin/start-druid.sh脚本来启动Druid集群。Druid集群通常包括协调器（coordinator）、中间层（middlemanager）、历史服务器（historicalserver）、查询代理（broker）和数据摄取节点（indexer）。配置DruidDruid的配置主要通过修改conf/druid/目录下的配置文件实现。以下是一个基本的配置示例：#coordinator配置

cat>conf/druid/coordinator/_default_.json<<EOF

{

"type":"coordinator",

"service":"druid-coordinator",

"maxTaskSize":100000000,

"minSegmentSize":50000000,

"maxSegmentsToMove":100,

"maxSegmentsToLoad":100,

"maxPendingSegments":100,

"maxSegmentsPerTier":1000,

"maxSegmentsPerInterval":100,

"maxSegmentsToUnload":100,

"maxSegmentsToPersist":100,

"maxConcurrentPeeks":10,

"maxConcurrentPeeksPerTier":10,

"maxConcurrentPeeksPerInterval":10,

"maxConcurrentPeeksPerDataSource":10,

"maxConcurrentPeeksPerDataSourceTier":10,

"maxConcurrentPeeksPerDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegment":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSource":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTier":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegment":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSource":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTier":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegment":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSource":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTier":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegment":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSource":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTier":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegment":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSource":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceInterval":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTier":10,

"maxConcurrentPeeksPerDataSourceTierIntervalSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegmentDataSourceIntervalTierSegment":10,

}

EOF

#historicalserver配置

cat>conf/druid/historical/_default_.json<<EOF

{

"type":"historical",

"service":"druid/historical",