百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Vertica如何将DC收集器信息发布到Kafka

lipiwang 2024-10-15 18:40 10 浏览 0 评论

您可能熟悉Vertica Data Collector(DC),并使用其收集的细粒度信息来监视和优化Vertica部署。一个常见的挑战是,数据收集器只将该信息的一部分保留在内部DC表中,然后将其保存到日志文件中。

Apache Kafka非常适合移动大量的小信息。 Vertica管理控制台(MC)可以通过Kafka将DC数据移动到另一个Vertica实例。如果您不使用MC或无法为扩展的直流存储创建另一个专用的Vertica实例,则此文章将介绍如何将DC数据发布到Kafka。数据在Kafka之后,您可以直接从Kafka利用它,或者使用它来提供另一个可能监控所有系统的系统(而不仅仅是Vertica)。

数据采集器和管理控制台的扩展监控

Vertica管理控制台提供扩展监视功能,用于扩展Data Collector存储以及监视和分析历史数据。由于Vertica将信息写入Data Collector表,Vertica生成匹配的Kafka数据消息(每个表一个主题)。单独的Vertica实例消耗这些Kafka消息,并将它们存储在复制DC表的本地模式中。然后,这些扩展表可用于通过管理控制台或通过访问该额外的Vertica实例来查看和分析数据库性能。

如果您没有使用管理控制台,或者没有备用的Vertica实例来扩展DC存储,则仍然可以利用内置机制将DC表发布到Kafka。我们来探讨一下吧。

Vertica通知器(Notifiers)

Vertica通知器是一种内置的基于推送的机制,可将Vertica的消息发送到终点,如Kafka。 如果您不想使用管理控制台的扩展监视,或者没有其他Vertica实例用于扩展存储,请使用此机制。

使用CREATE NOTIFIER SQL语句创建通知程序。 例如,以下语句创建一个名为my_notifier的通知程序。

  • ACTION参数标识目标Kafka代理。

  • MAXMEMORYSIZE参数定义通知队列的大小。

  • IDENTIFIED BY参数是通知程序的唯一标识符。 如果设置,此通知程序发布的所有消息将包含此属性。

在此语句中,通知程序将数据发布到运行在127.0.0.1和端口9092上的Kafka代理,通知队列大小为10M。 该声明还设置了与Kafka通信的具体参数。

=> CREATE NOTIFIER my_notifier ACTION 'kafka://127.0.0.1:9092' MAXMEMORYSIZE '10M' PARAMETERS 'queue.buffering.max.ms=1000';

Vertica NOTIFY功能允许您发布即席消息。 例如,在长时间运行的查询结束时,您可以将Vertica配置为在查询完成时发送消息。 在下一个示例语句中,将为您在创建my_notifier时指定的Kafka代理的主题LongQuery_topic发布消息“Long Query Done”。

=> SELECT NOTIFY('Long Query Done', 'my_notifier', 'LongQuery_topic');

Vertica还允许您通过为任何90+数据收集器组件设置通知策略来自动发布数据收集器信息。 为此,您可以将DC组件映射到Kafka主题和通知程序。

在以下示例中,查询使用dc_notify通知程序和dc_load_events_topic Kafka主题启用LoadEvents组件的通知策略。

=> SELECT SET_DATA_COLLECTOR_NOTIFY_POLICY('LoadEvents', 'dc_notify', 'dc_load_events_topic',1);

发布后,Kafka消息可以被任何监视或存储系统使用。 使用CatalogInfoByMinute DC组件中的Kafka消息,可以监视Vertica节点中目录对象的平均数。

这是从使用socket.io和Kafka-rest构建的简单node.js监视应用程序的可视化。 此图显示

  • 所有节点中目录对象的数量在相同的范围内。

  • 对于每个节点,目录对象的数量定期增长和收缩。

该图还表示任何异常行为。

相关推荐

软件测试|MySQL CROSS JOIN:交叉连接的详细解析

简介在MySQL数据库中,CROSSJOIN是一种用于生成两个或多个表的笛卡尔积的连接方法。CROSSJOIN不需要任何连接条件,它将左表的每一行与右表的每一行进行组合,从而生成一个包含所...

「MySQL笔记」left join-on-and 与 left join-on-where 的区别

1.摘要关于这两种写法的重要知识点摘要如下:left-join时,即使有相同的查询条件,二者的查询结果集也不同,原因是优先级导致的,on的优先级比where高on-and是进行韦恩运算连接...

MySQL中的JOIN——联合查询的基本语法

MySQL中的JOIN指令用来将两个或多个表中的数据进行联合查询,根据连接条件来匹配记录,从而得到需要的结果集。在MySQL中,常见的JOIN类型包括INNERJOIN、LEFTJOIN和RIGH...

MySQL 中的 CROSS JOIN:强大的连接工具

CROSSJOIN在MySQL里是一种挺特别的连接操作,它能弄出连接表的笛卡尔积。这就是说,要是表A有m行,表B有n行,那ACROSSJOINB的结果就会有m*n...

大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?

大厂必问:MySQL三表JOIN操作的解析与性能优化策略,效率又如何?点击关注,开启技术之旅!大家好,这里是互联网技术学堂,无论你是一名程序员、设计师、还是对技术充满好奇心的普通人,都欢迎你加入...

面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)

MySQL的JOIN查询优化是提升数据库性能的关键环节。以下是综合多个技术文档的核心优化策略,按优先级和实现难度分类:一、索引优化:性能提升的基础为连接字段建立索引确保参与JOIN的列(通常...

Flink中处理维表关联技术实现路径

在Flink中处理维表关联大体氛围TableSQLLookupJoin和DataStream算子函数,主要技术实现路径:I.FlinkSQL/TableAPI中的Lookup...

深入剖析Zookeeper原理(一)整体设计

1.ZK集群架构设计与特性1.ZK集群架构设计:ZK主要分为三种角色:Leader(领导者):一个Zookeeper集群同一时间只会有一个实际工作的Leader,它会发起并维护与各Follwer及...

多种负载均衡算法及其Java代码实现

首先给大家介绍下什么是负载均衡负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡,英...

一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?

1.概念ribbon是一款客户端负载均衡器,用于微服务之间的负载均衡。首先,什么是客户端负载均衡?如图,ribbon可以通过注册中心获取服务列表,然后自己执行自己的负载均衡策略来决定要访问哪个微服务,...

Step by Step之腾讯云短信-验证码实践

在商城小程序和前端上线用了一阵子之后,用户提出了体验提升的需求,如忘记密码、绑定用户、快捷注册等,作为业界最佳实践的短信验证码登录、重置密码和注册等功能开发也就提上日程了,本文就以重置密码为例,将验证...

10分钟入门响应式:Springboot整合kafka实现reactive

Springboot引入Reactor已经有一段时间了,笔者潜伏在各种技术群里暗中观察发现,好像scala圈子的同仁们,似乎对响应式更热衷一点。也许是因为他们对fp理解的更深吧,所以领悟起来障碍性更少...

使用java随机生成有个性的用户名,LOL地名+水浒传,合计2808个

*随机生成用户名*取水浒传108好汉名字*取LOL地名26个,组合而成*一共可以生成2808个不同特色的用户名如果你在上网的时候,用户名难取的话,这里有很多可选择的用户名,现提供100个...

深入理解Math.random()的概率分布特性

直接上源码/***Returnsa{@codedouble}valuewithapositivesign,*返回一个带符号的double类型的数字,说人话就是返回一个非负...

编程英文 - 创建/生成/构建 (create/generate/build)

在软件开发中,create、generate和build这三个词经常被用到,它们都与"创造"或"产生"某些东西有关,但在具体使用场景和含义上有所不同。基本含义creat...

取消回复欢迎 发表评论: