返回到文章

采纳

编辑于

kafka消费者僵死

kafka

今天在线上实际环境遇到了一个这样的问题,今天扩容了一台机器,这台机器没有过多的配置,监听及生产消费方都是走默认配置,既取hostname方式(这个算是故意而为之),因为新扩容上的机器,没有partition,认为不会影响到线上其它消费服务,但是问题这之后就发生了,我们线上很多消费者进程僵死,因为无法解析这个hostname,所以引起消费延迟,后来我们紧急下线问题节点,重启消费者之后恢复业务,针对这个问题我想请教老师是大概一个上面原因能引起这种情况呢?

因为我们认为我们上线节点只要不迁移分区就可以了,没想到引起了一系列的问题,所以还想深入请教下,避免后续事宜再次发生。

kafka版本是2.1.1