作为一个分布式的消息发布-订阅系统,Apache Kafka在 Yahoo内部已经被很多团队所使用,例如媒体分析团队就将其应用到了实时分析流水线中,同时,Yahoo整个Kafka集群处理的峰值带宽超过了 20Gbps(压缩数据)。为了让开发者和服务工程师能够更加简单地维护Kafka集群,Yahoo构建了一个基于Web的管理工具,称为Kafka Manager,日前该项目已经在GitHub上开源。
通过Kafka Manager用户能够更容易地发现集群中哪些主题或者分区分布不均匀,同时能够管理多个集群,能够更容易地检查集群的状态,能够创建主题,执行首选的副 本选择,能够基于集群当前的状态生成分区分配,并基于生成的分配执行分区的重分配,此外,Kafka Manager还是一个非常好的可以快速查看集群状态的工具。
Kafka Manager使用Scala语言编写,其Web控制台基于Play Framework实现,除此之外,Yahoo还迁移了一些Apache Kafka的帮助程序以便能够与Apache Curator框架一起工作。
Kafka在雅虎内部被很多团队使用,媒体团队用它做实时分析流水线,可以处理高达20Gbps(压缩数据)的峰值带宽。
为了简化开发者和服务工程师维护Kafka集群的工作,构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager。这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀,或者是分区在整个集群分布不均匀的的情况。它支持管理多个集群、选择副本、副本重新分配以及创建Topic。同时,这个管理工具也是一个非常好的可以快速浏览这个集群的工具。
该软件是用Scala语言编写的。目前(2015年02月03日)雅虎已经开源了Kafka Manager工具。这款Kafka集群管理工具主要支持以下几个功能:
以下是该集群管理工具的截图:
系统至少需要配置zookeeper集群的地址,可以在kafka-manager安装包的conf目录下面的application.conf文件中进行配置。例如:
kafka-manager.zkhosts="my.zookeeper.host.com:2181"
你可以指定多个zookeeper地址,用逗号分隔:
kafka-manager.zkhosts="my.zookeeper.host.com:2181,other.zookeeper.host.com:2181"
另外, 如果你不想硬编码,可以使用环境变量ZK_HOSTS。
ZK_HOSTS="my.zookeeper.host.com:2181"
你可以启用/禁止以下的功能,通过修改application.config:
application.features=["KMClusterManagerFeature","KMTopicManagerFeature","KMPreferredReplicaElectionFeature","KMReassignPartitionsFeature"]
考虑为启用了jmx的大群集设置这些参数:
下面是一个包含10个broker,100个topic的kafka集群示例,每个topic有10个分区,相当于1000个总分区,并启用JMX:
控制消费者偏offset缓存的线程池和队列:
您应该在启用了消费者轮询的情况下为大量#消费者增加以上内容。虽然它主要影响基于ZK的消费者轮询。
Kafka管理的消费者offset现在由“__consumer_offsets”topic中的KafkaManagedOffsetCache消费。请注意,这尚未经过跟踪大量offset的测试。每个集群都有一个单独的线程消费这个topic,所以它可能无法跟上被推送到topic的大量offset。
下面的命令创建一个可部署应用的zip文件。
sbt clean dist
如果你不想拉源码,在编译,我已经编译好,放在百度云盘上了。
https://pan.baidu.com/s/1geEB1rt
解压刚刚的zip文件,然后启动它:
$ bin/kafka-manager
默认情况下,端口为9000。可覆盖,例如:
$ bin/kafka-manager -Dconfig.file=/path/to/application.conf -Dhttp.port=8080
再如果java不在你的路径中,或你需要针对不同的版本,增加-java-home
选项:
$ bin/kafka-manager -java-home /usr/local/oracle-java-8
为SASL添加JAAS配置,添加配置文件位置:
$ bin/kafka-manager -Djava.security.auth.login.config=/path/to/my-jaas.conf
注意:确保运行kafka manager的用户有读取jaas配置文件的权限。
如果你想创建一个Debian或者RPM包,你可以使用下面命令打包:
sbt debian:packageBin
sbt rpm:packageBin