Kafka的核心实践是什么-创新互联

这篇文章将为大家详细讲解有关Kafka的核心实践是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

创新互联公司主要企业基础官网建设,电商平台建设,移动手机平台,小程序开发等一系列专为中小企业按需网站设计产品体系;应对中小企业在互联网运营的各种问题,为中小企业在互联网的运营中保驾护航。

Kafka的核心实践

1.版本升级

之前大数据平台一直使用的是0.8.3这一Kafka早期版本,而截止到当前,Kafka官方新的Release版本已经到了2.3,于是长期使用0.8版本过程中渐渐遇到的很多瓶颈和问题,我们是能够通过版本升级来解决的。

举例来说,以下是一些之前使用旧版时常见的问题:

缺少对Security的支持:存在数据安全性问题及无法通过认证授权对资源使用细粒度管理

brokerunderreplicated:发现broker处于underreplicated状态,但不确定问题的产生原因,难以解决。

新的feature无法使用:如事务消息、幂等消息、消息时间戳、消息查询等。

客户端的对offset的管理依赖zookeeper,对zookeeper的使用过重,增加运维的复杂度

监控指标不完善:如topic、partition、broker的数据size指标,同时kafkamanager等监控工具对低版本kafka支持不好

同时对一些目标版本的特性进行了选型调研,如:

0.9版本,增加了配额和安全性,其中安全认证和授权是我们最关注的功能

0.10版本,更细粒度的时间戳.可以基于偏移量进行快速的数据查找,找到所要的时间戳。这在实时数据处理中基于Kafka数据源的数据重播是极其重要的

0.11版本,幂等性和Transactions的支持及副本数据丢失/数据不一致的解决。

1.1版本,运维性的提升。比如当ControllerShutDown,想要关闭一个Broker的时候,之前需要一个很长很复杂的过程在1.0版本得到很大的改善。

最终选择1.1版本,则是因为出于Camus与Kafka版本的兼容性及1.1版本已经满足了使用场景中重要新特性的支持的综合考量。这里再简单说一下Camus组件,同样是由Linkedin开源,在我们的大数据平台中主要作为Kafka数据Dump到HDFS的重要方式。

关于Kafka的核心实践是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。


当前名称:Kafka的核心实践是什么-创新互联
网站地址:http://hbruida.cn/article/ehdpj.html