Kafka
未读
分区分配策略及再平衡
基本概念 1、一个consumer group中有多个consumer组成,一个topic有多个partition组成,现在的问题是,==到底由哪个consumer来消费哪个partition的数据==。 2、Kafka有四种主流的分区分配策略:==Range、RoundRobin、Sticky、C
Kafka
未读
Leader及Follower故障时的处理流程
基本概念 Log Start Offset:是起始位移,该副本中第一条消息的offset,如图所示,这里的起始位移是0,如果一个日志文件写满1G后(默认1G后会log rolling),这个起始位移就不是从0开始了。 log rolling:==是啥?== HW(high watermark):俗称
Kafka
未读
生产者如何提高吞吐量
可调参数 batch.size:批次大小,默认16k linger.ms:等待时间,修改为5~100ms compression.type:压缩类型,一般选择snappy RecordAccumulator:缓冲区大小,修改为64M 注意 这些参数的修改需要根据实际情况进行调整。
Kafka
未读
Zookeeper 中的 Kafka 信息
Kafka
未读
Kafka的副本基本信息
Kafka副本的作用:提高数据的可靠性; Kafka默认副本只有 1 个,生产环境一般配置为两个,保证数据的可靠性; 太多的副本会增加磁盘存储空间,增加网络上数据传输,降低效率; Kafka中副本分为:Leader和Follower。Kafka的生产者只会把数据发往Leader,然后Follower