clickhouse从Kafka中导入数据

本文转载自查看原文 2021-05-27 14:07 1013 clickhouse

操作步骤

在ClickHouse集群中新建Kafka消费表。
```
CREATE TABLE default.kafka_src_table ON CLUSTER default ( //定义表结构的字段 id Int32, age Int32, msg String ) ENGINE = Kafka() SETTINGS kafka_broker_list = '*', kafka_topic_list = 'test', kafka_group_name = 'test', kafka_format = 'JSONEachRow';
```
参数说明
- kafka_broker_list：对应的Kafka集群地址
- kafka_topic_list：对应消费的topic。
- kafka_group_name：消费topic的group，需要先在Kafka中创建
- kafka_format：ClickHouse可以处理的数据类型。
  - JSONEachRow表示每行一条数据的json格式。一般如果是json格式的话，设置JSONEachRow即可。
  - 如果需要输入嵌套的json，请设置input_format_import_nested_json=1。
  关于ClickHouse支持的各种格式，可以参考官网：Formats for Input and Output Data。
更多属性设置，可以参考：ClickHouse集成kafka。

创建ClickHouse目的表。

创建本地表。

create table default.kafka_table_local ON CLUSTER default ( id Int32, age UInt32, msg String ) ENGINE = ReplicatedMergeTree( '/clickhouse/tables/kafka_sink_table/{shard}', '{replica}') ORDER BY (id);

创建分布式表。

CREATE TABLE kafka_table_distributed ON CLUSTER default AS default.kafka_table_local ENGINE = Distributed(default, default, kafka_table_local, id);

创建view把Kafka消费表消费到的数据导入ClickHouse目的表。
```
CREATE MATERIALIZED VIEW consumer TO kafka_table_distributed AS SELECT * FROM kafka_src_table;
```
说明 Kafka消费表不能直接作为结果表使用。Kafka消费表只是用来消费Kafka数据，没有真正的存储所有数据。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 篇五|ClickHouse数据导入(Flink、Spark、Kafka、MySQL、Hive) 使用物化视图将kafka数据导入到clickhouse Clickhouse 与 Kafka 的数据同步 clickhouse 导入mysql 的数据 Clickhouse Mysql数据导入 Elasticsearch --- 向es中导入数据在Toad中导入导出数据 clickhouse同步kafka数据方案 MySQL数据导入到ClickHouse clickhouse使用Spark导入数据