知識點(OLAP特征):
OLAP場景的關鍵特征 : 絕大多數是讀請求 數據以相當大的批次(> 1000行)更新,而不是單行更新;或者根本沒有更新。 已添加到數據庫的數據不能修改。 對於讀取,從數據庫中提取相當多的行,但只提取列的一小部分。 寬表,即每個表包含着大量的列 查詢相對較少(通常每台服務器每秒查詢數百次或更少) 對於簡單查詢,允許延遲大約50毫秒 列中的數據相對較小:數字和短字符串(例如,每個URL 60個字節) 處理單個查詢時需要高吞吐量(每台服務器每秒可達數十億行) 事務不是必須的 對數據一致性要求低 每個查詢有一個大表。除了他以外,其他的都很小。 查詢結果明顯小於源數據。換句話說,數據經過過濾或聚合,因此結果適合於單個服務器的RAM中
官網安裝地址
https://clickhouse.tech/#quick-start #快速安裝地址
https://clickhouse.tech/docs/en/getting-started/install/ #文檔安裝說明
1、安裝curl工具
yum install -y curl
2、添加clickhouse的yum鏡像
curl -s https://packagecloud.io/install/repositories/altinity/clickhouse/script.rpm.sh | sudo bash
3、檢查鏡像情況
yum list | grep clickhouse
4、安裝clickhouse的服務端和客戶端
yum install -y clickhouse-server clickhouse-client
5、啟動服務
service clickhouse-server start
6、啟動交互式客戶端 -m表示sql允許換行執行
clickhouse-client -m
7、CK測試
1、求和 1.1建表 CREATE TABLE download ( when DateTime, userid UInt32, bytes Float32 ) ENGINE=MergeTree PARTITION BY toYYYYMM(when) ORDER BY (userid, when); 1.2 插入數據 INSERT INTO download SELECT now() + number * 60 as when, 25, rand() % 100000000 FROM system.numbers LIMIT 5000; 1.3計算:每個用戶每天下載的次數和流量 SELECT toStartOfDay(when) AS day, userid, count(userid) as downloads, sum(bytes) AS bytes FROM download GROUP BY userid, day ORDER BY userid, day
===============卸載clickhouse============
1、查看已安裝包
rpm -qa | grep clickhouse
2、卸載clickhouse相關軟件
rpm -e clickhouse-client-20.5.4.40-2.noarch --nodeps rpm -e clickhouse-server-20.5.4.40-2.noarch --nodeps rpm -e clickhouse-common-static-20.5.4.40-2.x86_64 --nodeps
3、刪除相關的目錄和數據
#數據目錄
rm -rf /var/lib/clickhouse
#刪除集群配置文件
rm -rf /etc/metrika.xml
#刪除配置文件
rm -rf /etc/clickhouse-*
#刪除日志文件
rm -rf /var/log/clickhouse-server
4、全局查找clickhouse文件和目錄,如果存在,則全部刪除
find / -name clickhouse
FQA:
1、fe重啟失敗
在fe.conf中加上一行metadata_failure_recovery=true,重啟。 正常啟動后把這行刪掉,重啟
2、Init script is already running
systemctl start clickhouse-server.service systemctl status clickhouse-server.service
參考博客:https://blog.csdn.net/weixin_39168541/article/details/118539387
