clickhouse?批量插入數(shù)據(jù)及ClickHouse常用命令詳解

更新時間：2022年03月02日 10:28:08 作者：孤雁長飛

這篇文章主要介紹了clickhouse?批量插入數(shù)據(jù)及ClickHouse常用命令,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下

Ⅰ).創(chuàng)建表
Ⅱ).創(chuàng)建物化視圖
Ⅲ).插入數(shù)據(jù)
Ⅳ).查詢數(shù)據(jù)
Ⅴ).創(chuàng)建NESTED表
Ⅵ).NESTED表數(shù)據(jù)查詢
Ⅶ).配置字典項
Ⅷ).字典查詢
Ⅸ).導入數(shù)據(jù)
Ⅹ).導出數(shù)據(jù)
Ⅺ).查看partition狀態(tài)
Ⅻ).清理partition
XIII).查看列的壓縮率
XIV).查看物化視圖的磁盤占用

一.安裝使用

ClickHouse是Yandex提供的一個開源的列式存儲數(shù)據(jù)庫管理系統(tǒng)，多用于聯(lián)機分析（OLAP）場景，可提供海量數(shù)據(jù)的存儲和分析，同時利用其數(shù)據(jù)壓縮和向量化引擎的特性，能提供快速的數(shù)據(jù)搜索。

Ⅰ).安裝

sudo yum install yum-utils
sudo rpm --import https://repo.yandex.ru/clickhouse/CLICKHOUSE-KEY.GPG
sudo yum-config-manager --add-repo https://repo.yandex.ru/clickhouse/rpm/stable/x86_64
sudo yum install clickhouse-server clickhouse-client
sudo /etc/init.d/clickhouse-server start
clickhouse-client

Ⅱ).配置

a).clickhouse-server

CLICKHOUSE_USER=username
 
CLICKHOUSE_LOGDIR=${CLICKHOUSE_HOME}/log/clickhoue-server
CLICKHOUSE_LOGDIR_USER=username
CLICKHOUSE_DATADIR_OLD=${CLICKHOUSE_HOME}/data/old
CLICKHOUSE_DATADIR=${CLICKHOUSE_HOME}/data

b).config.xml

... ...
  <!-- 配置日志參數(shù) -->
  <logger>
    <level>info</level>
    <log>${CLICKHOUSE_HOME}/log/clickhoue-server/clickhoue-server.log</log>
    <errorlog>${CLICKHOUSE_HOME}/log/clickhoue-server/clickhoue-server-error.log</errorlog>
    <size>100M</size>
    <count>5</count>
  </logger>
 
  <!-- 配置數(shù)據(jù)保存路徑 -->
  <path>${CLICKHOUSE_HOME}</>
  <tmp_path>${CLICKHOUSE_HOME}/tmp</>
  <user_files_path>${CLICKHOUSE_HOME}/user_files</>
 
  <!-- 配置監(jiān)聽 -->
  <listen_host>::</listen_host>
 
  <!-- 配置時區(qū) -->
  <timezone>Asiz/Shanghai</timezone>
... ...

Ⅲ).啟停服務

#### a).啟動服務
sudo service clickhouse-server start
#### b).停止服務
sudo service clickhouse-server stop

Ⅳ).客戶端訪問

clickhouse-client

二.常用命令

Ⅰ).創(chuàng)建表

CREATE TABLE IF NOT EXISTS database.table_name ON cluster cluster_shardNum_replicasNum(
    'id' UInt64,
    'name' String,
    'time' UInt64,
    'age' UInt8,
    'flag' UInt8
)
ENGINE = MergeTree
PARTITION BY toDate(time/1000)
ORDER BY (id,name)
SETTINGS index_granularity = 8192

Ⅱ).創(chuàng)建物化視圖

CREATE MATERIALIZED VIEW database.view_name ON cluster cluster_shardNum_replicasNum
ENGINE = AggregatingMergeTree
PARTITION BY toYYYYMMDD(time)
ORDER BY (id,name)
AS SELECT 
    toStartOfHour(toDateTime(time/1000)) as time,
    id,
    name,
    sumState( if (flag = 1, 1, 0)) AS successCount,
    sumState( if (flag = 0, 1, 0)) AS faildCount,
    sumState( if ((age < 10), 1, 0)) AS rang1Age,
    sumState( if ((age > 10) AND (age < 20), 2, 0)) AS rang2Age,
    sumState( if ((age > 20), 3, 0)) AS rang3Age,
    maxState(age) AS maxAge,
    minState(age) AS minAge
FROM datasource.table_name
GROUP BY time,id,name

Ⅲ).插入數(shù)據(jù)

a).普通數(shù)據(jù)插入

INSERT INTO database.table_name(id, name, age, flag) VALUES(1, 'test', 15, 0)

b).Json數(shù)據(jù)插入

INSERT INTO database.table_name FORMAT JSONEachRow{"id":"1", "name":"test", "age":"11", "flag":"1"}

Ⅳ).查詢數(shù)據(jù)

a).表數(shù)據(jù)查詢

SELECT * FROM database.table_name WHERE id=1

b).物化視圖查詢

SELECT id, name, sumMerge(successCount), sumMerge(faildCount), sumMerge(rang1Age), sumMerge(rang2Age), maxMerge(maxAge), minMerge(minAge) 
FROM database.view_name 
WHERE id=1
GROUP BY id, name

Ⅴ).創(chuàng)建NESTED表

CREATE TABLE IF NOT EXISTS database.table_name(
  'id' UInt64,
  'name' String,
  'time' UInt64,
  'age' UInt8,
  'flag' UInt8
nested_table_name Nested (
  sequence UInt32,
  id UInt64,
  name String,
  time UInt64,
  age UInt8,
  flag UInt8
  socketAddr String,
  socketRemotePort UInt32,
  socketLocalPort UInt32,
  eventTime UInt64,
  exceptionClassName String,
  hashCode Int32,
  nextSpanId UInt64
))
ENGINE = MergeTree
PARTITION BY toDate (time / 1000)
ORDER BY (id, name, time)
SETTINGS index_granularity = 8192

Ⅵ).NESTED表數(shù)據(jù)查詢

SELECT table1.*,table1.id FROM nest.table_name AS table1 array JOIN nested_table_name AS table2

Ⅶ).配置字典項

<dictionaries>
  <dictionary>
    <name>url</name>  
    <source>
      <clickhouse>
        <host>hostname</host>  
        <port>9000</port>  
        <user>default</user>  
        <password/>  
        <db>dict</db>  
        <table>url_dict</table>
      </clickhouse>
    </source>  
    <lifetime>
      <min>30</min>  
      <max>36</max>
    </lifetime>  
    <layout>
      <hashed/>
    </layout>  
    <structure>
      <id>
        <name>id</name>
      </id>  
      <attribute>
        <name>hash_code</name>  
        <type>String</type>  
        <null_value/>
      </attribute>  
      <attribute>
        <name>url</name>  
        <type>String</type>  
        <null_value/>
      </attribute>
    </structure>
  </dictionary>  
  <dictionary>
    <name>url_hash</name>  
    <source>
      <clickhouse>
        <host>hostname</host>  
        <port>9000</port>  
        <user>default</user>  
        <password/>  
        <db>dict</db>  
        <table>url_hash</table>
      </clickhouse>
    </source>  
    <lifetime>
      <min>30</min>  
      <max>36</max>
    </lifetime>  
    <layout>
      <complex_key_hashed/>
    </layout>  
    <structure>
      <key>
        <attribute>
          <name>hash_code</name>  
          <type>String</type>
        </attribute>
      </key>  
      <attribute>
        <name>url</name>  
        <type>String</type>  
        <null_value/>
      </attribute>
    </structure>
  </dictionary>
</dictionaries>

Ⅷ).字典查詢

SELECT
    id,
    dictGet('name', 'name', toUInt64(name)) AS name,
    dictGetString('url', 'url', tuple(url)) AS url
FROM table_name

Ⅸ).導入數(shù)據(jù)

clickhouse-client --query="INSERT INTO database.table_name FORMAT CSVWithNames" < /path/import_filename.csv

Ⅹ).導出數(shù)據(jù)

clickhouse-client --query="SELECT * FROM database.table_name FORMAT CSV" sed 's/"http://g' > /path/export_filename.csv

Ⅺ).查看partition狀態(tài)

SELECT table, name, partition，active FROM system.parts WHERE database='database_name'

Ⅻ).清理partition

ALTER TABLE database.table_name ON cluster cluster_shardNum_replicasNum detach partition 'partition_id'

XIII).查看列的壓縮率

SELECT
    database,
    table,
    name,
    formatReadableSize(sum(data_compressed_bytes) AS c) AS comp,
    formatReadableSize(sum(data_uncompressed_bytes) AS r) AS raw,
    c/r AS comp_ratio
FROM system.columns
WHERE database='database_name'
    AND table='table_name'
GROUP BY name

XIV).查看物化視圖的磁盤占用

clickhouse-client --query="SELECT partition,count(*) AS partition_num, formatReadableSize(sum(bytes)) AS disk_size FROM system.columns WHERE database='database_name' " --external --?le=***.sql --name=parts --structure='table String, name String, partition UInt64, engine String' -h hostname

到此這篇關于clickhouse 批量插入數(shù)據(jù)及ClickHouse常用命令的文章就介紹到這了,更多相關clickhouse 批量插入內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

解決springboot3.2集成mybatis-plus3.5.4.1報錯的問題
這篇文章給大家介紹了如何解決springboot3.2集成mybatis-plus3.5.4.1報錯的問題,文中通過圖文介紹的非常詳細,具有一定的參考價值,需要的朋友可以參考下
2023-12-12
java中DecimalFormat四舍五入用法詳解
這篇文章主要為大家詳細介紹了java中DecimalFormat四舍五入的用法，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-03-03
SpringBoot Admin用法實例講解
在本篇文章里小編給大家整理的是一篇關于SpringBoot Admin用法實例內(nèi)容，有需要的朋友們可以參考學習下。
2019-10-10
如何使用Java?8中DateTimeFormatter類型轉(zhuǎn)換日期格式詳解
這篇文章主要介紹了如何使用Java?8中DateTimeFormatter類型轉(zhuǎn)換日期格式詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-07-07
Java編程子類能否重寫父類的靜態(tài)方法探索
關于子類能否重寫父類的靜態(tài)方法，對像我這種初級的編程愛好者來說仍是值得討論的一件事，下面我們通過具體實例，對此問題進行簡單的探索。
2017-10-10
SpringBoot普通類獲取spring容器中bean的操作
這篇文章主要介紹了SpringBoot普通類獲取spring容器中bean的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-09-09
Spring JDBC的使用方法詳解
這篇文章主要介紹了Spring JDBC的使用方法詳解,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2019-09-09
詳解Spring整合Ehcache管理緩存
本文先通過Ehcache獨立應用的范例來介紹它的基本使用方法，然后再介紹與Spring整合的方法。
2017-03-03
spring?aop?pointcut?添加多個execution方式
這篇文章主要介紹了spring?aop?pointcut?添加多個execution方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-11-11
圖解Java經(jīng)典算法冒泡選擇插入希爾排序的原理與實現(xiàn)
冒泡排序是一種簡單的排序算法，它也是一種穩(wěn)定排序算法。其實現(xiàn)原理是重復掃描待排序序列，并比較每一對相鄰的元素，當該對元素順序不正確時進行交換。一直重復這個過程，直到?jīng)]有任何兩個相鄰元素可以交換，就表明完成了排序
2022-09-09