快捷導(dǎo)航

基于PostgreSQL的時(shí)序數(shù)據(jù)庫(kù)TimescaleDB的基本用法和概念

更新時(shí)間：2023年06月30日 08:26:46 作者：Cosolar

時(shí)序數(shù)據(jù)是指按照時(shí)間順序存儲(chǔ)的數(shù)據(jù),TimescaleDB是一個(gè)開(kāi)源的、擴(kuò)展了PostgreSQL的時(shí)序數(shù)據(jù)庫(kù)擴(kuò)展,本文就給大家詳細(xì)的介紹一下基于PostgreSQL的時(shí)序數(shù)據(jù)庫(kù)TimescaleDB的基本用法和概念,需要的朋友可以參考下

時(shí)序數(shù)據(jù)是指按照時(shí)間順序存儲(chǔ)的數(shù)據(jù)。它在很多領(lǐng)域得到廣泛應(yīng)用，例如物聯(lián)網(wǎng)、日志分析、金融交易等。為了高效處理時(shí)序數(shù)據(jù)，TimescaleDB應(yīng)運(yùn)而生。TimescaleDB是一個(gè)開(kāi)源的、擴(kuò)展了PostgreSQL的時(shí)序數(shù)據(jù)庫(kù)擴(kuò)展，它結(jié)合了關(guān)系型數(shù)據(jù)庫(kù)和時(shí)序數(shù)據(jù)庫(kù)的優(yōu)勢(shì)，提供了更好的時(shí)序數(shù)據(jù)管理和分析能力。

時(shí)間序列數(shù)據(jù)的挑戰(zhàn)： 時(shí)間序列數(shù)據(jù)是指按時(shí)間順序收集和記錄的數(shù)據(jù)，如傳感器、日志、金融數(shù)據(jù)等。這類數(shù)據(jù)在現(xiàn)實(shí)生活中廣泛存在，但對(duì)于傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)來(lái)說(shuō)，處理大規(guī)模和高性能的時(shí)間序列數(shù)據(jù)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。

TimescaleDB的出現(xiàn)： TimescaleDB是一個(gè)構(gòu)建在PostgreSQL之上的開(kāi)源時(shí)間序列數(shù)據(jù)庫(kù)，它采用了一種創(chuàng)新的方法來(lái)解決傳統(tǒng)數(shù)據(jù)庫(kù)在處理時(shí)間序列數(shù)據(jù)方面的限制。TimescaleDB利用了PostgreSQL的強(qiáng)大功能，并通過(guò)擴(kuò)展超級(jí)表的方式提供了更好的性能和可擴(kuò)展性。

一、TimescaleDB概述

TimescaleDB是一個(gè)在PostgreSQL之上構(gòu)建的時(shí)序數(shù)據(jù)庫(kù)，它利用了關(guān)系型數(shù)據(jù)庫(kù)的成熟性和靈活性，并針對(duì)時(shí)序數(shù)據(jù)進(jìn)行了優(yōu)化。TimescaleDB通過(guò)使用分區(qū)表（hypertable）和連續(xù)聚集表（continuous aggregate）來(lái)處理時(shí)序數(shù)據(jù)，使得數(shù)據(jù)的存儲(chǔ)和查詢更加高效。

二、安裝和配置

1. 安裝TimescaleDB插件

安裝TimescaleDB可以通過(guò)在PostgreSQL上加載TimescaleDB插件來(lái)完成。首先，確保已經(jīng)安裝了PostgreSQL數(shù)據(jù)庫(kù)，并且具有管理員權(quán)限。然后，在命令行中執(zhí)行以下步驟：

# 添加TimescaleDB的APT源
curl https://packagecloud.io/timescale/timescaledb/gpgkey | sudo apt-key add -
echo "deb https://packagecloud.io/timescale/timescaledb/ubuntu/ focal main" | sudo tee /etc/apt/sources.list.d/timescale_timescaledb.list
# 更新軟件源
sudo apt-get update
# 安裝TimescaleDB插件
sudo apt-get install timescaledb-postgresql-13

2. 創(chuàng)建TimescaleDB數(shù)據(jù)庫(kù)

TimescaleDB的工作方式與傳統(tǒng)的PostgreSQL數(shù)據(jù)庫(kù)相似。我們可以使用createdb命令創(chuàng)建一個(gè)新的數(shù)據(jù)庫(kù)，并在該數(shù)據(jù)庫(kù)上加載TimescaleDB擴(kuò)展：

# 創(chuàng)建一個(gè)新的數(shù)據(jù)庫(kù)
createdb mydatabase
# 連接到該數(shù)據(jù)庫(kù)
psql mydatabase
# 在數(shù)據(jù)庫(kù)中加載TimescaleDB擴(kuò)展
CREATE EXTENSION IF NOT EXISTS timescaledb CASCADE;

3. 擴(kuò)展超級(jí)表功能

TimescaleDB中的基本數(shù)據(jù)管理單元稱為超級(jí)表。超級(jí)表是基于普通表的一種特殊類型，它將時(shí)間序列數(shù)據(jù)根據(jù)時(shí)間進(jìn)行分區(qū)和組織，從而實(shí)現(xiàn)更高效的查詢性能。以下示例演示了如何創(chuàng)建一個(gè)超級(jí)表：

-- 創(chuàng)建超級(jí)表
CREATE TABLE conditions (
    time        TIMESTAMPTZ       NOT NULL,
    location    TEXT              NOT NULL,
    temperature DOUBLE PRECISION  NULL,
    humidity    DOUBLE PRECISION  NULL
);
-- 對(duì)超級(jí)表進(jìn)行分區(qū)
SELECT create_hypertable('table_name', 'time_column');

創(chuàng)建Hypertable：TimescaleDB中的核心概念是Hypertable，它是一個(gè)邏輯表，負(fù)責(zé)將普通表劃分成不同的時(shí)間段。其中，'table_name'是原始表的名稱，'time_column'是存儲(chǔ)時(shí)間信息的列。

三、數(shù)據(jù)寫(xiě)入和查詢

1. 創(chuàng)建超級(jí)表

超級(jí)表的創(chuàng)建與普通表類似，但需要指定時(shí)間列。以下示例創(chuàng)建了一個(gè)包含時(shí)間列的超級(jí)表：

CREATE TABLE conditions (
   time        TIMESTAMPTZ       NOT NULL,
   location    TEXT              NOT NULL,
   temperature DOUBLE PRECISION  NULL,
   humidity    DOUBLE PRECISION  NULL
);

2. 超級(jí)表的分區(qū)

超級(jí)表的分區(qū)是TimescaleDB的一個(gè)重要特性，它可以根據(jù)時(shí)間將數(shù)據(jù)分散到不同的物理表中。通過(guò)分區(qū)，查詢操作僅需要在相關(guān)的物理表上執(zhí)行，從而提高查詢性能。以下示例演示了如何為超級(jí)表添加分區(qū)：

-- 對(duì)超級(jí)表conditions按月份進(jìn)行分區(qū)
SELECT create_hypertable('conditions', 'time', chunk_time_interval => INTERVAL '1 month');

3. 超級(jí)表的復(fù)制和副本

TimescaleDB支持復(fù)制和副本功能，可以在多個(gè)節(jié)點(diǎn)上創(chuàng)建超級(jí)表的副本，實(shí)現(xiàn)數(shù)據(jù)冗余和高可用性。以下示例展示了如何創(chuàng)建一個(gè)超級(jí)表的副本：

-- 在節(jié)點(diǎn)2上創(chuàng)建conditions超級(jí)表的副本
SELECT add_data_node('conditions', '2');

4. 插入數(shù)據(jù)

向超級(jí)表中插入數(shù)據(jù)與向普通表中插入數(shù)據(jù)類似。以下示例向超級(jí)表conditions插入一行數(shù)據(jù)：

INSERT INTO conditions (time, location, temperature, humidity)
VALUES ('2023-06-29 06:00:00', 'New York', 25.4, 60.2);

5. 更新和刪除數(shù)據(jù)

在超級(jí)表中更新和刪除數(shù)據(jù)與普通表相同。以下示例演示了如何更新和刪除符合特定條件的數(shù)據(jù)：

-- 更新溫度大于30的記錄
UPDATE conditions SET temperature = 30.0 WHERE temperature > 30.0;
-- 刪除濕度小于50的記錄
DELETE FROM conditions WHERE humidity < 50.0;

6. 時(shí)間序列聚合函數(shù)

TimescaleDB提供了一系列內(nèi)置的時(shí)間序列聚合函數(shù)，用于計(jì)算給定時(shí)間范圍內(nèi)的統(tǒng)計(jì)信息，如平均值、最大值、最小值等。以下示例展示了如何使用時(shí)間序列聚合函數(shù)：

-- 計(jì)算最近一小時(shí)的平均溫度
SELECT time_bucket('1 hour', time) AS hour,
      AVG(temperature) AS average_temperature
FROM conditions
WHERE time > NOW() - INTERVAL '1 hour'
GROUP BY hour;

7. 查詢和過(guò)濾數(shù)據(jù)

查詢和過(guò)濾數(shù)據(jù)時(shí)，可以使用常規(guī)的SQL查詢語(yǔ)句。以下示例展示了如何查詢超級(jí)表中的數(shù)據(jù)：

-- 查詢所有溫度大于25的記錄
SELECT *
FROM conditions
WHERE temperature > 25.0;

8. 其他數(shù)據(jù)查詢

TimescaleDB提供了許多用于查詢時(shí)序數(shù)據(jù)的功能，例如：

查詢最近一小時(shí)的數(shù)據(jù)：

SELECT * FROM table_name WHERE time_column > NOW() - INTERVAL '1 hour';

聚合查詢：

SELECT time_bucket('5 minutes', time_column) AS bucket, AVG(value_column) AS avg_value
FROM table_name GROUP BY bucket ORDER BY bucket;

以上查詢將結(jié)果按5分鐘為一個(gè)時(shí)間段進(jìn)行聚合，并計(jì)算每個(gè)時(shí)間段內(nèi)的平均值。

四、連續(xù)聚集表

連續(xù)聚集表是TimescaleDB的一個(gè)重要特性，它可以在后臺(tái)自動(dòng)維護(hù)預(yù)定義的聚合數(shù)據(jù)。通過(guò)使用連續(xù)聚集表，可以極大地提高大規(guī)模時(shí)序數(shù)據(jù)的查詢性能。以下是創(chuàng)建和使用連續(xù)聚集表的示例：

1. 創(chuàng)建連續(xù)聚集表：

SELECT create_continuous_aggregate('ca_table', 'SELECT time_bucket('5 minutes', time_column) AS bucket, AVG(value_column) AS avg_value FROM table_name GROUP BY bucket');

2. 查詢連續(xù)聚集表：

SELECT * FROM ca_table;

五、分區(qū)管理

TimescaleDB使用分區(qū)（partitioning）來(lái)管理大規(guī)模的時(shí)序數(shù)據(jù)。它可以將表按照時(shí)間范圍進(jìn)行自動(dòng)劃分，提高查詢性能和數(shù)據(jù)的可維護(hù)性。以下是創(chuàng)建和管理分區(qū)的示例：

1. 創(chuàng)建分區(qū)：

SELECT add_hypertable_partition('table_name', TIMESTAMP '2023-06-01', TIMESTAMP '2023-07-01');

2. 管理分區(qū)：

查詢所有分區(qū)：

SELECT show_partitions('table_name');

刪除分區(qū)：

SELECT drop_partition('table_name', TIMESTAMP '2023-06-01');

3. 數(shù)據(jù)連續(xù)性和存儲(chǔ)優(yōu)化

TimescaleDB通過(guò)數(shù)據(jù)連續(xù)性來(lái)優(yōu)化存儲(chǔ)空間和查詢性能。數(shù)據(jù)連續(xù)性指的是調(diào)整超級(jí)表的分區(qū)和存儲(chǔ)策略，以確保相鄰時(shí)間段的數(shù)據(jù)存儲(chǔ)在一起，從而提高查詢性能。

4. 數(shù)據(jù)保留策略

TimescaleDB允許定義數(shù)據(jù)的保留策略，以自動(dòng)刪除過(guò)時(shí)的數(shù)據(jù)。通過(guò)設(shè)置保留策略，可以控制超級(jí)表中數(shù)據(jù)的保存時(shí)長(zhǎng)，以及是否自動(dòng)刪除過(guò)期數(shù)據(jù)。

六. 綜合使用示例

1. 創(chuàng)建超級(jí)表并插入數(shù)據(jù)

假設(shè)我們有一個(gè)名為conditions的超級(jí)表，包含時(shí)間、地點(diǎn)、溫度和濕度字段。以下示例演示了如何創(chuàng)建該超級(jí)表，并向其中插入一些數(shù)據(jù)：

CREATE TABLE conditions (
   time        TIMESTAMPTZ       NOT NULL,
   location    TEXT              NOT NULL,
   temperature DOUBLE PRECISION  NULL,
   humidity    DOUBLE PRECISION  NULL
);
SELECT create_hypertable('conditions', 'time');
INSERT INTO conditions (time, location, temperature, humidity)
VALUES
   ('2023-06-29 06:00:00', 'New York', 25.4, 60.2),
   ('2023-06-29 07:00:00', 'New York', 26.8, 58.9),
   ('2023-06-29 08:00:00', 'New York', 28.3, 57.1);

2. 查詢最新的N條數(shù)據(jù)

假設(shè)我們想要查詢最新的3條溫度數(shù)據(jù)。以下示例演示了如何使用LIMIT子句和ORDER BY子句進(jìn)行查詢：

SELECT *
FROM conditions
ORDER BY time DESC
LIMIT 3;

3. 執(zhí)行時(shí)間范圍內(nèi)的聚合查詢

假設(shè)我們想要計(jì)算過(guò)去一小時(shí)內(nèi)每分鐘的平均溫度。以下示例展示了如何使用時(shí)間序列聚合函數(shù)和時(shí)間戳桶函數(shù)進(jìn)行查詢：

SELECT time_bucket('1 minute', time) AS minute,
      AVG(temperature) AS average_temperature
FROM conditions
WHERE time > NOW() - INTERVAL '1 hour'
GROUP BY minute;

七、小結(jié)一下

通過(guò)使用TimescaleDB，我們可以高效地存儲(chǔ)和查詢時(shí)序數(shù)據(jù)，并利用連續(xù)聚集表和分區(qū)管理功能進(jìn)一步提高性能和可維護(hù)性。 Timescale DB跟同類的其他數(shù)據(jù)庫(kù)相比具有一些令人興奮的功能：

它建立在PostgreSQL之上(目前最好的開(kāi)源關(guān)系數(shù)據(jù)庫(kù))。如果您的項(xiàng)目已經(jīng)在運(yùn)行PostgreSQL，Timescale可以重點(diǎn)考慮。
通過(guò)熟悉的SQL語(yǔ)法進(jìn)行查詢，從而減少了學(xué)習(xí)難度。
極快的寫(xiě)入速度-每秒數(shù)百萬(wàn)次的插入。
數(shù)十億行或PB的數(shù)據(jù)，對(duì)于Timescale來(lái)說(shuō)沒(méi)什么大不了的。
模式具有真正的靈活性-可以根據(jù)需要選擇關(guān)系模式或無(wú)模式。

以上就是基于PostgreSQL的時(shí)序數(shù)據(jù)庫(kù)TimescaleDB的基本用法和概念的詳細(xì)內(nèi)容，更多關(guān)于PostgreSQL TimescaleDB的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: