1 簡介

表分區是解決一些因單表過大引用的性能問題的方式，比如某張表過大就會造成查詢變慢，可能分區是一種解決方案。一般建議當單表大小超過內存就可以考慮表分區了。PostgreSQL的表分區有三種方式：

Range：范圍分區；
List：列表分區；
Hash：哈希分區。

本文通過示例講解如何進行這三種方式的分區。

2 例講三種方式

為方便，我們通過Docker的方式啟動一個PostgreSQL，可參考：《Docker啟動PostgreSQL並推薦幾款連接工具》。我們要選擇較高的版本，否則不支持Hash分區，命令如下：

docker run -itd \
    --name pkslow-postgres \
    -e POSTGRES_DB=pkslow \
    -e POSTGRES_USER=pkslow \
    -e POSTGRES_PASSWORD=pkslow \
    -p 5432:5432 \
    postgres:13

2.1 Range范圍分區

先創建一張表帶有年齡，然后我們根據年齡分段來進行分區，創建表語句如下：

CREATE TABLE pkslow_person_r (
    age int not null,
    city varchar not null
) PARTITION BY RANGE (age);

這個語句已經指定了按age字段來分區了，接着創建分區表：

create table pkslow_person_r1 partition of pkslow_person_r for values from (MINVALUE) to (10);
create table pkslow_person_r2 partition of pkslow_person_r for values from (11) to (20);
create table pkslow_person_r3 partition of pkslow_person_r for values from (21) to (30);
create table pkslow_person_r4 partition of pkslow_person_r for values from (31) to (MAXVALUE);

這里創建了四張分區表，分別對應年齡是0到10歲、11到20歲、21到30歲、30歲以上。

接着我們插入一些數據：

insert into pkslow_person_r(age, city) VALUES (1, 'GZ');
insert into pkslow_person_r(age, city) VALUES (2, 'SZ');
insert into pkslow_person_r(age, city) VALUES (21, 'SZ');
insert into pkslow_person_r(age, city) VALUES (13, 'BJ');
insert into pkslow_person_r(age, city) VALUES (43, 'SH');
insert into pkslow_person_r(age, city) VALUES (28, 'HK');

可以看到這里的表名還是pkslow_person_r，而不是具體的分區表，說明對於客戶端是無感知的。

我們查詢也一樣的：

但實際上是有分區表存在的：

而且分區表與主表的字段是一致的。

查詢分區表，就只能查到那個特定分區的數據了：

2.2 List列表分區

類似的，列表分區是按特定的值來分區，比較某個城市的數據放在一個分區里。這里不再給出每一步的講解，代碼如下：

-- 創建主表
create table pkslow_person_l (
                          age int not null,
                          city varchar not null
) partition by list (city);

-- 創建分區表
CREATE TABLE pkslow_person_l1 PARTITION OF pkslow_person_l FOR VALUES IN ('GZ');
CREATE TABLE pkslow_person_l2 PARTITION OF pkslow_person_l FOR VALUES IN ('BJ');
CREATE TABLE pkslow_person_l3 PARTITION OF pkslow_person_l DEFAULT;

-- 插入測試數據
insert into pkslow_person_l(age, city) VALUES (1, 'GZ');
insert into pkslow_person_l(age, city) VALUES (2, 'SZ');
insert into pkslow_person_l(age, city) VALUES (21, 'SZ');
insert into pkslow_person_l(age, city) VALUES (13, 'BJ');
insert into pkslow_person_l(age, city) VALUES (43, 'SH');
insert into pkslow_person_l(age, city) VALUES (28, 'HK');
insert into pkslow_person_l(age, city) VALUES (28, 'GZ');

當我們查詢第一個分區的時候，只有廣州的數據：

2.3 Hash哈希分區

哈希分區是指按字段取哈希值后再分區。具體的語句如下：

-- 創建主表
create table pkslow_person_h (
                          age int not null,
                          city varchar not null
) partition by hash (city);

-- 創建分區表
create table pkslow_person_h1 partition of pkslow_person_h for values with (modulus 4, remainder 0);
create table pkslow_person_h2 partition of pkslow_person_h for values with (modulus 4, remainder 1);
create table pkslow_person_h3 partition of pkslow_person_h for values with (modulus 4, remainder 2);
create table pkslow_person_h4 partition of pkslow_person_h for values with (modulus 4, remainder 3);

-- 插入測試數據
insert into pkslow_person_h(age, city) VALUES (1, 'GZ');
insert into pkslow_person_h(age, city) VALUES (2, 'SZ');
insert into pkslow_person_h(age, city) VALUES (21, 'SZ');
insert into pkslow_person_h(age, city) VALUES (13, 'BJ');
insert into pkslow_person_h(age, city) VALUES (43, 'SH');
insert into pkslow_person_h(age, city) VALUES (28, 'HK');

可以看到創建分區表的時候，我們用了取模的方式，所以如果要創建N個分區表，就要取N取模。

隨便查詢一張分區表如下：

可以看到同是SZ的哈希值是一樣的，肯定會分在同一個分區，而BJ的哈希值取模后也屬於同一個分區。

3 總結

本文講解了PostgreSQL分區的三種方式。

代碼請查看：https://github.com/LarryDpk/pkslow-samples

歡迎關注微信公眾號<南瓜慢說>，將持續為你更新...

多讀書，多分享；多寫作，多整理。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 hive 分區表與數據產生關聯的三種方式 Postgresql的三種備份方式 PostgreSQL分區表創建、分區查詢等語法示例 postgresql 分區表 postgresql----表分區 PostgreSQL表分區 MySQL 刪除表的三種方式 css樣式表的三種方式 oracle三種表連接方式 FlinkSql的三種建表方式