轉載:https://www.cnblogs.com/congcidaishangjiamianju/p/8045804.html
一 表空間及分區表的概念
是一個或多個數據文件的集合,所有的數據對象都存放在指定的表空間中,但主要存放的是表, 所以稱作表空間。
當表中的數據量不斷增大,查詢數據的速度就會變慢,應用程序的性能就會下降,這時就應該考慮對表進行分區。表進行分區后,邏輯上表仍然是一張完整的表,只是將表中的數據在物理上存放到多個表空間(物理文件上),這樣查詢數據時,不至於每次都掃描整張表。
二 表分區的具體作用
1、表的大小超過2GB。
三 表分區的優缺點
1、改善查詢性能:對分區對象的查詢可以僅搜索自己關心的分區,提高檢索速度。
分區表相關:已經存在的表沒有方法可以直接轉化為分區表。不過 Oracle 提供了在線重定義表的功能。
四 表分區的幾種類型及操作方法
4.1 范圍分區
范圍分區將數據基於范圍映射到每一個分區,這個范圍是你在創建分區時指定的分區鍵決定的。這種分區方式是最為常用的,並且分區鍵經常采用日期。舉個例子:你可能會將銷售數據按照月份進行分區。
(
CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
FIRST_NAME VARCHAR2(30) NOT NULL,
LAST_NAME VARCHAR2(30) NOT NULL,
PHONE VARCHAR2(15) NOT NULL,
EMAIL VARCHAR2(80),
STATUS CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
)
例二:按時間划分
(
ORDER_ID NUMBER(7) NOT NULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(7),
PAID CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
(
idd INT PRIMARY KEY ,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
);
4.2列表分區:
(
PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,
DESCRIPTION VARCHAR2(2000),
CUSTOMER_ID NUMBER(7) NOT NULL,
DATE_ENTERED DATE NOT NULL,
STATUS VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01,
PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES ('guangdong','beijing') TABLESPACE Part1_tb,
PARTITION part2 VALUES ('shanghai','nanjing') TABLESPACE Part2_tb
);
4.3 散列分區:
(
COL NUMBER(8),
INF VARCHAR2(100)
)
PARTITION BY HASH (COL)
(
PARTITION PART01 TABLESPACE HASH_TS01,
PARTITION PART02 TABLESPACE HASH_TS02,
PARTITION PART03 TABLESPACE HASH_TS03
)
(
empno NUMBER (4),
ename VARCHAR2 (30),
sal NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);
4.4 組合范圍散列分區
(
(
SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
),
PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
(
SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
)
)
4.5 復合范圍散列分區:
(
transaction_id number primary key,
item_id number(8) not null,
item_description varchar2(300),
transaction_date date
)
partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
(
partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)),
partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)),
partition part_03 values less than(maxvalue)
);
五 有關表分區的一些維護性操作:
5.1 添加分區
5.2 刪除分區
5.3 截斷分區
5.4 合並分區
5.5 拆分分區
5.6 接合分區(coalesca)
5.7 重命名表分區
5.8 相關查詢
六 、分區表的索引
對於分區表,可以建立不分區索引。也就是說表分區,但是索引不分區。以下着重介紹分區表的分區索引。
索引與表一樣,也可以分區。索引分為兩類:locally partition index(局部分區索引)、globally partition index(全局分區索引)。
6.1. 局部分區索引(locally partition index)
局部分區索引隨表對索引完成相應的分區,即索引會使用與表相同的機制進行分區,每個表分區都有一個索引分區,並且只索引該表分區。
6.1.1 局部索引分類
▶ 局部前綴索引(local prefixed index):以分區鍵作為索引定義的第一列
▶ 局部非前綴索引(local nonprefixed index):分區鍵沒有作為索引定義的第一列
注意:判斷局部索引是前綴還是非前綴的只需要看分區鍵是否作為索引定義的第一列
示例語句
--范圍分區
--創建表
create table student_range_part(
stu_id varchar2(4),
stu_name varchar2(100), --姓名
sex varchar2(1), --性別 1 男 2 女 0 未知
credit integer default 0
)
partition by range (credit)
(
partition student_part1 values less than (60) tablespace kdhist_data,
partition student_part2 values less than (70) tablespace kdhist_data,
partition student_part3 values less than (80) tablespace kdhist_data,
partition student_part4 values less than (maxvalue) tablespace kdhist_data
);
--創建局部前綴索引;分區鍵(credit)作為索引定義的第一列
create index local_prefixed_index on student_range_part (credit, stu_id) local;
--創建局部非前綴索引;分區鍵未作為索引定義的第一列
create index local_nonprefixed_index on student_range_part (stu_id, credit) local;
6.1.2 局部索引示例
--①
select * from student_range_part where credit = &credit and stu_id = &stu_id;
--②
select * from student_range_part where stu_id = &stu_id;
對於以上兩個查詢來說,如果查詢第一步是走索引的話,則:
局部前綴索引 local_prefixed_index 只對 ① 有用;
局部非前綴索引 local_nonprefixed_index 則對 ① 和 ② 均有用;
如果你有多個類似 ① 和 ② 的查詢的話,則可以考慮建立局部非前綴索引;如果平常多使用查詢 ① 的話,則可以考慮建立局部前綴索引;
小結:
分區表一般使用局部索引。重點在於如何選擇分區表和局部索引類型。
6.2. 全局分區索引(globally partition index)
索引按范圍(Range)或散列(Hash,Oracle 10g中引入)進行分區,一個分區索引(全局)可能指向任何(或全部的)表分區。
對於全局分區索引來說,索引的實際分區數可能不同於表的分區數量;
全局索引的分區機制有別於底層表,例如表可以按 credit 列划分為10個分區,表上的一個全局索引可以按stu_id 列划分為5個分區。
與局部索引不同,全局索引只有一類,即全局前綴索引(prefixed global index),索引分區鍵必須作為索引定義的第一列,否則執行會報錯。
--范圍分區
--創建表
create table student_range_part(
stu_id varchar2(4),
stu_name varchar2(100), --姓名
sex varchar2(1), --性別 1 男 2 女 0 未知
credit integer default 0
)
partition by range (credit)
(
partition student_part1 values less than (60) tablespace kdhist_data,
partition student_part2 values less than (70) tablespace kdhist_data,
partition student_part3 values less than (80) tablespace kdhist_data,
partition student_part4 values less than (maxvalue) tablespace kdhist_data
);
--創建按age進行范圍分區的全局分區索引
create index global_index on student_range_part(credit) global
partition by range (credit)
(
partition index_part1 values less than (60),
partition index_part2 values less than (80),
partition index_partmax values less than (maxvalue)
);
注意:
全局索引要求最高分區(即最后一個分區)必須有一個值為 maxvalue 的最大上限值,這樣可以確保底層表的所有行都能放在這個索引中;
一般情況下,大多數分區操作(如刪除一個舊分區)都會使全局索引無效,除非重建全局索引,否則無法使用
全局索引示例
全局索引一般用於數據倉庫,許多數據倉庫系統都存在大量的數據出入,如典型的數據“滑入滑出”(即刪除表中最舊的分區,並為新加載的數據增加一個新分區)。
① 去除老數據:最舊的分區要么被刪除,要么創建一個新表,將最舊的分區數據存入,從而對舊數據進行歸檔;
② 加載新數據並建立索引:將新數據加載到一個“工作”表中,建立索引並進行驗證;
③ 關聯新數據:一旦加載並處理了新數據,數據所在的表會與分區表中的一個空分區交換,將表中的這些新加載的數據變成分區表中的一個分區(分區表會變得更大)
對於全局索引來說,這樣增刪分區的過程,意味着該全局索引的失效,需重建全局索引;
在 Oracle 9i 之后,可以在分區操作期間使用 UPDATE GLOBAL INEXES 子句來維護全局索引,這意味着當在分區上執行刪除、分解或其他操作時,Oracle會對原先建立的全局索引執行必要的修改,以保證它是最新的。
--刪除student_range_part表中的index_part1分區,同時同步維護全局索引
alter table student_range_part drop partition index_part1 update global indexes;
使用 UPDATE GLOBAL INEXES子句后,在刪除一個分區時,必須刪除可能指向該分區的所有全局索引條目;
執行表與分區的交換時,必須刪除指向原數據的所有全局索引條目,再插入指向剛加載的數據的新條目;
如此一來 ALTER 命令執行的工作量會大幅增加;
小結:
分區操作執行完成后重建全局索引方式占用的數據庫資源更少,因此完成的相對“更快”,但是會帶來顯著的“停機時間”(重建索引時會有一個可觀的不可用窗口);
在分區操作執行的同時執行 UPDATE GLOBAL INDEXES 子句方式會占用更多的資源,且可能需要花費更長的時間才能完成操作,但好處是不會帶來任何的停機時間。
即使是數據倉庫,除非特殊需求,否則這個創建局部索引即可。