PLSQL_數據泵導入導出數據Impdp/ Expdp(概念)


2014-08-31 Created By BaoXinjian

一、摘要


在平常備庫和數據庫遷移的時候,當遇到大的數據庫的時候在用exp的時候往往是需要好幾個小時,耗費大量時間。oracle10g以后可以用expdp來導出數據庫花費的時間要遠小於exp花費的時間,而且文件也要小很多。

 

二、exp/imp與expdp/impdp區別


(1) 把用戶usera的對象導到用戶userb,用法區別在於fromuser=usera touser=userb ,remap_schema=’usera’:'usera’ 。

例如:imp system/passwd fromuser=usera touser=userb file=/oracle/exp.dmp log=/oracle/exp.log;

      impdp system/passwd directory=expdp dumpfile=expdp.dmp remap_schema=’usera’:'userb’ logfile=/oracle/exp.log;

(2) 更換表空間,用exp/imp的時候,要想更改表所在的表空間,需要手工去處理一下,

如alter table xxx move tablespace_new之類的操作。

用impdp只要用remap_tablespace=’tabspace_old’:'tablespace_new’

(3) 當指定一些表的時候,使用exp/imp 時,tables的用法是 tables=(‘table1′,’table2′,’table3′)。

expdp/impdp的用法是tables=’table1′,’table2′,’table3′

(4) 是否要導出數據行

exp (ROWS=Y 導出數據行,ROWS=N 不導出數據行)

expdp content(ALL:對象+導出數據行,DATA_ONLY:只導出對象,METADATA_ONLY:只導出數據的記錄)

(5) expdp是[10g]的新特性而且只能在服務器執行。而exp/imp是通用的。

(6) oracle11g中有個新特性,當表無數據時,不分配segment,以節省空間,所以exp導不出空表。解決的辦法是用expdp, 當然也可以設置deferred_segment_creation 參數 或者 insert一行,再rollback,但是這樣很麻煩。

 

三、導出數據


1. 導出expdb的過程

(1). 按用戶導

        expdp scott/tiger@orcl schemas=scott dumpfile=expdp.dmp DIRECTORY=dpdata1;

(2). 並行進程parallel

        expdp scott/tiger@orcl directory=dpdata1 dumpfile=scott3.dmp parallel=40 job_name=scott3

(3). 按表名導

        expdp scott/tiger@orcl TABLES=emp,dept dumpfile=expdp.dmp DIRECTORY=dpdata1;

(4). 按查詢條件導

        expdp scott/tiger@orcl directory=dpdata1 dumpfile=expdp.dmp Tables=emp query='WHERE deptno=20';

(5). 按表空間導

        expdp system/manager DIRECTORY=dpdata1 DUMPFILE=tablespace.dmp TABLESPACES=temp,example;

(6). 導整個數據庫

        expdp system/manager DIRECTORY=dpdata1 DUMPFILE=full.dmp FULL=y;

 

 

2. 參數說明 - 導出expdb

(1). CONTENT:該選項用於指定要導出的內容.默認值為ALL

      CONTENT={ALL | DATA_ONLY | METADATA_ONLY}

      當設置CONTENT為ALL 時,將導出對象定義及其所有數據.為DATA_ONLY時,只導出對象數據,為METADATA_ONLY時,只導出對象定義

(2). DIRECTORY:指定轉儲文件和日志文件所在的目錄:DIRECTORY=directory_object

(3). EXCLUDE:該選項用於指定執行操作時釋放要排除對象類型或相關對象

      EXCLUDE=object_type[:name_clause] [,….]

      Object_type用於指定要排除的對象類型,name_clause用於指定要排除的具體對象.EXCLUDE和INCLUDE不能同時使用

      Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dup EXCLUDE=VIEW

(4). INCLUDE:導出時包含指定的類型

        (例:INCLUDE=TABLE_DATA,

             INCLUDE=TABLE:"LIKE 'TAB%'"

             INCLUDE=TABLE:”NOT LIKE ‘TAB%’”…)

             EXCLUDE:導出時排除的數據類型(例:EXCLUDE=TABLE:EMP)

(5). FILESIZE:指定導出文件的最大尺寸,默認為0,(表示文件尺寸沒有限制)(單位為bytes).

(6). JOB_NAME:此次導出進程使用的名稱,方便跟蹤查詢(可選)

(7). FLASHBACK_SCN:指定導出特定SCN時刻的表數據

       FLASHBACK_SCN=scn_value:Scn_value用於標識SCN值.FLASHBACK_SCN和FLASHBACK_TIME不能同時使用

       Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp

       FLASHBACK_SCN=358523

(8). FLASHBACK_TIME:指定導出特定時間點的表數據:FLASHBACK_TIME=“TO_TIMESTAMP(time_value)”

       Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_TIME=“TO_TIMESTAMP(’25-08-2004 14:35:00’,’DD-MM-YYYY HH24:MI:SS’)”

(9). TABLESPACE:指定一個表空間導出.

(10). QUERY=[schema.] [table_name:] query_clause

        Schema用於指定方案名,table_name用於指定表名,query_clause用於指定條件限制子句.QUERY選項不能與 CONNECT=METADATA_ONLY,EXTIMATE_ONLY,TRANSPORT_TABLESPACES等選項同時使用.

        Expdp scott/tiger directory=dump dumpfiel=a.dmp Tables=emp query=’WHERE deptno=20’

(11). PARALLEL:並行操作: 指定執行導出操作的並行進程個數,默認值為1

 

 

3. 總結

可以通過PARALLEL 參數為導出使用一個以上的線程來顯著地加速作業。每個線程創建一個單獨的轉儲文件,因此參數dumpfile 應當擁有和並行度一樣多的項目。

可以指定通配符作為文件名,而不是顯式地輸入各個文件名,例如:

expdp ananda/abc123 tables=CASES directory=DPDATA1 dumpfile=expCASES_%U.dmp parallel=4 job_name=Cases_Export

注意:dumpfile 參數擁有一個通配符%U,它指示文件將按需要創建,格式將為expCASES_nn.dmp,其中nn 從01 開始,然后按需要向上增加。

在並行模式下,狀態屏幕將顯示四個工作進程。(在默認模式下,只有一個進程是可見的)所有的工作進程同步取出數據,並在狀態屏幕上顯示它們的進度。

分離訪問數據文件和轉儲目錄文件系統的輸入/輸出通道是很重要的。否則,與維護Data Pump 作業相關的開銷可能超過並行線程的效益,並因此而降低性能。並行方式只有在表的數量多於並行值並且表很大時才是有效的。

 

四、還原數據


1. 導入impdp的過程

(1). 導到指定用戶下

        impdp scott/tiger DIRECTORY=dpdata1 DUMPFILE=expdp.dmp SCHEMAS=scott;

(2). 改變表的owner

        impdp system/manager DIRECTORY=dpdata1 DUMPFILE=expdp.dmp TABLES=scott.dept REMAP_SCHEMA=scott:system TABLE_EXISTS_ACTION=TRUNCATE;

(3). 導入表空間

        impdp system/manager DIRECTORY=dpdata1 DUMPFILE=tablespace.dmp TABLESPACES=example;

(4). 導入數據庫

        impdb system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=y;

(5). 追加數據

        impdp system/manager DIRECTORY=dpdata1 DUMPFILE=expdp.dmp SCHEMAS=system TABLE_EXISTS_ACTION

 

2. 參數說明 - 導入impdp

(1). TABBLE_EXISTS_ACTION={SKIP | APPEND | TRUNCATE | FRPLACE }

當設置該選項為SKIP時,導入作業會跳過已存在表處理下一個對象;

當設置為APPEND時,會追加數據;

當設置為TRUNCATE時,導入作業會截斷表,然后為其追加新數據;

當設置為REPLACE時,導入作業會刪除已存在表,重建表病追加數據;

注意,TRUNCATE選項不適用與簇表和NETWORK_LINK選項;

(2). REMAP_SCHEMA

該選項用於將源方案的所有對象裝載到目標方案中:REMAP_SCHEMA=source_schema:target_schema

(3). REMAP_TABLESPACE

將源表空間的所有對象導入到目標表空間中:REMAP_TABLESPACE=source_tablespace:target:tablespace

(4). REMAP_DATAFILE

該選項用於將源數據文件名轉變為目標數據文件名,在不同平台之間搬移表空間時可能需要該選項.

REMAP_DATAFIEL=source_datafie:target_datafile

 
四、案例 - 從PROD中導出數據,后導入SIT環境中


Step1. 創建邏輯目錄,該命令不會在操作系統創建真正的目錄,最好以system等管理員創建。

create directory dpdata as '/home/oracle/expdb';

Step2. 查看管理理員目錄(同時查看操作系統是否存在,因為Oracle並不關心該目錄是否存在,如果不存在,則出錯)

select * from dba_directories;

Step3. 給scott用戶賦予在指定目錄的操作權限,最好以system等管理員賦予。

grant read,write on directory dpdata to oracle;

Step4. 在PROD測試表中導入10條記錄,並導出

create table scott.emp ( emp_id number, name varchar2(50), sex varchar(2), age number, country varchar(10), salary number );
begin
  insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 10000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 20000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 30000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 40000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 50000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 60000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 70000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 80000); insert into scott.emp values (1, 'baoxinjian1', 'M', 27, 'China', 90000); end; commit;

Step5. 導出為dmp文件,上傳至SIT

expdp sys/oracle@gavinprod TABLES=scott.emp dumpfile=empexpdp.dmp DIRECTORY=dpdata;

 Step6. 查看導出log內容

 

Step7. 將數據文件上傳至SIT環境

 

Step8. 進行上傳

impdp sys/oracle DIRECTORY=dpdata DUMPFILE=empexpdp.dmp SCHEMAS=sys;

 Step9. 查看導入Log日志內容

 

Step10. 查看數據庫表是否成功

 

Thanks and Regards

參考: http://blog.chinaunix.net/uid-16844439-id-3213672.html

參考:http://www.2cto.com/database/201202/120126.html

參考:http://czmmiao.iteye.com/blog/2041703


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM