Informatica 結構
1個或多個資源庫(Respository)
PowerCenter數據整合引擎是基於元數據驅動的,提供了基於數據驅動的元數據知識庫(Repository),該元數據知識庫可以在主流的關系型數據庫中部署。該院數據庫中存儲所有的ETL元數據,包括:源、目標表的物理和邏輯元數據,ETL轉換規則,知識庫用戶權限,ETL任務運行歷史信息等元數據。
2個Server
Informatica Repository Server: 資料庫的Server,管理ETL過程中產生的元數據,用來管理所有對資料庫中元數據的請求和操作。
Informatica Server: 實際的ETL引擎
5個Client
PowerCenter Designer: 設計開發環境,定義源及目標數據結構;設計轉換規則,生成ETL映射
Workflow Manager: 合理地實現復雜的ETL工作流,基於時間、事件的作業調度
Workflow Monitor: 監控Workflow和Session 運行情況,生成日志的報告
Repository Manager: 資料庫管理,包括安全性管理等,元數據維護和安全操作,如:元數據查找,用戶、組、權限管理等。
Repository Server Administrator Console:對知識庫的操作,如:知識庫的創建、備份,恢復等。
ETL的實現方法
●安裝Oracle服務器
●在數據庫下新建用戶,用來管理資料庫,用於存放源表和目標表。
●安裝Oracle客戶端
●安裝ETL服務端
●安裝ETL客戶端
●配置數據源
●使用Designer客戶端,獲取源數據表的元數據。
●使用Designer客戶端,獲取目標數據表的元數據。
●使用Designer客戶端,設計一個Mapping,其中就是源->目標的ETL規則。
●使用Workflow Manager客戶端,針對上面實現的Mapping,實例化一個Session,為其指定實際的數據源、目標連接,以及其他屬性。
●使用Workflow Manager客戶端,創建一個Workflow,其中包含上述的Session以及其他的Task,在Workflow中可實現復雜的流程控制。
●運行上述Workflow,使用Workflow Monitor客戶端,檢測最終的任務運行結果。
安裝Oracle 11g Server端
●創建數據庫
●建立資料庫用戶:Informatica PowerCenter 在安裝之前,要在數據庫下新建用戶,用來管理資料庫。(注意字符集的設定)
●用於建立源表和目標表,並存放數據。(數據倉庫與資料庫通常建立兩個實例來區分開)
注意:11G與Windows Server 2012 不兼容
Step 1 僅安裝數據庫軟件
一路下一步安裝完畢
Step 2 創建數據庫
啟動 Database Configuration Assistant
選擇創建數據庫
選擇定制數據庫
全局數據庫名就是實例名
取消 配置Enterprise Manager 的勾選框
存儲類型和文件位置
數據庫組件只選擇 Enterprise Manager 資料檔案庫
點擊所有初始化參數按鈕,單擊高級參數,修改nls_date_format
安裝好以后我們數據庫目錄如下
CTL 后綴的為控制文件,REDO 是日志文件,DBF是數據庫文件
安裝Oracle 11g Client端
注意安裝32Bit版本的
●配置net manager,定義服務名
● 建立資料庫用戶,以保證下面ETL服務器的安裝
● 方便使用企業管理器來管理Oracle服務器
選擇管理員
一路下一步安裝完畢
Oracle 數據庫配置
Step1 先給服務器端創建一個監聽
如果沒有進行配置,我們的數據庫服務器是連接不上的
在服務端目錄里面打開 Net Manager,
1. 點擊監聽程序,然后點擊加號創建
2. 點擊添加地址
通常主機這邊都寫IP地址
3. 點擊保存網絡配置
Step 2 啟動監聽服務
命令行輸入命令來啟動監聽程序
lsnrctl start
Step 3 配置客戶端
客戶端目錄里面點擊 Net Manager
點擊服務命名,點擊加號, 網絡服務名隨意
點擊下一步,選擇Tcp/Ip 再點擊下一步,輸入主機名或者IP地址
接着 服務名打上創建數據庫的時候取的實例名
點擊下一步,點擊測試
出現以上登陸被拒絕的提示其實已經成功了。
整個配置完成以后,依然點擊保存網絡配置
建立資料庫用戶
安裝 PLSQL Developer,連接服務器進行配置 ,PLSQL 會用到Oracle Client,只支持32Bit的
1. 運行PLSQL,使用sys用戶登陸, Connect as 選為 SYSDBA
2. 建立用戶供Informatica使用
開啟命令行窗口,輸入以下命令並執行
CREATE USER INFA IDENTIFIED BY INFA DEFAULT TABLESPACE SYSTEM TEMPORARY TABLESPACE TEMP PROFILE DEFAULT ACCOUNT UNLOCK; GRANT CONNECT TO INFA; GRANT RESOURCE TO INFA; GRANT CREATE VIEW TO INFA; GRANT UNLIMITED TABLESPACE TO INFA; GRANT SELECT ANY TABLE TO INFA; ALTER USER INFA DEFAULT ROLE ALL; COMMIT;
--以下語句看擁有的權限 select * from dba_role_privs; select * from dba_sys_privs;
3. 檢查用戶是否創建成功
點擊菜單Session –> Login
安裝Informatica 的整個數據庫環境搭建就完成了。
INFORMATICA 安裝
服務器安裝
注意默認11g安裝以后監聽服務不會自動啟動,進Services把監聽程序設為自動啟動。 否則Informatica無法訪問數據庫
安裝INFORMATICA的時候勾選’運行安裝前系統檢查工具‘ 有提示修改open_cursors 。 修改代碼如下:
show parameter open_cursors; ---顯示參數值 alter system set open_cursors = 1000; ---修改參數值為1000 commit; ----提交
一路下一步安裝,因為是第一次安裝選擇創建域
配置信息。把之前Oracle環境的信息寫上去
不勾選其他帳戶
安裝完成
客戶端安裝
只選擇 PowerCenter Client
INFORMATICA 數據源配置
● ODBC配置操作
●數據庫tnsnames文件配置
● WORK FLOW配置
ODBC
1. 在服務器軟件目錄中啟動 Net Configuration Assistant
選擇本地網絡服務名配置
打上實例名
輸入主機名或者IP地址
2. 選擇 Oracle11G的驅動,客戶端哪個選擇報錯。 未知原因
這里可以測試一下是否成功。 這里User ID 不是很重要,因為到后面進行導入的時候會用不同的ID
tnsnames 文件
該安裝路徑下的tnsnames.ora文件其實對應的就是我們之前用Net Manager 創建的‘服務命名’
C:\app\Administrator\product\11.2.0\client_2\NETWORK\ADMIN\tnsnames.ora
Workflow配置
打開服務器目錄的Informatica Administrator Home Page,右擊域->新建->PowerCenter 存儲庫服務
另外屬性里面操作模式改為‘普通’
配置好后打開 Informatica PowerCenter Workflow Manager (其他幾個組件也可以,都有相通的配置)
點擊‘存儲庫’->’配置域‘ ,點擊’添加新域‘按鈕,輸入安裝服務器時候配置的信息。
點擊連接按鈕,注意用戶名是大小寫敏感的。
點擊Relational
創建個數據庫連接。
Step1 打開Repository Manager 新建 文件夾
Step2 打開PowerCenter Designer
連接資源庫,此時剛才建立的文件夾就會顯示
至此安裝過程結束
參考資料
安裝Informatica9.5.1
http://jingyan.baidu.com/article/76a7e409b2433afc3a6e156e.html