Informatica是最常用的ETL工具之一,與之類似的工具還有DataStage和kettle;
由於個人只用過Informatica,所以只討論Informatica。此軟件分為客戶端和服務器端連部分,由於我的服務器端連帶系統拷貝過來的,所以安裝從略。我從使用的角度出發介紹如下:
一、 由於informatica的元數據(賬號、密碼…)信息保存在Oracle上面,所以我們先來檢查下Oracle的運行情況:
- su – oracle先用oracle用戶登錄到主機,密碼是ripple
lsnrctl start監測Oracle的運行
圖1.1
OK,現在Oracle正常運行着。
- 登錄oracle數據庫,sqlplus "/as sysdba"
Exit退出oracle數據庫:
退出oracle主機用戶:
切換到bin目錄
查找啟動informatica腳本:
啟動該腳本:
由此可以看到我們的服務器啟動了
二、 打開Informatica客戶端
1.0
配置連接
備注:一定要修改windows主機的hosts,地址C:\Windows\System32\drivers\etc
添加 : 192.168.68.128 infa到文件中,infa就是到時候連接配置的域名,而192.168.68.128就是informatica服務器主機的ip地址。
如圖1.1
圖1.1
然后我們在cmd里面ping下域名,看看能否解析(ping infa):
圖1.2
從ping出來的結果可以看到infa作域名解析的解析到的ip地址是192.168.68.128,是,(什么!?你不知道為什么ip地址是192.168.68.128),就是我們主機的地址啊
在主機上面執行/sbin/ifconfig
結果如下圖:
圖1.3
現在可以配置連接了
1.3
其中:
1.Gateway Host就是我們剛才修改那個C:\Windows\System32\drivers\etc里面的
圖1.2
2.Gateway port必須為6001;
3.Domain Name可以隨便取;
三、模塊介紹:
Informatica總的來說由4大模塊組成:
Repository Manager--資料庫,Designer--設計器,Workflow Manager--物理設計,Workflow Monitor--監控;
- Repository Manager--資料庫,就是保護我們所有設計、實施整個過程的一個類似於宏定義的東西,可以理解為類似informatica的知識存儲。
- Designer 設計器,就是單數據流的邏輯過程,打個比方就是某人要怎么樣從廣州到開平,(方式一是:從廣州南站,坐輕軌到新會,再坐野雞車,到開平市區,再坐個摩托車回家;方式二是:先坐地鐵到芳村客運站,然后乘坐大巴回家;。。。)
- Workflow Manager--物理設計,即具體的落地實施,比如說是我從廣州公司所在地回到我家里。里面保護很多任務設計:task(session/....) workflow(task...)
- Workflow Monitor--監控
Informatica的控制台:
(https://192.168.68.128:8443/adminconsole/Console.do)
用戶名:Administrator;密碼:Administrator