informatica組件
Informatica常用組件的使用方法
https://www.cnblogs.com/wan-ge1212/
一、F(X)表達式組件:
主要用於行級表達式的計算;如對某個字段進行四則運算;
對某些字符串進行計算等。 Oracle簡單查詢差不多。
SELECT sal Expression Transformatiion 表達式組件;
功能描述:它是做這種字段級的計算,加減乘除等等都可以在這里面來做, 所以會用的比較多;
在端口中I表示:輸入(input);
O表示:輸出(output);
v表示:變量(variable)(臨時保存一些數值);
二、SQ: Source Qualifier




功能描述:Source Qualifier組件在說有的場景中會被用到,它主要用於連接數據源,將數據源的數據類型轉換為PowerCenter的數據類型。
對源進行抽取的一個組件;他是和源綁定在一起的;
相當於inforamtica做ETL的第一個動作,E的動作。這個組件基本上是不能缺少的;
Source Qualifier 能做哪些功能呢?
1、一般不會手動就寫一些腳本,可以手工的定義一些SQL的select腳本;
informatica對數據庫來說他也是數據庫的一個客戶端,相當於inforamtica扔給他一個SQL腳本然后返回他想要的結果集;
所以inforamtica呢會產生一個SQL腳本,這個時候呢你可以手動去編輯他
4 條件: SQ :同構數據源 的。(來自於同一個數據庫)
三、Filter組件




四、Normalizer組件:


特點:


將列表轉換為行表
將列表轉換為行表 GK_SAL_AOMOUNT 是一個序列號,從1,2,3,4,5,6….一直增長;
GCID_SAL_AMOUNT為1、2、、3、4重復進行。
EMPNO SAL_AMOUNT GK_SAL_AOMOUNT GCID_SAL_AMOUNT
1 1000 1 1
1 100 2 2
1 10 3 3
1 1 4 4
2 10000 5 1
2 1000 6 2
2 100 7 3
2 10 8 4
五、Router組件:




路由組件 實現 數據的分發:
六、Aggregator 匯總組件:




分組聚合 按哪幾個字段進行 分組 對哪幾個字段進行聚合運算; 統計出 每個 部門的 工資之和
作用:執行分組聚合運算 Aggregator Transformation;
Aggregator 這個組件呢跟數據庫里面的 寫SUM,group by 語句類似;
功能就是 分組數據做一些匯總函數;排好序在匯總 他的性能是最高的;
你可以理解成 相當於sum 什么 什么,group by 哪些字段,但是他的操作是在 inforamtica 內存中操作的,而不是在數據庫中操作,已經把數據讀過來了;
七、Lookup組件:


-- 連接
1、有連接和未連接之分;
2、Lookup表可以是數據庫表,也可以是文本文件;




-- 未連接





查找組件;
有兩種類型 一種是連接的 一種非連接的
非連接的 Lookup相當於 一個 函數。
連接的 有一點對源表 內容 進行 豐富。
有一個 動作 先把 一張 表 放進了Lookup里面去了;
作為 咱們的資源池: Baidu 關鍵字 (后台 有 這種相關的東西) 數據流 規則:一種是 分叉 一種 是 不可以 分叉
Lookup是被動組件:進去一條記錄 他 必須 出來一條 如果查找不到 呢?他會 給咱們 補空。
Lookup是比較消耗ETL服務器資源的組件之一,因此很多時候開發人員都會試圖優化這個組件的性能,如減少Lookup的次數。
基於這個考慮,PowerCenter提供了Unconnected Lookup,確保只有必須的數據采執行Lookup操作。
八、Rank 作用:
排序記錄,只輸出最頂層或最低層的n個記錄
用法:創建好Rank(下簡稱RNK)后,將需要的用的字段從transformation拖拽到RNK,雙擊RNK,對RNK的屬性進行設置。
在Ports tab中 有一個名為‘R’的列,選擇你要排序的列。你還可以選擇你想分組的列。
在Properties tab中Top/Bottom屬性,Top表示選擇頂層的 記錄,Bottom表示選擇底層的記錄;
Number Of Ranks屬性值是整數,表示要選擇的記錄條數。
假設你在‘R’列中選擇了名為’ Price’的列,而且Group By選擇了‘Name’列,Top/Bottom屬性選擇的是‘Top’, Number Of Ranks屬性值是2,
那么將抽取過程是 這樣的:以name分組取出每組中 Price最大的2列記錄。
命名方式:RNK_Name
九、Joiner組件:


特點:


M的選擇:一般會先 碼表 數據量 比較小的 數據 為M M放進內存里。
Joiner type: Joiner:可以實現 異構數據源的合並。
Emp CSV Dept 數據庫里 Joiner 有局限性:每次 合並的時候 只能合並兩張表。N張表 N-1joiner組件 進行合並。
十、文本文件:


特點:



十一、XML組件:


特點:

十二、Expression組件:





十三、Sorter組件:




十四、Union組件:




十五、調用存過組件:







十六、序號組件:



2、設置開始值,每次遞增的值;
3、設置循環使用序列號,當序列號當前值到達最大值時, 重置序列號為初始值;

十七、Mapplet映射組件:




十八、Update Strategy組件




-- -- -- -- -- -- -- -- --

1、變量的值在運行過程會發生變化;參數是一個常量值, 在運行過程中不能修改的值。
![]()
功能:在表達式中引用變量和參數





相關鏈接:https://blog.csdn.net/yongjian1092/article/details/52588434
其他連接:https://www.cnblogs.com/wan-ge1212/
