informatica組件


informatica組件

Informatica常用組件的使用方法

https://www.cnblogs.com/wan-ge1212/

一、F(X)表達式組件:

 

主要用於行級表達式的計算;如對某個字段進行四則運算;

對某些字符串進行計算等。 Oracle簡單查詢差不多。

SELECT   sal Expression Transformatiion 表達式組件;

功能描述:它是做這種字段級的計算,加減乘除等等都可以在這里面來做, 所以會用的比較多;

在端口中I表示:輸入(input);

O表示:輸出(output);

v表示:變量(variable)(臨時保存一些數值);

 

 

二、SQ: Source Qualifier

 

 

  

功能描述:Source Qualifier組件在說有的場景中會被用到,它主要用於連接數據源,將數據源的數據類型轉換為PowerCenter的數據類型。

對源進行抽取的一個組件;他是和源綁定在一起的;

相當於inforamtica做ETL的第一個動作,E的動作。這個組件基本上是不能缺少的;

Source Qualifier 能做哪些功能呢?

1、一般不會手動就寫一些腳本,可以手工的定義一些SQL的select腳本;

informatica對數據庫來說他也是數據庫的一個客戶端,相當於inforamtica扔給他一個SQL腳本然后返回他想要的結果集;

所以inforamtica呢會產生一個SQL腳本,這個時候呢你可以手動去編輯他

4 條件: SQ :同構數據源 的。(來自於同一個數據庫)

 

三、Filter組件

 

 

 

 

 

 

 

四、Normalizer組件:

 

   特點:

 

 

 將列表轉換為行表

將列表轉換為行表 GK_SAL_AOMOUNT 是一個序列號,從1,2,3,4,5,6….一直增長;

GCID_SAL_AMOUNT為1、2、、3、4重復進行。

                                                                     EMPNO      SAL_AMOUNT     GK_SAL_AOMOUNT    GCID_SAL_AMOUNT

                                                                          1                     1000                             1                                    1                   

                                                                          1                     100                               2                                    2                   

                                                                          1                      10                                3                                    3                   

                                                                          1                       1                                 4                                    4                   

                                                                          2                       10000                         5                                    1                   

                                                                          2                       1000                           6                                    2                   

                                                                          2                        100                            7                                    3                   

                                                                          2                         10                             8                                    4                    

 

五、Router組件:

 

 

 

 路由組件  實現 數據的分發:

 

六、Aggregator 匯總組件:

 

 

 

 分組聚合 按哪幾個字段進行 分組   對哪幾個字段進行聚合運算; 統計出 每個 部門的 工資之和

作用:執行分組聚合運算 Aggregator Transformation;

Aggregator 這個組件呢跟數據庫里面的 寫SUM,group by 語句類似;

功能就是 分組數據做一些匯總函數;排好序在匯總 他的性能是最高的;

你可以理解成 相當於sum 什么 什么,group by 哪些字段,但是他的操作是在 inforamtica 內存中操作的,而不是在數據庫中操作,已經把數據讀過來了;

 

七、Lookup組件:

 

   --  連接

 1、有連接未連接之分;

 2、Lookup表可以是數據庫表,也可以是文本文件;

 

 

 

 

    --  未連接

 

 

 

 

 查找組件;

有兩種類型 一種是連接的 一種非連接的 

非連接的 Lookup相當於 一個 函數。

連接的  有一點對源表 內容 進行 豐富。

有一個 動作 先把 一張 表 放進了Lookup里面去了;

作為 咱們的資源池: Baidu 關鍵字 (后台 有 這種相關的東西) 數據流 規則:一種是 分叉 一種 是 不可以 分叉

Lookup是被動組件:進去一條記錄 他 必須 出來一條  如果查找不到 呢?他會 給咱們 補空。

Lookup是比較消耗ETL服務器資源的組件之一,因此很多時候開發人員都會試圖優化這個組件的性能,如減少Lookup的次數。

基於這個考慮,PowerCenter提供了Unconnected Lookup,確保只有必須的數據采執行Lookup操作。

 

八、Rank 作用:

 

排序記錄,只輸出最頂層或最低層的n個記錄

用法:創建好Rank(下簡稱RNK)后,將需要的用的字段從transformation拖拽到RNK,雙擊RNK,對RNK的屬性進行設置。

在Ports tab中 有一個名為‘R’的列,選擇你要排序的列。你還可以選擇你想分組的列。

在Properties tab中Top/Bottom屬性,Top表示選擇頂層的 記錄,Bottom表示選擇底層的記錄;

Number Of Ranks屬性值是整數,表示要選擇的記錄條數。

假設你在‘R’列中選擇了名為’ Price’的列,而且Group By選擇了‘Name’列,Top/Bottom屬性選擇的是‘Top’, Number Of Ranks屬性值是2,

那么將抽取過程是 這樣的:以name分組取出每組中 Price最大的2列記錄。

命名方式:RNK_Name

 

九、Joiner組件:

 

  特點:

 

 

 

M的選擇:一般會先 碼表 數據量 比較小的 數據 為M  M放進內存里。

Joiner type: Joiner:可以實現 異構數據源的合並。

Emp  CSV  Dept  數據庫里 Joiner  有局限性:每次 合並的時候  只能合並兩張表。N張表  N-1joiner組件 進行合並。

 

十、文本文件

 

    特點:

 

 

 

 十一、XML組件:

 

  特點:

 

 十二、Expression組件:

 

 

  

 

 十三、Sorter組件:

 

 

 

 

 十四、Union組件:

 

 

 

 

 十五、調用存過組件:

 

 

 

 

 

 

 

 十六、序號組件:

 

 

 

  2、設置開始值,每次遞增的值;

 3、設置循環使用序列號,當序列號當前值到達最大值時, 重置序列號為初始值;

 

 

十七、Mapplet映射組件:

 

 

 

 

 

十八、Update Strategy組件

 

 

 

 

 -- -- -- -- -- -- -- -- --

 

1、變量的值在運行過程會發生變化;參數是一個常量值, 在運行過程中不能修改的值。

 

 功能:在表達式中引用變量和參數

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

相關鏈接:https://blog.csdn.net/yongjian1092/article/details/52588434

其他連接:https://www.cnblogs.com/wan-ge1212/

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM