相關內容簡體繁體

informatica組件

本文轉載自查看原文 2021-12-17 11:02 784 ETL

informatica組件

Informatica常用組件的使用方法

https://www.cnblogs.com/wan-ge1212/

一、F(X)表達式組件：

主要用於行級表達式的計算；如對某個字段進行四則運算；

對某些字符串進行計算等。 Oracle簡單查詢差不多。

SELECT sal Expression Transformatiion 表達式組件；

功能描述：它是做這種字段級的計算，加減乘除等等都可以在這里面來做，所以會用的比較多；

在端口中I表示：輸入（input）;

O表示：輸出（output）;

v表示：變量（variable）(臨時保存一些數值);

二、SQ: Source Qualifier

功能描述：Source Qualifier組件在說有的場景中會被用到，它主要用於連接數據源，將數據源的數據類型轉換為PowerCenter的數據類型。

對源進行抽取的一個組件；他是和源綁定在一起的；

相當於inforamtica做ETL的第一個動作，E的動作。這個組件基本上是不能缺少的；

Source Qualifier 能做哪些功能呢？

1、一般不會手動就寫一些腳本，可以手工的定義一些SQL的select腳本；

informatica對數據庫來說他也是數據庫的一個客戶端，相當於inforamtica扔給他一個SQL腳本然后返回他想要的結果集；

所以inforamtica呢會產生一個SQL腳本，這個時候呢你可以手動去編輯他

4 條件： SQ :同構數據源的。（來自於同一個數據庫）

三、Filter組件

四、Normalizer組件：

特點：

將列表轉換為行表

將列表轉換為行表 GK_SAL_AOMOUNT 是一個序列號，從1，2，3，4，5，6….一直增長；

GCID_SAL_AMOUNT為1、2、、3、4重復進行。

EMPNO SAL_AMOUNT GK_SAL_AOMOUNT GCID_SAL_AMOUNT

1 1000 1 1

1 100 2 2

1 10 3 3

1 1 4 4

2 10000 5 1

2 1000 6 2

2 100 7 3

2 10 8 4

五、Router組件：

路由組件實現數據的分發：

六、Aggregator 匯總組件：

分組聚合按哪幾個字段進行分組對哪幾個字段進行聚合運算；統計出每個部門的工資之和

作用：執行分組聚合運算 Aggregator Transformation;

Aggregator 這個組件呢跟數據庫里面的寫SUM，group by 語句類似；

功能就是分組數據做一些匯總函數；排好序在匯總他的性能是最高的；

你可以理解成相當於sum 什么什么，group by 哪些字段，但是他的操作是在 inforamtica 內存中操作的，而不是在數據庫中操作，已經把數據讀過來了；

七、Lookup組件：

-- 連接

1、有連接和未連接之分；

2、Lookup表可以是數據庫表，也可以是文本文件；

-- 未連接

查找組件；

有兩種類型一種是連接的一種非連接的

非連接的 Lookup相當於一個函數。

連接的有一點對源表內容進行豐富。

有一個動作先把一張表放進了Lookup里面去了；

作為咱們的資源池： Baidu 關鍵字（后台有這種相關的東西）數據流規則：一種是分叉一種是不可以分叉

Lookup是被動組件：進去一條記錄他必須出來一條如果查找不到呢？他會給咱們補空。

Lookup是比較消耗ETL服務器資源的組件之一，因此很多時候開發人員都會試圖優化這個組件的性能，如減少Lookup的次數。

基於這個考慮，PowerCenter提供了Unconnected Lookup，確保只有必須的數據采執行Lookup操作。

八、Rank 作用：

排序記錄，只輸出最頂層或最低層的n個記錄

用法：創建好Rank(下簡稱RNK)后，將需要的用的字段從transformation拖拽到RNK,雙擊RNK,對RNK的屬性進行設置。

在Ports tab中有一個名為‘R’的列，選擇你要排序的列。你還可以選擇你想分組的列。

在Properties tab中Top/Bottom屬性，Top表示選擇頂層的記錄，Bottom表示選擇底層的記錄；

Number Of Ranks屬性值是整數，表示要選擇的記錄條數。

假設你在‘R’列中選擇了名為’ Price’的列，而且Group By選擇了‘Name’列，Top/Bottom屬性選擇的是‘Top’, Number Of Ranks屬性值是2,

那么將抽取過程是這樣的：以name分組取出每組中 Price最大的2列記錄。

命名方式：RNK_Name

九、Joiner組件：

特點：

M的選擇：一般會先碼表數據量比較小的數據為M M放進內存里。

Joiner type： Joiner:可以實現異構數據源的合並。

Emp CSV Dept 數據庫里 Joiner 有局限性：每次合並的時候只能合並兩張表。N張表 N-1joiner組件進行合並。

十、文本文件：

特點：

十一、XML組件：

特點：

十二、Expression組件：

十三、Sorter組件：

十四、Union組件：

十五、調用存過組件：

十六、序號組件：

2、設置開始值，每次遞增的值；

3、設置循環使用序列號，當序列號當前值到達最大值時，重置序列號為初始值；

十七、Mapplet映射組件：

十八、Update Strategy組件

-- -- -- -- -- -- -- -- --

1、變量的值在運行過程會發生變化；參數是一個常量值，在運行過程中不能修改的值。

功能：在表達式中引用變量和參數

相關鏈接：https://blog.csdn.net/yongjian1092/article/details/52588434

其他連接：https://www.cnblogs.com/wan-ge1212/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Informatica_(3)組件 Informatica常用組件整理 Informatica 常用組件Lookup之一概述 Informatica 常用組件Source Qualifier之一概述 Informatica 常用組件Lookup之五轉換屬性 Informatica PowerCenter 常用轉換組件一覽表 INFORMATICA 開發規范 Informatica 初學日記全 informatica powercenter學習筆記（二） informatica簡易教程

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM