FineBI學習系列之FineBI的ETL處理(圖文詳解)


 

 

 

 

不多說,直接上干貨!

 

  這是來自FineBI官網提供的幫助文檔

http://help.finebi.com/
http://help.finebi.com/doc-view-48.html

 

 

目錄:

 

 

 

1、描述

  ETL轉換是指對分布的、異構數據源中的數據,比如說關系數據等底層數據進行一定的轉換,然后將轉換后的數據表保存在中間層中,成為數據分析的基礎。
 
   FineBI中的ETL轉換包括對數據表的ETL轉化和對字段的ETL轉換。數據表的ETL轉化特指將關系數據表中的行轉換為列,簡單來說就是將轉化前數據表中某個字段的所有值取出來,成為新表的列名;字段的ETL轉換是指對業務包中某個數據表的字段進行操作,具體可操作類型包括:新增公式列、join、union、行列轉換、使用部分字段、過濾、分組統計、構建自循環列、新增分組。
  FineBI的ETL轉化既可以轉化業務包內的數據表,也可以轉化業務包外的數據表,最后將轉化的中間表保存在業務包內。
 
 
  注:所有的ETL操作之后,需要更新Fineindex之后才可以查看到對應的更改結果數據集。對於Fineindex更新操作或者更新方式不了解的可以查看 Fineindex更新設置

 

 

 

 

 

 

 

 

 

 

2、外部數據表

  比如說我們想要基於業務包外部的數據表添加一個ETL轉換表至銷售DEMO業務包中,那么該如何選擇外部數據表呢?
  用 管理員賬號登錄FineBI系統: http://localhost:37799/WebReport/ReportServer?op=fs,點擊 數據配置>業務包管理,選中銷售DEMO業務包,進入銷售DEMO業務包配置界面,如下圖:

 

 

 

 

 

 

   

  在頁面上方點擊“+添加表”,選擇 ETL表按鈕即可進入ETL處理界面,如下圖:

 

 

 

 

 

 

 

 

  點擊右上角的 添加表按鈕即可添加非業務包內的數據表作為轉化表的基本表,如下圖:

 

 

 

 

 

 

 

 

  隨便選擇一張數據表,比如說簽約事實表,選中它,點擊下一步,頁面跳轉到數據表設置界面,此時顯示的是選中的該表的設置界面,頁面左半邊為表數據設置區域,右半邊是當前表進行etl處理的過程,如進行了N步etl操作都會記錄,截圖中圈出的就是進行etl操作按鈕,點擊,即可選擇ETL轉化的類型,如下圖:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3、業務包內數據表

  如果我們想要直接基於業務包內的數據表進行ETL轉化,可直接點擊業務包中數據表,進入數據表配置界面,在右側的ETL處理界面對該數據表進行處理,如下圖,選中銷售DEMO業務包中的合 同事實 表數據表,即可在右側的ETL處理界面進行轉化,選擇ETL處理的類型:

 

 

 

 

  注:不論是業務包外的數據表進行處理還是業務包內的數據表進行處理,選擇數據表之后,頁面都會回到上圖的表數據設置界面,在該界面的右側進行ETL處理。

 

 

 

 

 

 

 

 

 

 

3.1 ETL流及業務包選擇
  上面添加非業務包的數據表時,有看到ETL流的操作,下面對它詳細介紹。ETL流功能並非一定需要選擇業務包的數據表之后才能使用,直接在業務包界面中點擊+ETL功能,即之前講解的業務包數據表添加時,也可以直接選擇ETL流進行操作。
 
  ETL流主要是:為了能讓復雜的數據表在經過多步ETL操作之后仍能使用該表本身前面某一個ETL步驟之后的中間結果集(表自身可選中間步驟結果集)。
  如下圖所示為經過ETL處理的簽約事實表:

 

 

 

 

 

 

 

 

 

 

 

  此時,點擊右上角的添加表按鈕

 

 
 
 
  進入頁面后可以點擊 ETL流,可以看到該數據表從原始步驟開始

 

 
 
 
  每一個ETL處理步驟得到的數據表結果集都可以選擇並進行后續操作,如圖所示:

 

 

 

 

 

 

 

   

  選擇了某一個或者N個結果集之后,會回到之前的數據表操作界面,同時剛才選擇ETL流中的結果集也會出現,如下圖所示:

 

 

 

  針對上面新添加的另一個結果集,可以進行后續的ETL處理,將兩個表join或者union等,在后續的功能模塊會進行詳細說明。

 

 
 
 
 
 
 

4、ETL處理類型

  ETL處理的類型有很多種,如下圖所示:

 

 

 

 

  注:ETL轉換業務包內部數據表,轉換完成之后,原始數據表消失,會變成新增的ETL數據表。請謹慎使用。
  注:ETL處理支持使用所有結果集,包括業務包中和數據庫中的數據表。
 
 
下面我們一一介紹所有ETL轉換類型的使用方式。

join

union

行列轉換

使用部分字段

數據表過濾

分組統計字段

構建自循環列

新增分組列

sql數據分組處理

 

 

 

  見如下博客

  。。

 

 

 

 

 

 

 

 

 

歡迎大家,加入我的微信公眾號:大數據躺過的坑        人工智能躺過的坑
 
 
 

同時,大家可以關注我的個人博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

   詳情請見:http://www.cnblogs.com/zlslch/p/7473861.html

 

  人生苦短,我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神,匯聚於互聯網和個人學習工作的精華干貨知識,一切來於互聯網,反饋回互聯網。
  目前研究領域:大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。 語言涉及:Java、Scala、Python、Shell、Linux等 。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。 只要你一直關注和呆在群里,每天必須有收獲

 

      對應本平台的討論和答疑QQ群:大數據和人工智能躺過的坑(總群)(161156071) 

 

 

 

 

 

 

 

 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM