如果啟用的是標准的企業數據庫,TABLEAU中做實時分析會比較困難,例如以下情況:
(1)不在辦公室,無法連接到數據庫;
(2)在Microsoft SQL Server或者Oracle,在數據庫很大或者數據庫設計人員沒有做好完整優化的情況下;
(3)訪問的數據源不是桌面端數據,而又想保存一個Tableau打包工作薄(.twbx格式文件:該格式文件包含工作薄內部所有底層數據源),就會出錯;
以上幾種情形需要使用一個“數據提取(擴展名.tde)”數據源,它是Tableau專有文件(里面包含一個緊密壓縮、高速的數據文件,Tableau將其存儲在計算機內存中,一般是的是硬盤,底層數據在用到的時候才會進入內存),包含從另一個數據庫或者是數據源中導入的所有內容;
連接到某些數據源(例如Salesforce和Google Analytics)是會自動創建數據提取,基於網絡的數據源在本地交互,速度可能會比較慢,另外,頻繁地與這些網絡數據交互可能會超過其供應商給用戶設置的服務限制。
創建一個數據提取的首次機會是在最開始連接到數據源時,指明必要的數據源屬性后,彈出對話框提示用戶是要選擇一個實時連接還是創建一個數據提取,可以選擇“導入所有數據”來創建一個完整的數據提取,該數據提取包含底層數據源中的所有字段和行;或者選擇“導入部分數據”,以顯示“創建數據提取”對話框,從中可以設置將用戶數據提取限定為底層數據源的一個有限數據集。Tableau一秒鍾可以刷新100MM條記錄。