參考:http://www.jintiankansha.me/t/qaWmL0eO1J
可視化的數據清洗,無需打代碼的那種。
Tableau Prep清潔cleaning的步驟
使用感受:大大節省時間的。
參考:http://www.jintiankansha.me/t/WM7YLMRYrm
- 移除字段,重命名字段
- 根據符號->拆分字段
- Clean: 包括:英文大小寫變更, 移除字母,移除數值,移除標點符號,Trim spaces去掉空格
- 更改數據類型
- 使用篩選器:對某些數據類型選擇一個取值范圍。
- 分組和替換。
- 創建計算字段
- 編輯值:直接修改值。
Tableau prep智能的記錄每個步驟的修改,並用圖標表示每個步驟和整個流程。
分組和替換
數據清潔中一個常見問題是存在多個代表同一含義的值,如 GB 和 Great Britain(大不列顛)。
可以在清潔步驟中利用分組和替換選項。這個選項允許我們對多個值進行分組並用統一值替換它們。
幾種操作方式:
- 手動分類: 手動進行分組和替換。
- 智能發音:處理拼錯誤,bath , baths,會被分成一組。
- 智能常用字符: "wang ming"和"wang, ming" 會被分成一類 ⚠️智能算法不保證准確,需要自己調整。
- 智能拼寫:⚠️和智能發音的區別沒弄明白。
tableau的轉置
使用感受:很有用的功能!
補充:⚠️
軟件的設置原因:進行:“行轉列‘的時候,需要點擊“顯示配置窗格”,否則轉置不會起效果。
tableau的join
使用感受:並不比寫代碼方便太多。
注意:當join后,需要檢查字段,發現關聯列,有相同的value,但沒有關聯上,這些因為可能有空格存在:
其他
改變列的排列順序
在儀表盤pane,如何要改變列的排列順序,需要使用“選擇數據表格”。