参考:http://www.jintiankansha.me/t/qaWmL0eO1J
可视化的数据清洗,无需打代码的那种。
Tableau Prep清洁cleaning的步骤
使用感受:大大节省时间的。
参考:http://www.jintiankansha.me/t/WM7YLMRYrm
- 移除字段,重命名字段
- 根据符号->拆分字段
- Clean: 包括:英文大小写变更, 移除字母,移除数值,移除标点符号,Trim spaces去掉空格
- 更改数据类型
- 使用筛选器:对某些数据类型选择一个取值范围。
- 分组和替换。
- 创建计算字段
- 编辑值:直接修改值。
Tableau prep智能的记录每个步骤的修改,并用图标表示每个步骤和整个流程。
分组和替换
数据清洁中一个常见问题是存在多个代表同一含义的值,如 GB 和 Great Britain(大不列颠)。
可以在清洁步骤中利用分组和替换选项。这个选项允许我们对多个值进行分组并用统一值替换它们。
几种操作方式:
- 手动分类: 手动进行分组和替换。
- 智能发音:处理拼错误,bath , baths,会被分成一组。
- 智能常用字符: "wang ming"和"wang, ming" 会被分成一类 ⚠️智能算法不保证准确,需要自己调整。
- 智能拼写:⚠️和智能发音的区别没弄明白。
tableau的转置
使用感受:很有用的功能!
补充:⚠️
软件的设置原因:进行:“行转列‘的时候,需要点击“显示配置窗格”,否则转置不会起效果。
tableau的join
使用感受:并不比写代码方便太多。
注意:当join后,需要检查字段,发现关联列,有相同的value,但没有关联上,这些因为可能有空格存在:
其他
改变列的排列顺序
在仪表盘pane,如何要改变列的排列顺序,需要使用“选择数据表格”。