hive數據庫如何去重，去除相同的一模一樣的數據

本文轉載自查看原文 2020-04-08 08:32 3381 7.3 sql

問題：發現存在一張表中存在相同的兩行數據

得到：僅僅保留一行數據

方法：

原理-我們通過

 1 select count (字段1，字段2) from 表1；
 2 
 3 結果 200條數據
 4 
 5 select count (distinct 字段1，字段2) from 表1；
 6 
 7 結果 100條數據
 8 
 9 相當於后者可以實現查出來去重后的數據
10 
11 create table 表1_bak as select distinct 字段1，字段2 from 表1;   --備份表數據
12 
13 delete from 表1;
14 
15 insert into 表1 select * from 表1_bak；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 BaseResponse公共響應類，與我的設計一模一樣，靠、ApiResponse 使用VMware搭建3台一模一樣的Linux虛擬機搭建hadoop集群環境 mysql數據庫之去重 MongoDB數據庫去重數據庫怎么刪除相同的內容 GP開發示例：數據庫去重 MySQL數據庫去重 SQL解決 redis數據庫的set去重操作 oracle數據庫中如何去除空格 hive 數據清理--數據去重