hive数据库如何去重，去除相同的一模一样的数据

本文转载自查看原文 2020-04-08 08:32 3381 7.3 sql

问题：发现存在一张表中存在相同的两行数据

得到：仅仅保留一行数据

方法：

原理-我们通过

 1 select count (字段1，字段2) from 表1；
 2 
 3 结果 200条数据
 4 
 5 select count (distinct 字段1，字段2) from 表1；
 6 
 7 结果 100条数据
 8 
 9 相当于后者可以实现查出来去重后的数据
10 
11 create table 表1_bak as select distinct 字段1，字段2 from 表1;   --备份表数据
12 
13 delete from 表1;
14 
15 insert into 表1 select * from 表1_bak；

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 数据库有相同数据时，如何去重后取最新的一条数据 MongoDB数据库去重 MySql数据库去重浅谈数据库去重 mysql数据库之去重 MongoDB数据库去重 BaseResponse公共响应类，与我的设计一模一样，靠、ApiResponse 【Hive】数据去重 hive数据库基本查询 Hive与数据库的异同