MySQL 查詢重復數據,刪除重復數據保留id最小的一條作為唯一數據


開發背景:

  最近在做一個批量數據導入到MySQL數據庫的功能,從批量導入就可以知道,這樣的數據在插入數據庫之前是不會進行重復判斷的,因此只有在全部數據導入進去以后在執行一條語句進行刪除,保證數據唯一性。

實戰:

表結構如下圖所示:

表明:brand

 

操作:

使用SQL語句查詢重復的數據有哪些:

SELECT * from brand WHERE brandName IN(
select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1 #條件是數量大於1的重復數據
)

使用SQL刪除多余的重復數據,並保留Id最小的一條唯一數據:

注意點:

錯誤SQL:DELETE FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1) 
AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)

 

提示: You can't specify target table 'brand' for update in FROM clause   不能為FROM子句中的更新指定目標表“brand”

原因是:不能將直接查處來的數據當做刪除數據的條件,我們應該先把查出來的數據新建一個臨時表,然后再把臨時表作為條件進行刪除功能

正確SQL寫法:

 DELETE FROM brand WHERE brandName IN (SELECT brandName FROM (SELECT brandName FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) e)
AND Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) t)
#查詢顯示重復的數據都是顯示最前面的幾條,因此不需要查詢是否最小值

更加簡單快捷的方式:

這是老飛飛的前輩給了一個更加方便,簡潔的寫法(非常感謝大佬的方法):

DELETE FROM brand WHERE Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName) t)

這句的意思其實就是,通過分組統計出數據庫中不重復的最小數據id編號,讓后通過 not in 去刪除其他重復多余的數據。

結果如下圖:

總結:

         很多東西都是需要自己一步一步的去探究的,當然網上的建議也是非常寶貴的借鑒和資源,無論做什么開發我們都需要理解它的工作原理才能夠更好的掌握它。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM