開發背景:
最近在做一個批量數據導入到MySQL數據庫的功能,從批量導入就可以知道,這樣的數據在插入數據庫之前是不會進行重復判斷的,因此只有在全部數據導入進去以后在執行一條語句進行刪除,保證數據唯一性。
實戰:
表結構如下圖所示:
表明:brand
操作:
使用SQL語句查詢重復的數據有哪些:
SELECT * from brand WHERE brandName IN( select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1 #條件是數量大於1的重復數據 )
使用SQL刪除多余的重復數據,並保留Id最小的一條唯一數據:
注意點:
錯誤SQL:DELETE FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1)
AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)
提示: You can't specify target table 'brand' for update in FROM clause 不能為FROM子句中的更新指定目標表“brand”
原因是:不能將直接查處來的數據當做刪除數據的條件,我們應該先把查出來的數據新建一個臨時表,然后再把臨時表作為條件進行刪除功能
正確SQL寫法:
DELETE FROM brand WHERE brandName IN (SELECT brandName FROM (SELECT brandName FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) e)
AND Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) t)
#查詢顯示重復的數據都是顯示最前面的幾條,因此不需要查詢是否最小值
更加簡單快捷的方式:
這是老飛飛的前輩給了一個更加方便,簡潔的寫法(非常感謝大佬的方法):
DELETE FROM brand WHERE Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName) t)
這句的意思其實就是,通過分組統計出數據庫中不重復的最小數據id編號,讓后通過 not in 去刪除其他重復多余的數據。
結果如下圖:
總結:
很多東西都是需要自己一步一步的去探究的,當然網上的建議也是非常寶貴的借鑒和資源,無論做什么開發我們都需要理解它的工作原理才能夠更好的掌握它。