對於常規的MySQL數據表中可能存在重復的數據,有些情況是允許重復數據的存在,有些情況是不允許的,這個時候我們就需要查找並刪除這些重復數據,以下是具體的處理方法!
方法一:防止表中出現重復數據
當表中未添加數據時,可以在MySQL數據表中設置指定的字段為PRIMARY KEY(主鍵) 或者 UNIQUE(唯一) 索引來保證數據的唯一性。
例如在學生信息表中學號no不允許重復,需設置學號no為主鍵,且默認值不能為NULL。
CREATE TABLE student
(
no CHAR(12) NOT NULL,
name CHAR(20),
sex CHAR(10),
PRIMARY KEY (no)
);
方法二:過濾刪除重復值
對於數據表中原有的數據,想要去除重復數據需要經過重復數據查找、過濾以及刪除等步驟。
1. 統計重復數據
mysql> SELECT COUNT(*) as repetitions,no
-> FROM student
-> GROUP BY no
-> HAVING repetitions > 1;
以上查詢語句將返回student表中重復的記錄數。
2. 過濾重復數據
如果需要讀取不重復的數據可以在SELECT 語句中使用 DISTINCT 關鍵字來過濾重復數據。
mysql> SELECT DISTINCT no
-> FROM student;
也可以使用 GROUP BY 來讀取數據表中不重復的數據
mysql> SELECT no
-> FROM student
-> GROUP BY (no);
3. 刪除重復數據
刪除數據表中重復數據,可以使用以下SQL語句:
mysql> CREATE TABLE tmp SELECT no, name, sex FROM student GROUP BY (no, sex);
mysql> DROP TABLE student;
mysql> ALTER TABLE tmp RENAME TO student;
也可以在數據表中添加INDEX(索引)和 PRIMAY KEY(主鍵)來刪除表中的重復記錄,方法如下:
mysql> ALTER IGNORE TABLE student
-> ADD PRIMARY KEY (no);