引言
刪除數據庫記錄是一個非常常見的需求,當數據失去價值時,我們便會刪除它,但是如果操作不當,往往就會把一些有價值的數據誤刪掉,造成重要數據的丟失,合理采用刪除方式才能更好地利用數據資源,下面介紹幾種常用的刪除方式。
刪除方式
物理刪除
物理刪除就是直接從數據庫中刪除一條或多條記錄,將數據從磁盤上擦除,可以使用DELETE FROM
SQL語句實現,這種方式產生的后果就是記錄永久性刪除,無法找回,一般適用於小型或數據重要性不高的項目,可以提高數據庫資源利用率。物理刪除方式是一種最簡單最基本的數據刪除方式,這里不多做介紹,我們主要來看一下邏輯刪除方式。
邏輯刪除
所謂的邏輯刪除就是實現記錄已刪除的效果,但實際上數據仍然存在於數據庫中,只是對用戶隱藏這一部分數據。一些大型的、數據關聯性高、數據重要性高的應用往往會采用這種刪除方式,它可以實現回收站、刪除恢復、查看歷史版本等實用功能,根據業務的需要有不同的應用場景。
應用場景
例如,在一些郵箱應用中,當你刪除一條郵件時,不會將郵件直接刪除,而是把郵件移動到回收站,你可以在回收站中對郵件進行恢復、徹底刪除等操作,可以有效防止誤刪等情況。
再比如博客管理平台一般都會提供查看修改歷史、比較歷史版本等功能,我們可以方便地查看文章的修改歷史,以及恢復到之前某一版本。
實現思路
標記刪除
采用刪除標記的方式可以很容易地實現邏輯刪除功能,通過在表中添加一個刪除標記字段,將正常記錄的該字段設置為0,已刪除記錄的該字段設置為1,查詢時添加一個where
條件篩選刪除標記為0的記錄,就可以實現邏輯刪除的功能,此時的刪除業務只需要將記錄的刪除標記字段修改為1即可。
拉鏈
拉鏈方式來源於數據倉庫,是針對數據倉庫設計中表存儲數據的方式而定義的,所謂拉鏈,就是記錄歷史,記錄一個事物從開始到當前狀態的所有變化信息。拉鏈算法是目前數據倉庫領域最典型的算法之一。
這種方式的表結構與普通表的區別在於多了兩個字段(START_DATE
&END_DATE
)表示記錄的有效時間,分別為記錄添加時間和記錄最大有效時間。
- 數據表采用聯合主鍵的方式,使用
id
和START_DATE
來唯一的表示某條記錄,如:
CREATE TABLE `table_name` (
`id` INT NOT NULL AUTO_INCREMENT,
`start_date` datetime NOT NULL,
`end_date` datetime NOT NULL,
...,
primary key(`id`,`start_date`)
)ENGINE=MYISAM DEFAULT CHARSET=utf8;
- 新增記錄時
START_DATE
可設置為當前時間,END_DATE
設置為null或未來某個時間來表示無窮大,如:
insert into table_name(start_date,end_date,...) values(當前時間,一百年后,...);
- 查詢數據時只要對日期進行篩選就可得到當前有效的記錄,例如
select * from table_name where id=記錄ID and start_date<=當前時間 and end_date>當前時間;
- 修改記錄的方式與傳統方式不同,修改操作並不是直接修改數據庫中的某條記錄,而是把修改的原有效記錄的
END_DATE
設置為當前時間,接下來新增一條完整的、修改后的記錄,如:
update table_name set end_date=當前時間 where id=原記錄ID and end_date=一百年后;
insert into table_name(id,start_date,end_date,...) values(原記錄ID,當前時間,一百年后,...);
- 刪除操作很簡單,不是真的將記錄從數據表中移除,只需把記錄的
END_DATE
設置為當前時間即可,如:
update table_name set end_date=當前時間 where id=刪除記錄ID;
- 通過這種方式可以完整地記錄下數據的變化情況,使用下面的查詢語句就可以獲取某條記錄的完整版本列表以及查看特定版本的內容:
-- 獲取版本列表
select start_date from table_name where id=記錄ID order by start_date;
-- 查看特定版本內容
select * from table_name where id=記錄ID and start_date=版本日期;
寫在最后
不同的業務需要根據其應用場景來選擇合適的數據刪除方式,一般的應用可以采用物理刪除的方式,簡單粗暴地將數據擦除,這樣可以有效提高數據庫地利用率,如果歷史數據一點價值都沒有或者價值不高,那還留着干什么,這時如果采用邏輯刪除地方式反而加重了數據庫的負擔,浪費了大量寶貴的資源。但是有些項目如金融、交通、能源等領域的歷史數據,往往具有很高的利用價值,通過對這些數據進行分析總結,可以更好的了解該領域的發展情況和健康程度,以及對未來的發展規划起到一定指導作用,這時就要采用邏輯刪除的方式,雖然數據管理平台為了便於管理,刪除了過期的數據,但數據分析系統仍能從數據庫中獲取到歷史數據,通過抽取轉換加載的過程,將歷史數據轉化為高價值的內容,這是目前信息技術發展的主要趨勢。
本文為作者kMacro原創,轉載請注明來源:http://www.jianshu.com/p/b22b7bc207a6。