簡介: 在企業的發展過程中,如果不重視敏感數據的保護,和數據安全體系的建設,那么一旦發生了敏感數據泄漏事件,輕則企業口碑受損,業務受影響;重則會直接觸法律,受到主管部門的處罰和制裁。本文將以一個最常見的場景:消費者隱私數據保護,展示如何利用Dataphin的安全能力,保障企業的數據安全。
作者:龍裔
在
我們來看一個最常見的案例:消費者隱私數據保護。
場景介紹
近幾年,隨着消費者個人意識的崛起和對隱私的重視,數據安全成為了一個越來越熱門的話題,國家也陸續發布了一些相關規定,來規范數據的采集和使用。在企業的發展過程中,如果不重視敏感數據的保護,不重視數據安全體系的建設,那么一旦發生了敏感數據泄漏事件,輕則企業口碑受損,業務受影響;重則會直接觸法律,受到主管部門的處罰和制裁。
而在企業領域的敏感信息中,個人敏感信息是絕對的大頭,包括個人的身份信息(姓名、身份證號碼)、聯系方式(手機、郵箱、地址)、個人財產信息、生物識別信息等等,都屬於個人敏感數據。這些數據一旦泄漏,對用戶的個人生活以及對企業的業務運行,都會產生非常大的損害,所以在企業的業務運轉中,要對消費者的個人隱私數據進行脫敏保護。
圖片:支付寶中,對用戶姓名與用戶賬號的脫敏保護
主要流程
首先,我們回顧一下在Dataphin上,實現敏感數據保護的主要流程:
在Dataphin中,實現敏感數據保護,主要可以分為以下三個步驟:
1、識別敏感數據:即設定數據分類、數據分級、識別規則等內容
2、設置敏感數據保護方式:為識別的敏感數據選擇合適的脫敏算法、設定脫敏規則
3、數據消費:在即席查詢、開發數據寫生產等場景進行數據消費時脫敏
詳細步驟
接下來,我們以用戶敏感信息中,最常見的用戶姓名為例,展示如何一步步的首先用戶姓名的識別和脫敏保護。
1、識別敏感數據
假設我們已經建立好了數據分類和數據分級(Dataphin會內置通用的分類和分級標准,支持開箱即用),我們直接進入新建識別規則的模擬步驟:
新建一個【用戶姓名】的識別規則;
掃描范圍選擇【全部】;
掃描方式選擇【內置識別】-【名字】(如果用戶姓名的字段都叫【name】,也可以配置正則規則【^name$】);
數據分類選擇【個人數據(C)】;
數據分級選擇【機密數據(L3)】(根據自己企業的情況靈活調衡);
優先級選擇【3】(中間優先級,根據自己企業的情況靈活調整);
配置完成識別規則后,我們可以觸發一次【手動規則掃描】,或者等到第二天,系統會自動執行一次全局掃描。最終敏感數據識別的結果,都可以在【識別記錄】頁面看到:
2、設置敏感數據保護方式
識別到敏感數據之后,下一步就是給敏感數據設置合適的保護方式,從而保證數據不泄漏。
Dataphin當前內置了多種遮蓋脫敏規則(如【張三】,顯示成【*三】)、哈希脫敏規則(如【張三】,顯示為【615DB57AA314529AAA0FBE95B3E95BD3】),可以滿足大部分業務場景下的數據保護需求,並在未來支持加解密算法和用戶自定義脫敏算法。
這里建議大家根據業務需求,選擇合適的算法。比如對於用戶姓名,在大部分的業務場景中(如支付寶轉賬),都是不能顯示完整的名稱,但是可以顯示一部分,用於身份確認,這樣就可以選擇內置的【中文姓名】的脫敏算法
選擇好合適的脫敏算法之后,我們就可以配置動態脫敏規則了,還是以用戶姓名為例:
新建一個【用戶姓名脫敏】的脫敏規則;
綁定已經建好的敏感數據識別規則【用戶姓名】;
應用場景選擇【寫開發表】、【即席查詢】;
脫敏方式選擇【遮蓋掩碼-中文姓名】;
生效范圍選擇【全部】
至此,我們的敏感數據識別和保護就已經完全配置完成了,接下來在數據消費的過程中,就可以對數據進行保護了。
3、數據消費
下面已即席查詢為例,展示敏感數據識別和脫敏的效果:
可以看到,我們開始往表格里寫入的數據是【張三】,因為寫入了敏感數據【name】字段,也就是【用戶姓名】,所以在數據讀取的時候,系統自動的進行了脫敏,操作的同學只能夠看到【*三】,從而防止敏感數據泄漏,保護了數據安全。
結語
上面通過用戶姓名這樣一個非常很簡單的案例,串講了整個敏感數據識別和脫敏的主流程,相信能幫助您理解整個數據安全保護的機制;而在主流程之外,還有數據分類分級的制定、審核識別記錄並手動修改、脫敏白名單等流程。同時,在企業實際的數據安全保護中,還有更多的系統工作要做,比如制定符合企業的數據分類分級體系、建立完整的數據識別體系等等。
原文鏈接
本文為阿里雲原創內容,未經允許不得轉載。