閱識風雲是華為雲信息大咖,擅長將復雜信息多元化呈現,其出品的一張圖(雲圖說)、深入淺出的博文(雲小課)或短視頻(雲視廳)總有一款能讓您快速上手華為雲。更多精彩內容請單擊此處。
摘要: 數據倉庫服務GaussDB(DWS)的數據脫敏,支持指定用戶范圍內列級敏感數據的脫敏功能,具有靈活、高效、透明、友好等優點。使得敏感及隱私信息不被泄露,提高了對敏感及私密數據的保護,極大地增強了產品的數據安全能力。
本文分享自華為雲社區《大數據時代的隱私利器-GaussDB(DWS)數據脫敏》,原文作者:閱識風雲
背景信息
大數據時代的到來,大數據、雲計算和人工智能等新技術應用不斷深化,為數據的深度挖掘及分析提供了強有力的支撐,大數據中蘊含的巨大價值被逐步挖掘出來。然而,一系列信息泄露事件的曝光,使得數據安全越來越受到廣泛的關注。各國各地區逐步建立健全和完善數據安全與隱私保護相關法律法規,提供用戶隱私保護的法律保障。如何加強技術層面的數據安全和隱私保護,是對數據倉庫產品提出的要求,也是數據安全建設最有效的辦法。
GaussDB(DWS)的數據脫敏特性,支持指定用戶范圍內列級敏感數據的脫敏功能,具有靈活、高效、透明、友好等優點。使得敏感及隱私信息不被泄露,提高了對敏感及私密數據的保護,極大地增強了產品的數據安全能力。
什么是數據脫敏
數據脫敏(Data Masking),即屏蔽敏感數據,對某些敏感信息(比如,身份證號、手機號、卡號、客戶姓名、客戶地址、郵箱地址、銀行賬號、密碼類等等 )通過脫敏規則進行數據的變形,實現隱私數據的可靠保護。
業界常見的脫敏規則有,替換、重排、加密、截斷、掩碼,用戶也可以根據期望的脫敏算法自定義脫敏規則。
良好的數據脫敏實施,需要遵循兩個原則:第一,盡可能地為脫敏后的應用,保留脫敏前的有意義信息;第二,最大程度地防止黑客進行破解。
數據脫敏分為靜態數據脫敏和動態數據脫敏。靜態數據脫敏,是數據的“搬移並仿真替換”,是將數據抽取進行脫敏處理后,下發給下游環節,隨意取用和讀寫的,脫敏后數據與生產環境相隔離,滿足業務需求的同時保障生產數據庫的安全。動態數據脫敏,在訪問敏感數據的同時實時進行脫敏處理,可以為不同角色、不同權限、不同數據類型執行不同的脫敏方案,從而確保返回的數據可用而安全。
下圖為一個簡單的靜態脫敏和動態脫敏示例,可以看出兩者的不同。
GaussDB(DWS)的數據脫敏功能,摒棄業務應用層脫敏依賴性高、代價大等痛點,將數據脫敏內化為數據庫產品自身的安全能力,提供了一套完整、安全、靈活、透明、友好的數據脫敏解決方案,屬於動態數據脫敏。用戶識別敏感字段后,基於目標字段,綁定內置脫敏函數,即可創建脫敏策略。脫敏策略(Redaction Policy)與表對象是一一對應的。一個脫敏策略包含表對象、生效條件、脫敏列-脫敏函數對三個關鍵要素,是該表對象上所有脫敏列的集合,不同字段可以根據數據特征采用不同的脫敏函數。當且僅當生效條件為真時,查詢語句才會觸發敏感數據的脫敏,而脫敏過程是內置在SQL引擎內部實現的,對生成環境用戶是透明不可見的。
數據脫敏如何使用
第一步:創建脫敏策略需確定受限制用戶角色。
動態數據脫敏,是在查詢語句執行過程中,根據生效條件是否滿足,實現實時的脫敏處理。生效條件,通常是針對當前用戶角色的判斷。敏感數據的可見范圍,即是針對不同用戶預設的。系統管理員,具有最高權限,任何時刻對任何表的任何字段都可見。
第二步:識別和梳理具體業務場景的敏感字段。
敏感信息依賴於實際業務場景和安全維度,以自然人為例,用戶個體的敏感字段包括:姓名、身份證號、手機號、郵箱地址等等;在銀行系統,作為客戶,可能還涉及銀行卡號、過期時間、支付密碼等等;在公司系統,作為員工,可能還涉及薪資、教育背景等;在醫療系統,作為患者,可能還涉及就診信息等等。
第三步:確定脫敏列需要綁定的脫敏函數。
產品內置一系列常見的脫敏函數接口,可以針對不同數據類型和數據特征,指定參數,從而達到不一樣的脫敏效果。脫敏函數可采用如下三種內置接口,同時支持自定義脫敏函數。三種內置脫敏函數能夠涵蓋大部分場景的脫敏效果,不推薦使用自定義脫敏函數。
- MASK_NONE:不作脫敏處理,僅內部測試用。
- MASK_FULL:全脫敏成固定值。
- MASK_PARTIAL:使用指定的脫敏字符對脫敏范圍內的內容做部分脫敏。
不同脫敏列可以采用不同的脫敏函數。比如,手機號通常顯示后四位尾號,前面用"*"替換;金額統一顯示為固定值0,等等。
數據脫敏使用示例
以某公司員工表emp,表的屬主用戶alice以及用戶matu、july為例,簡單介紹數據脫敏的使用過程。其中,表emp包含員工的姓名、手機號、郵箱、發薪卡號、薪資等隱私數據,用戶alice是人力資源經理,用戶matu和july是普通職員。
假設表、用戶及用戶對表emp的查看權限均已就緒。
1、創建脫敏策略mask_emp,僅允許alice查看員工所有信息,matu和july對發薪卡號、薪資均不可見。字段card_no是數值類型,采用MASK_FULL全脫敏成固定值0;字段card_string是字符類型,采用MASK_PARTIAL按指定的輸入輸出格式對原始數據作部分脫敏;字段salary是數值類型,采用數字9部分脫敏倒數第二位前的所有數位值。
切換到matu和july,查看員工表emp。
2、由於工作調整,matu進入人力資源部參與公司招聘事宜,也對員工所有信息可見,修改策略生效條件。
切換到用戶matu和july,重新查看員工表emp。
3、員工信息phone_no、email和birthday也是隱私數據,更新脫敏策略mask_emp,新增三個脫敏列。
切換到用戶july,查看員工表emp。
4、考慮用戶交互的友好性,GaussDB(DWS) 提供系統視圖redaction_policies和redaction_columns,方便用戶直接查看更多脫敏信息。
5、突然某一天,公司內部可共享員工信息時,直接刪除表emp的脫敏策略mask_emp即可。
GaussDB(DWS)數據脫敏優勢
- 一套簡單、易用的數據脫敏策略語法。
- 一系列可覆蓋常見隱私數據脫敏效果的、靈活配置的內置脫敏函數。
- 一個完備、便捷的脫敏策略應用方案,使得原始語句在執行過程中可以實時、透明、高效地實現脫敏。
GaussDB(DWS)充分滿足客戶業務場景的數據脫敏訴求,支持常見隱私數據的脫敏效果,實現敏感數據的可靠保護。
了解更多華為雲數據倉庫GaussDB(DWS),請點擊這里。