論文解讀--大數據平台數據的安全管理體系架構設計


論文解讀--大數據平台數據的安全管理體系架構設計--胡志達(電信)
 
  1. 摘要:
    1. 引出問題:數據的安全管理存在數據傳輸不可靠、數據丟失、數據泄露等問題
    2. 大數據平台的安全管理體系:數據安全采集層、存儲層、使用層
    3. 數據安全采集層:從數據分類、數據分級、敏感數據識別、數據脫脫敏、多類型加密機制,5個維度保障數據安全
    4. 數據安全存儲層:從多維度數據安全存儲機制、基於網絡安全等級保護制度的安全評測兩個維度保障數據安全
    5. 數據安全使用層:采用細粒度訪問控制、基於區塊鏈的數據保護、基於聯邦學習的數據共享、全過程安全審計 4中技術保障數據使用安全
    6. 通過設計基於區塊鏈的數據保護模型和基於聯邦學習的數據共享模型,進一步提升數據安全管理體系架構的可靠性和可用性
  2. 引言:
    1. 舉例1:
      1. 為解決隱私信息被泄露的問題,陳天瑩等提出智能數據脫敏系統,實現了低耦合和高效的數據脫敏功能
      2. 為解決數據隱私保護中效率低的問題,黃亮等采用計算技術對數據安全保護的關鍵環節進行處理,提升了數據隱私處理的效率
      3. 魏富國等分析了人工智能技術在數據安全管理領域的應用情況,總結了人工智能技術進行數據治理的成果
      4. 針對生物醫療領域的數據隱私泄露問題,肖璦等從數據采集、存儲、使用、共享等環節設計了數據安全使用和管理規范
      5. 為解決多種類型數據的隱私泄露問題,劉峰等提出了基於區塊鏈技術的泛用型數據隱私保護協議,並且證明和驗證了協議的效率和便捷性
    2. 綜上:
      1. 已有的研究已經從訪問控制、安全審計、容災備份、數據加密等維度對數據進行安全管理。
      2. 但已有的研究不能很好的保障數據的安全存儲和使用。
  3. 拋出問題
    1. 數據采集問題
      1. 數據理解分析不深
        1. 數據來源於多個部門或者單位,數據具有多種業務邏輯、數據類型多樣
      2. 數據采集過程不安全兩個問題。
        1. 產生數據的終端多樣,這些終端接入網絡的方式包括無線和優先,網絡的提供方也多種多樣。
        2. 如何實現數據來源的可信,數據的傳輸安全是急需解決的問題
    2. 數據存儲安全
      1. 存在數據丟失
        1. 由於網絡、計算機、數據庫等軟硬件出現故障,導致存儲的數據或者正在保存中的數據出現丟失
      2. 數據平台被攻擊
        1. 由於近年來網絡攻擊活動越來越多,抵御難度大
    3. 數據使用安全
      1. 數據泄露
        1. 不同企業間數據流轉
      2. 數據權限管理
        1. 數據。。
  4. 模型
    1. 安全采集層:數據分類、數據分級、敏感數據識別、數據脫敏、多類型加密機制
      1. 數據分類
        1. 優先按照業務類型進行數據分類
        2. 采用業務屬性、保密級別、所有者屬性等對數據進行分類
      2. 數據分級
        1. 從數據安全性需求的角度進行管理
        2. 要素:所有者、數據不安全導致的災害程度,數據不安全涉及的相關范疇
      3. 敏感數據識別
        1. 根據數據的關鍵詞、數據特征、數據隱私性對數據的敏感情況進行識別
      4. 數據脫敏
        1. 從業務的需求角度:數據置換算法、數據加密算法
      5. 多類型加密機制
        1. 根據數據安全級別,制定不同的加密方式
          1. 可驗加密、多方加密、同態加密
    2. 數據安全存儲層:從多維度數據安全存儲機制、基於網絡安全等級保護制度的安全評測兩個維度保障數據安全
      1. 數據存儲安全
        1. 根據數據的分級特性以及數據的屬性對數據采取合適的存儲方式
        2. 將數據存儲平台的安全檢查作為常規的工作
    3. 數據安全使用層:采用細粒度訪問控制、基於區塊鏈的數據保護、基於聯邦學習的數據共享、全過程安全審計 4中技術保障數據使用安全
      1. 基於區塊鏈的數據保護模型:
        1. 解決數據在使用中被篡改
        2. 區塊鏈技術的去中心化,去信任特征可以比較好地實現數據的安全管理
        3. 實現區塊鏈的技術包括:分布式數據存儲、共識機制、智能合約等。通過各項關鍵技術,可以是此案數據的防篡改、可追溯等特性
      2. 基於聯邦學習的數據共享模型
        1. 解決數據孤島導致數據價值不能有效發揮的問題
        2. 聯邦學習是谷歌公司提出的數據共享機制,通過聯邦學習技術,可以有效解決數據共享存在的數據泄漏問題,不能共享導致的數據孤島問題
      3. 數據的使用包括:事前的資源申請,事中的數據處理,使用后的數據歸檔等全過程的工作,全過程安全審計策略
  5. 關鍵技術
    1. 基於區塊鏈的數據保護模型
      1. 該模型包括數據相關方、系統服務接口、區塊鏈模型、數據存儲平台4個方面
      2. 數據相關方:參與數據采集、數據存儲、數據使用的相關單位或部門
      3. 系統服務接口:采用通用性較高的restful接口技術,方便各個參與方的操作。
      4. 區塊鏈模塊采用以太坊聯盟技術實現,從而提升數據相關方對數據的操作
      5. 數據存儲平台使用分布式存儲技術,實現數據的高可用和安全存儲功能
      6. 考慮到數據管理的安全性和便捷性,在區塊鏈模塊定義用戶管理合約、數據采集合約、數據使用合約,從而實現數據管理的智能化和自動化
    2. 基於聯邦學習的數據共享模型
      1. 該模型包括數據共享的相關參與方,數據共享接口,3中聯邦學習策略
        1. 相關參與方:需要共享數據的相關部門或公司
        2. 數據共享接口:各參與方實現數據共享的通道
        3. 3種聯邦學習策略:橫向聯邦學習、縱向聯邦學習、聯邦遷移學習
          1. 橫向聯邦學習:適合業務類型相同,但客戶區域不同的參與者之間共享數據
          2. 縱向聯邦學習:適合用戶類型和區域相同,單是業務類型不同的參與者之間共享數據
          3. 聯邦遷移學習:適應業務類型不同、用戶類型不同的參與者之間進行合作研究而進行數據共享的場景
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM