從應用角度看,需大數據平台提供如下4項安全功能:

圖1 大數據平台安全功能
1、邊界——限制只有合法用戶身份的用戶訪問大數據平台集群
(1) 用戶身份認證:關注於控制外部用戶或者第三方服務對集群的訪問過程中的身份鑒別,這是實施大數據平台安全架構的基礎;用戶在訪問啟用了安全認證的集群時,必須能通過服務所需要的安全認證方式。
(2)網絡隔離:大數據平台集群支持通過網絡平面隔離的方式保證網絡安全。
(3)傳輸安全:關注數據在傳輸過程中的安全性,包括采用安全接口設計及高安全的數據傳輸協議,保證在通過接口訪問、處理、傳輸數據時的安全性,避免數據被非法訪問、竊聽或旁路嗅探。
2、訪問——定義什么樣的用戶和應用可以訪問數據
(1) 權限控制:包括鑒權、授信管理,即確保用戶對平台、接口、操作、資源、數據等都具有相應的訪問權限,避免越權訪問;分級管理,即根據敏感度對數據進行分級,對不同級別的數據提供差異化的流程、權限、審批要求等管理措施,數據安全等級越高,管理越嚴格。
(2)審計管理:基於底層提供的審計數據,在權限管理、數據使用、操作行為等多個維度上對大數據平台的運轉提供安全審計能力,確保及時發現大數據平台中的隱患點,視不同嚴重程度采取包括排除隱患、挽回數據、人員追責在內的多種補救措施,同時指導大數據平台不再重復類似的問題。
3、透明——報告數據從哪里來、如何被使用和銷毀
(1)數據生命周期管理:理解大數據平台中數據的來源,以及知道數據怎么被使用的,何人在何地對其進行銷毀,對監測大數據系統中是否存在非法數據訪問非常關鍵,這需要通過安全審計來實現。安全審計的目的是捕獲系統內的完整活動記錄,且不可被更改。例如:華為的FusionInsight審計日志中記錄了用戶操作信息,可以快速定位系統是否遭受惡意的操作和攻擊,並避免審計日志中記錄用戶敏感信息:確保每一項用戶的破壞性業務操作被記錄審計,保證用戶業務操作可回溯;為系統提供審計日志的查詢、導出功能,可為用戶提供安全事件的事后追溯、定位問題原因及划分事故責任的重要手段。總之,大數據平台要能對數據進行全方位安全管控,做到“事前可管、事中可控、事后可查”。
(2)日志審計:日志審計作為數據管理,數據溯源以及攻擊檢測的重要措施不可或缺。然而Hadoop等開源系統只提供基本的日志和審計記錄,存儲在各個集群節點上。大數據平台應具備日志管理和分析能力。然而目前如果要對日志和審計記錄做集中管理和分析,仍然需要依靠第三方工具(如ELK等)。
4、數據——數據加密和脫敏;多租戶隔離;數據侵權保護;容災管理
(1)數據加密:提供數據在傳輸過程及靜態存儲的加密保護,在敏感數據被越權訪問時仍然能夠得到有效保護。在數據加解密方面,能通過高效的加解密方案,實現高性能、低延遲的端到端和存儲層加解密(非敏感數據可不加密,不影響性能)。同時,加密的有效使用需要安全靈活的密鑰管理,這方面開源方案還比較薄弱,需要借助商業化的密鑰管理產品。此外,加解密對上層業務透明,上層業務只需指定敏感數據,加解密過程業務完全不感知。
(2)用戶隱私數據脫敏:提供數據脫敏和個人信息去標識化功能,提供滿足國際密碼算法的用戶數據加密服務。
(3)多租戶隔離:實施多租戶訪問隔離措施,實施數據安全等級划分,支持基於標簽的強制訪問控制,提供基於ACL的數據訪問授權模型,提供全局數據視圖和私有數據視圖,提供數據視圖的訪問控制。
(4)數據容災:為集群內部數據提供實時的異地數據容災功能,例如Google的spanner作為NewSQL數據庫對外提供跨數據中心的容災機制。
(5)數據侵權保護:當存儲數據為一種特殊的數字內容產品時,其權益保護難度遠大於傳統的大數據,一旦發生侵權問題,舉證和追責過程都十分困難。大數據平台底層能利用區塊鏈類似技術實現數據的溯源確權。
參考:
http://blog.sina.com.cn/s/blog_5946bd590102wj82.html
http://www.cac.gov.cn/wxb_pdf/5583944.pdf
http://www.freebuf.com/articles/database/131268.html
http://www.hxdi.com/chs/article.php?id=869
http://www.infoq.com/cn/articles/big-data-security-analysis-products
