特定的背景和不同的驅動力:
高層對低質量的數據表現的感知疼痛,對數據治理巨大價值的認知
業務模式: 對內 2B 2C 數據去驅動流程效率的提升 生產力的發展最終還會受制於生產關系
數據規模: 海量數據的存儲和分析壓力-有沒有?
數據確權:流程管理體系 人事組織體系 企業文化體系 企業制度體系
人才隊伍:懂技術,懂業務的數據管理的專業隊伍
數據源:數據采集的全面性
數據應用:數據的生命周期管理 多維數據分析
架構: 企業級信息架構 部門級信息架構
數據工作框架-企業級信息架構
數據源:
數據源數字化,數據采集
數據源創建、讀取、更新、刪除
數據底座
數據湖: 數據交換層+數據處理層
主題關聯:基礎模型、融合模型及洞察主題
數據消費:數據處理層的分析引擎+ 數據應用應用層
數據治理: 數據資產管理 計算資源管理 存儲資源管理
數據治理融入IT實施中
數據分類
1.數據分類:
內部數據和外部數據
非結構化數據和結構化數據
01. 結構化數據:
觀測數據:觀測工具
軟感知數據
硬感知數據
基礎數據
主數據
事務數據
報告數據
規則數據
02.非結構化數據:需要智能化的IT技術支持
管理對象的標題 格式 等基本特征和定義
對數據內容的客觀理解進行管理:標簽 ,相似性檢索 相似性連接
治理核心: 對其基本特征與內容進行提取,並通過元數據落地進行開展
2.治理: 元數據
技術元數據
業務元數據
操作元數據
本書結構:
綜合治理體系、
數據分類
信息架構、
數據湖和數據主題聯結-數據底座
數據消費
數據質量和數據安全
問題:
額外的人工轉換和翻譯,這極大增加人工成本,延長業務執行周期