個人理解
【個人對數據治理的理解】
匯聚多(數據)源,構建數倉 => 形成 數據中心[資源結構]
數據遷移/融合,統一數據標准,提升數據質量 => 形成 數據中心[資源數據]/數據資產
數據標簽化,數據服務化 => 實現 數據變現
轉述
當前數據治理存在哪些問題和困難? - 搜狐新聞
跨組織的溝通協調問題 / 投資決策的困難 / 工作的持續推進 / 技術選型
數據治理將遇到哪些問題 - itpub
2不3難:
事后型治理,不一致 / 被動型治理(治理體系被分割),不高效 / 誤區型治理,難聚焦 / 項目型治理,難延續 / 兼職型治理,難落地
數據治理面臨的問題 - CSDN
組織架構 / 數據治理工作流程(制度化) / 線上系統化
【數據治理工作流程(制度化)】執行層面,合理的治理流程是怎樣的呢?
+ 業務架構梳理,界定范圍
+ 拉通業務場景
+ 業務對象和業務元數據梳理(元數據管理)
+ 數據標准和數據規范制定(數據標准與數據質量規則)
+ 總體計划和方案制定(不同類型問題的解決方案)
+ 執行落地(方案落地)
【線上系統化】針對前期人工積累的數據治理內容,在系統上實現配置、自動監測告警、執行計划推送,實現數據生命周期管控。
+ 配置表字段的規則
+ 生成質量監控任務
+ 針對不同類型質量任務,推送解決策略
數據治理:面臨的挑戰與應對策略 [推薦] - 百度/人人都是產品經理
本文根據神策數據聯合創始人 & CTO 曹犟發表的《數據治理中的一些挑戰與應用》主題演講整理而成。
- 數據治理的概念與重要性
- 數據治理面臨的挑戰
- 數據治理與組織架構
- 數據治理中的應對
[數據治理面臨的挑戰]
+ 多業務系統多數據源的整合挑戰
+ 數據采集技術上的挑戰
+ 用戶隱私與安全挑戰
+ 組織架構與部門隔閡帶來的配合
+ 業務持續迭代中帶來的挑戰





[數據治理的三大原則]
數據治理原則 1:不要先污染后治理,要從源頭控制
數據治理原則 2:數據治理的過程要貫穿到整個業務迭代的過程中
數據治理原則 3:以產品化、組件化的思路來解決,不能依賴於人工
高校數據治理解決方案存在哪些難題? - 強智科技
數據源頭不明確,造成數據唯一性、准確性問題
數據采集后,格式不統一,不完整,造成數據完整性、語法問題
數據不及時,造成時效性、准確性等問題
數據共享問題,有些數據仍不能方便地獲得,或不能保障周期性地獲得准確實時的數據
對歷史數據和冗余數據尚無統一完善的處理辦法
數據治理解決方案包含哪些內容? - 強智科技
1 有效的高校內部數據標准體系,包括數據標准、管理標准、質量標准等內容,並保證各業務部門、各業務系統能得到落實與管控。
2 完成各業務系統的整合工作。
3 評估數據質量,生成數據質量報告。
銀行數據治理實踐中的難點及應對 - 新浪


數據治理平台的操作問題
存疑點: 1.功能點:
1)離線開發與實時開發的區別?
2)工作流:依賴組件? 且 / 或 ? 日 / 月 / 周 / 時 ?
3)基於數據標准的質量校驗: 數據元 與 物理字段的映射 代碼集 與 物理字段的映射:值域校驗組件
X 4)元數據訂閱:by 郵箱 or 電話 進行訂閱操作后,當訂閱元數據發生變更,會通過短信或郵件得方式告知,目前檢測,該賬號未配置郵箱和電話號碼,請至少配置一種
X 5)元數據維護: 物理庫的表結構發生變更后,是否需要重新采集元數據:需要手動再次執行元數據采集任務才行 [表]左側紅點:存在元數據內容變更 新增/刪除 字段/表:均會出現紅點 [表]中橫線:該表已被刪除
X 6)元數據血緣【關系維護】: 選擇 數據治理/元數據/元數據維護>選擇 數據源 > 選中 表(前提:此表無異常) > 選中 頁面右側的【關系維護】
X 7)元數據稽核:
X 8)數據中心資源: 如何映射物理表,映射的物理表能出現在選擇列表中的前置條件是什么? 【(數據來源)映射規則】與【(中心資源表的)映射物理表】的區別是什么?作用是什么? 前者是說明中心數據資源表的各字段的來源字段 配置好 數據來源的映射規則和映射物理表后,即來源表和目的表就清晰可見了。就可以點擊中心資源表的【ETL推送(記錄)】,一鍵智能生成【數據同步的ETL推送任務】了,在【數據接入>數據同步>智能生成】的列表中可見。
9)資產管理: 資源目錄的作用是什么?此處的新增(資源)是起什么作用?與數據中心資源的資源有什么聯系和區別? 資源目錄將對 數據資源(應用系統資源和數據中心資源)進行在服務門戶的【資產目錄】方面的目錄編目。 資源目錄的新增(資源)默認是:新增數據中心資源
10)數據中心資源的數據如何預覽/查詢到?
11)如何利用數據安全模塊,實現對數據的地區級 / 部門級 / 角色級 / 用戶級 / 列級 / 行級控制?
12)申請數據服務時,填寫的【應用系統】起什么作用?為什么要設置這個值?