个人理解
【个人对数据治理的理解】
汇聚多(数据)源,构建数仓 => 形成 数据中心[资源结构]
数据迁移/融合,统一数据标准,提升数据质量 => 形成 数据中心[资源数据]/数据资产
数据标签化,数据服务化 => 实现 数据变现
转述
当前数据治理存在哪些问题和困难? - 搜狐新闻
跨组织的沟通协调问题 / 投资决策的困难 / 工作的持续推进 / 技术选型
数据治理将遇到哪些问题 - itpub
2不3难:
事后型治理,不一致 / 被动型治理(治理体系被分割),不高效 / 误区型治理,难聚焦 / 项目型治理,难延续 / 兼职型治理,难落地
数据治理面临的问题 - CSDN
组织架构 / 数据治理工作流程(制度化) / 线上系统化
【数据治理工作流程(制度化)】执行层面,合理的治理流程是怎样的呢?
+ 业务架构梳理,界定范围
+ 拉通业务场景
+ 业务对象和业务元数据梳理(元数据管理)
+ 数据标准和数据规范制定(数据标准与数据质量规则)
+ 总体计划和方案制定(不同类型问题的解决方案)
+ 执行落地(方案落地)
【线上系统化】针对前期人工积累的数据治理内容,在系统上实现配置、自动监测告警、执行计划推送,实现数据生命周期管控。
+ 配置表字段的规则
+ 生成质量监控任务
+ 针对不同类型质量任务,推送解决策略
数据治理:面临的挑战与应对策略 [推荐] - 百度/人人都是产品经理
本文根据神策数据联合创始人 & CTO 曹犟发表的《数据治理中的一些挑战与应用》主题演讲整理而成。
- 数据治理的概念与重要性
- 数据治理面临的挑战
- 数据治理与组织架构
- 数据治理中的应对
[数据治理面临的挑战]
+ 多业务系统多数据源的整合挑战
+ 数据采集技术上的挑战
+ 用户隐私与安全挑战
+ 组织架构与部门隔阂带来的配合
+ 业务持续迭代中带来的挑战





[数据治理的三大原则]
数据治理原则 1:不要先污染后治理,要从源头控制
数据治理原则 2:数据治理的过程要贯穿到整个业务迭代的过程中
数据治理原则 3:以产品化、组件化的思路来解决,不能依赖于人工
高校数据治理解决方案存在哪些难题? - 强智科技
数据源头不明确,造成数据唯一性、准确性问题
数据采集后,格式不统一,不完整,造成数据完整性、语法问题
数据不及时,造成时效性、准确性等问题
数据共享问题,有些数据仍不能方便地获得,或不能保障周期性地获得准确实时的数据
对历史数据和冗余数据尚无统一完善的处理办法
数据治理解决方案包含哪些内容? - 强智科技
1 有效的高校内部数据标准体系,包括数据标准、管理标准、质量标准等内容,并保证各业务部门、各业务系统能得到落实与管控。
2 完成各业务系统的整合工作。
3 评估数据质量,生成数据质量报告。
银行数据治理实践中的难点及应对 - 新浪


数据治理平台的操作问题
存疑点: 1.功能点:
1)离线开发与实时开发的区别?
2)工作流:依赖组件? 且 / 或 ? 日 / 月 / 周 / 时 ?
3)基于数据标准的质量校验: 数据元 与 物理字段的映射 代码集 与 物理字段的映射:值域校验组件
X 4)元数据订阅:by 邮箱 or 电话 进行订阅操作后,当订阅元数据发生变更,会通过短信或邮件得方式告知,目前检测,该账号未配置邮箱和电话号码,请至少配置一种
X 5)元数据维护: 物理库的表结构发生变更后,是否需要重新采集元数据:需要手动再次执行元数据采集任务才行 [表]左侧红点:存在元数据内容变更 新增/删除 字段/表:均会出现红点 [表]中横线:该表已被删除
X 6)元数据血缘【关系维护】: 选择 数据治理/元数据/元数据维护>选择 数据源 > 选中 表(前提:此表无异常) > 选中 页面右侧的【关系维护】
X 7)元数据稽核:
X 8)数据中心资源: 如何映射物理表,映射的物理表能出现在选择列表中的前置条件是什么? 【(数据来源)映射规则】与【(中心资源表的)映射物理表】的区别是什么?作用是什么? 前者是说明中心数据资源表的各字段的来源字段 配置好 数据来源的映射规则和映射物理表后,即来源表和目的表就清晰可见了。就可以点击中心资源表的【ETL推送(记录)】,一键智能生成【数据同步的ETL推送任务】了,在【数据接入>数据同步>智能生成】的列表中可见。
9)资产管理: 资源目录的作用是什么?此处的新增(资源)是起什么作用?与数据中心资源的资源有什么联系和区别? 资源目录将对 数据资源(应用系统资源和数据中心资源)进行在服务门户的【资产目录】方面的目录编目。 资源目录的新增(资源)默认是:新增数据中心资源
10)数据中心资源的数据如何预览/查询到?
11)如何利用数据安全模块,实现对数据的地区级 / 部门级 / 角色级 / 用户级 / 列级 / 行级控制?
12)申请数据服务时,填写的【应用系统】起什么作用?为什么要设置这个值?