【文章推荐】【原创】大叔经验分享（99）Atlas简介、安装

原文：【原创】大叔经验分享（99）Atlas简介、安装

官方：http: atlas.apache.org 一简介元数据管理：数据分类数据血缘数据治理 Atlas is a scalable and extensible set of core foundational governance services enabling enterprises to effectively and efficiently meet their comp ...

2020-01-11 14:32 0 1123 推荐指数：

查看详情

【原创】大叔经验分享（100）Atlas导入hive元数据

首先要有HIVE_HOME环境变量，如果是apache，直接配置为解压目录；如果是CDH，设置如下： # export HIVE_HOME=/opt/cloudera/parcels/CD ...

【原创】大叔经验分享（88）jenkins假死

jenkins安装启动后，使用systemctl来进行进程监控 # systemctl enable jenkins 但是还是经常发生jenkins进程挂了，不会自动重启，通过systemctl查看状态为： # systemctl status jenkins ...

【原创】大叔经验分享（55）spark连接kudu报错

spark-2.4.2kudu-1.7.0 开始尝试 1）自己手工将jar加到classpath spark-2.4.2-bin-hadoop2.6+kudu-spark2_2.11-1.7. ...

【原创】大叔经验分享（48）oozie中通过shell执行impala

oozie中通过shell执行impala，脚本如下：直接执行shell脚本正常，在oozie中执行报错：按照提示修改PYTHON_EGG_CACHE即可 ...

【原创】大叔经验分享（15）spark sql limit实现原理

之前讨论过hive中limit的实现，详见 https://www.cnblogs.com/barneywill/p/10109217.html下面看spark sql中limit的实现，首先看执行计 ...

【原创】大叔经验分享（1）在yarn上查看hive完整执行sql

hive执行sql提交到yarn上的任务名字是被处理过的，通常只能显示sql的前边一段和最后几个字符，这样就会带来一些问题： 1）相近时间提交了几个相近的sql，相互之间无法区分； 2）一个任务有 ...

【原创】大叔经验分享（30）CM开启kerberos

kerberos安装详见：https://www.cnblogs.com/barneywill/p/10394164.html 一为CM创建用户 # kadmin.local -q "addprinc scm/admin" 名字和密码任意，后续配置中会 ...

【原创】大叔经验分享（59）kudu查看table size

kudu并没有命令可以直接查看每个table占用的空间，可以从cloudera manager上间接查看 CM is scrapping and aggregating the /metr ...

原文：【原创】大叔经验分享（99）Atlas简介、安装

相关推荐

相关标签