首先要有HIVE_HOME环境变量, 如果是apache,直接配置为解压目录;如果是CDH,设置如下: # export HIVE_HOME=/opt/cloudera/parcels/CD ...
官方:http: atlas.apache.org 一 简介 元数据管理:数据分类 数据血缘 数据治理 Atlas is a scalable and extensible set of core foundational governance services enabling enterprises to effectively and efficiently meet their comp ...
2020-01-11 14:32 0 1123 推荐指数:
首先要有HIVE_HOME环境变量, 如果是apache,直接配置为解压目录;如果是CDH,设置如下: # export HIVE_HOME=/opt/cloudera/parcels/CD ...
jenkins安装启动后,使用systemctl来进行进程监控 # systemctl enable jenkins 但是还是经常发生jenkins进程挂了,不会自动重启,通过systemctl查看状态为: # systemctl status jenkins ...
spark-2.4.2kudu-1.7.0 开始尝试 1)自己手工将jar加到classpath spark-2.4.2-bin-hadoop2.6+kudu-spark2_2.11-1.7. ...
oozie中通过shell执行impala,脚本如下: 直接执行shell脚本正常,在oozie中执行报错: 按照提示修改PYTHON_EGG_CACHE即可 ...
之前讨论过hive中limit的实现,详见 https://www.cnblogs.com/barneywill/p/10109217.html下面看spark sql中limit的实现,首先看执行计 ...
hive执行sql提交到yarn上的任务名字是被处理过的,通常只能显示sql的前边一段和最后几个字符,这样就会带来一些问题: 1)相近时间提交了几个相近的sql,相互之间无法区分; 2)一个任务有 ...
kerberos安装详见:https://www.cnblogs.com/barneywill/p/10394164.html 一 为CM创建用户 # kadmin.local -q "addprinc scm/admin" 名字和密码任意,后续配置中会 ...
kudu并没有命令可以直接查看每个table占用的空间,可以从cloudera manager上间接查看 CM is scrapping and aggregating the /metr ...