spark 2.4.3 spark读取hive表,步骤: 1)hive-site.xml hive-site.xml放到$SPARK_HOME/conf下 2)enableHiveSuppor ...
jenkins安装启动后,使用systemctl来进行进程监控 systemctl enable jenkins 但是还是经常发生jenkins进程挂了,不会自动重启,通过systemctl查看状态为: systemctl status jenkins jenkins.service LSB: Jenkins Automation Server Loaded: loaded etc rc.d in ...
2019-10-31 15:11 0 386 推荐指数:
spark 2.4.3 spark读取hive表,步骤: 1)hive-site.xml hive-site.xml放到$SPARK_HOME/conf下 2)enableHiveSuppor ...
问题:spark中如果有两个DataFrame(或者DataSet),DataFrameA依赖DataFrameB,并且两个DataFrame都进行了cache,将DataFrameB unpersi ...
kudu的副本数量是在表上设置,可以通过命令查看 其中RF即replication factor; 副本数量只能在创建表时指定,创建后不能修改,并且副本数量必须为奇数 By ...
docker container启动失败,报错:Exited (137) *** ago,比如 Exited (137) 16 seconds ago 这时通过docker logs查不 ...
spark任务添加依赖的方式: 1 如果是local方式运行,可以通过--jars来添加依赖; 2 如果是yarn方式运行,可以通过spark.yarn.jars来添加依赖; 这两种方式在ooz ...
官方:http://atlas.apache.org/ 一 简介 元数据管理:数据分类、数据血缘、数据治理 Atlas is a scalable and extensible se ...
spring boot 启动报错: 出现这个问题通常的原因工程中使用了多个开源jar,每个开源jar都有自己的日志实现方式,比如slf+log4j,slf+logback等,其中slf ...
定期清理cloudera manager server的磁盘空间 1 停止Service Monitor和Host Monitor 2 删除日志 # /bin/rm /var/lib/ ...