花费 15 ms
Hive:添加、删除分区

添加分区: 已经创建好的分区表: 分区字段包含:p_hour,p_city,p_loctype。 根据分区字段p_loctype删除分区: 删除日志: ...

Thu Dec 21 22:53:00 CST 2017 0 61256
JVM GC原理

了解JVM GC原理非常重要,对于系统调优非常有用。如果一个系统频繁发生FULL GC,那么会造成系统响应卡顿,更严重的时候会导致系统崩溃。 JVM的内存空间 JVM的内存空间,从大的层面上来分析 ...

Wed Jun 05 04:19:00 CST 2019 0 8028
Spark2.3(四十三):Spark Broadcast总结

为什么要使用广播(broadcast)变量? Spark中因为算子中的真正逻辑是发送到Executor中去运行的,所以当Executor中需要引用外部变量时,需要使用广播变量。进一步解释: ...

Thu Mar 28 18:00:00 CST 2019 0 6713
Spark:java api读取hdfs目录下多个文件

需求: 由于一个大文件,在spark中加载性能比较差。于是把一个大文件拆分为多个小文件后上传到hdfs,然而在spark2.2下如何加载某个目录下多个文件呢? 测试结果: ...

Fri Oct 19 23:57:00 CST 2018 0 8013
Spark(四十七):Spark UI 数据可视化

导入: 1)Spark Web UI主要依赖于流行的Servlet容器Jetty实现; 2)Spark Web UI(Spark2.3之前)是展示运行状况、资源状态和监控指标的前端,而这些 ...

Sat May 11 07:27:00 CST 2019 5 3828

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM