花费 36 ms
spark 稠密向量和稀疏向量

Spark mlib的本地向量有两种: DenseVctor :稠密向量 其创建方式 Vector.dense(数据) SparseVector :稀疏向量 其创建方式有两种: ...

Fri Nov 10 23:10:00 CST 2017 0 3946
spark rdd 宽窄依赖理解

== 转载 == http://blog.csdn.net/houmou/article/details/52531205 Spark中RDD的高效与DAG图有着莫大的关系,在DAG调 ...

Sat Aug 05 17:07:00 CST 2017 0 3921
SPARK调优之并行度设置

操作场景 并行度控制任务的数量,影响shuffle操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优 查看CPU使用情况和内存占用情况,当任 ...

Sun Aug 11 22:51:00 CST 2019 0 1099
SparkStreaming对接rabbitMQ

/** * SparkStreaming对接rabbitmq java代码 */public class SparkConsumerRabbit { public static void main(S ...

Thu Aug 01 04:10:00 CST 2019 0 1089
spark 修改默认log4j.properties 配置

说明:用户 xxx.jar 中的resources/log4j.properties 会覆盖集群配置,如果用户无resources/log4j.properties 那么加载 --fil ...

Sat Aug 31 06:23:00 CST 2019 0 1001
通过SPARK将hadoop的文本数据导入hive的表

要完成用SPARK将hadoop的文件数据转换为hive的表。首先,要安装好hadoop,hive,spark;其次,文本数据是结构化的文本,可以直接映射到表的如csv格式的。 我们的文本数 ...

Tue Oct 25 06:48:00 CST 2016 0 3999
org.apache.spark.logging类报错

一,1 在使用spark读取kafka数据时,当spark升级到2.0之后,出现如上问题:之前遇到了,当时在工程里面添加了org.apache.spark.Logging类,能够运行。 但是在后 ...

Mon Aug 12 23:17:00 CST 2019 0 1012

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM