hive2.3.4 presto0.215 使用hive2.3.4的beeline连接presto报错 增加--verbose查看详细报错 这里是connect过程报错,connect参数为 Usage: connect <url> ...
spark查orc格式的数据有时会报这个错 Caused by: java.lang.NullPointerException at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat BISplitStrategy.getSplits OrcInputFormat.java: at org.apache.hadoop.hive.ql.io.orc.Or ...
2018-12-19 11:36 0 1464 推荐指数:
hive2.3.4 presto0.215 使用hive2.3.4的beeline连接presto报错 增加--verbose查看详细报错 这里是connect过程报错,connect参数为 Usage: connect <url> ...
spark 2.1.1 spark里执行sql报错 insert overwrite table test_parquet_table select * from dummy 报错如下: org.apache.spark.SparkException: Task ...
问题重现 写文件之后发现文件是压缩过的 write时首先会获取hadoopConf,然后从中获取是否压缩以及压缩格式 org.apache.spark ...
最近用yarn cluster方式提交spark任务时,有时会报错,报错几率是40%,报错如下: 18/03/15 21:50:36 116 ERROR ApplicationMaster91: User class threw exception ...
spark 2.1.1 一 问题重现 问题代码示例 当如下3行代码放到main外时 val sparkConf = new SparkConf().setAppName(getName) val sc = new SparkContext ...
spark 2.1.1 spark应用中有一些task非常慢,持续10个小时,有一个task日志如下: 2019-01-24 21:38:56,024 [dispatcher-event-loop-22] INFO ...
最近提交一个spark应用之后发现执行非常慢,点开spark web ui之后发现卡在一个job的一个stage上,这个stage有100000个task,但是绝大部分task都分配到两个executor上,其他executor非常空闲,what happened? 查看spark task分配 ...
最近把一些sql执行从hive改到spark,发现执行更慢,sql主要是一些insert overwrite操作,从执行计划看到,用到InsertIntoHiveTable spark-sql> explain insert overwrite table test2 select ...