spark的默认url路径问题

本文转载自查看原文 2021-01-11 17:33 297 大数据

spark的默认url路径问题：

spark默认从hdfs的当前用户目录下读取数据，即./目录，可以用/来改为hdfs的根目录，不用显式的写成

'hdfs:///192.168.16.128:9000/xx.csv'

的形式，但前提是在spark-env.sh中配置了hadoop配置文件夹的位置：

export HADOOP_CONF_DIR=/usr/local/hadoop/hadoop-2.10.1/etc/hadoop

如果没有配置上述环境，会从当前python文件所在的相对目录查找资源。

想使用本地资源可以如下使用：

'file:/usr/local/data/xxx.csv'

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 NetCore在IIS中URL默认路径（启动页面、默认文档）的问题 Jquery - ajax url路径问题 001.CI4框架CodeIgniter的默认访问路径url 【webpack】---url-loader 图片路径问题 java url相对路径和绝对路径的问题关于Yii2.0的url路径优化问题(配置虚拟路径) 解决Python默认的模块搜索路径问题 CSS问题：background-image:url(路径问题) jquery 获取URL相对/绝对路径问题 websock URL相对路径设置问题