花费 82 ms
hive之建立分区表和分区

1. 建立分区表 create table 单分区表:其中分区字段是partdate,注意分区字段不能和表字段一样,否则会报重复的错 多分区表:id在前,address在后,注意多个 ...

Mon Nov 18 05:36:00 CST 2019 0 4115
linux使用shell脚本定时执行python代码

在linux上设置定时任务或者使用shell脚本都可以执行python代码;其中定时任务的设置在命令 crontab -e 中可以查看和设置。 假设目前有一个python脚本: ...

Mon Aug 31 06:05:00 CST 2020 0 4980
hive中实现group_concat

mysql中的group_concat分组连接功能相当强大,可以先分组再连接成字符串,还可以进行排序连接。但是hive中并没有这个函数,那么hive中怎么实现这个功能呢? 这里要用到:concat_ ...

Sun Aug 30 07:16:00 CST 2020 0 4226
hive的lateral view explode 功能

最近遇到一个神奇的hive功能:lateral view explode,感觉与Mysql中的group concat相反,将原本在一起的数据拆分成多行形成虚拟表,再与原表进行笛卡尔积。 一般模式: ...

Sun Aug 30 08:17:00 CST 2020 0 2866
从hdfs导入数据到hive表

在文件已经导入(存入)hdfs之后,需要建表进行映射才可以show tables。 现在假设文件已导入该hdfs目录: /apps/hive/warehouse/db_name.db/tb_name ...

Mon Dec 07 06:05:00 CST 2020 0 2205
hive的日期和时间

类似于mysql,hive中也有处理日期和时间的方法。 1. 日期转时间戳:unix_timestamp 2. 时间戳转日期:from_unixtime 3. to_ ...

Mon Apr 06 23:13:00 CST 2020 0 3550
pyspark将DataFrame转成table以及操作sql语句

pyspark可以直接将DataFrame格式数据转成table,也可在程序中执行sql代码。 1. 首先导入库和环境,os.environ在系统中有多个python版本时需要设置 ...

Sun Mar 15 04:33:00 CST 2020 0 3104

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM