花費 22 ms
hive之建立分區表和分區

1. 建立分區表 create table 單分區表:其中分區字段是partdate,注意分區字段不能和表字段一樣,否則會報重復的錯 多分區表:id在前,address在后,注意多個 ...

Mon Nov 18 05:36:00 CST 2019 0 4115
linux使用shell腳本定時執行python代碼

在linux上設置定時任務或者使用shell腳本都可以執行python代碼;其中定時任務的設置在命令 crontab -e 中可以查看和設置。 假設目前有一個python腳本: ...

Mon Aug 31 06:05:00 CST 2020 0 4980
hive中實現group_concat

mysql中的group_concat分組連接功能相當強大,可以先分組再連接成字符串,還可以進行排序連接。但是hive中並沒有這個函數,那么hive中怎么實現這個功能呢? 這里要用到:concat_ ...

Sun Aug 30 07:16:00 CST 2020 0 4226
hive的lateral view explode 功能

最近遇到一個神奇的hive功能:lateral view explode,感覺與Mysql中的group concat相反,將原本在一起的數據拆分成多行形成虛擬表,再與原表進行笛卡爾積。 一般模式: ...

Sun Aug 30 08:17:00 CST 2020 0 2866
從hdfs導入數據到hive表

在文件已經導入(存入)hdfs之后,需要建表進行映射才可以show tables。 現在假設文件已導入該hdfs目錄: /apps/hive/warehouse/db_name.db/tb_name ...

Mon Dec 07 06:05:00 CST 2020 0 2205
hive的日期和時間

類似於mysql,hive中也有處理日期和時間的方法。 1. 日期轉時間戳:unix_timestamp 2. 時間戳轉日期:from_unixtime 3. to_ ...

Mon Apr 06 23:13:00 CST 2020 0 3550
pyspark將DataFrame轉成table以及操作sql語句

pyspark可以直接將DataFrame格式數據轉成table,也可在程序中執行sql代碼。 1. 首先導入庫和環境,os.environ在系統中有多個python版本時需要設置 ...

Sun Mar 15 04:33:00 CST 2020 0 3104

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM