Hive調用python腳本


 

 

 

python腳本如下:

#!/bin/env python
# -*- coding=utf-8 -*-
import sys
import datetime

d_user = {
   "user1": "true",
   "user2": "true"
}

for line in sys.stdin:
   line = line.strip()
   userid = line.split('\t')[0]
   if d_user.get(userid, "false") == "true":
       print "\t".join([userid, "1"])

hive執行添加文件命令如下

$ hive
hive> add file /home/user/test.py

hql命令如下

select userid, sum(1)
from(
select
TRANSFORM (user_pin)
USING '/home/user/test.py'
AS userid, cnt
from hive_table
where dt = "2021-03-01"
)a
group by userid

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM