greenplum 億級數據導入測試


1、啟動gpfdist服務

后台啟動:nohup  ./gpfdist -d /data1/gpfdist/ -p 5439 -t 600 -l /data1/gpfdist/gpfdist.log &

2、創建外表  

CREATE EXTERNAL TABLE "external_位置" (
"id" varchar(64),
"type" varchar(64),
"start" varchar(64),
"end" varchar(64),
"縱坐標" varchar(64)
) LOCATION ('gpfdist://10.20.20.85:5439/relation_位置.csv') format 'csv' (DELIMITER ',');

3、插入數據至目標表

insert into rel_就讀於(_id,縱坐標,_from_entity_id,_to_entity_id,_create_user,_create_time) select _id,縱坐標,"start","end",'001' as _create_user,'2019-01-04 14:32:01.212' as _create_time  from external_就讀於;

注:會將整個csv文件加載至緩存中,如果文件過大,即時清理服務器緩存 ,或將大文件拆分至多個小文件串行執行。

4、性能分析

a、 查看正在執行的sql:select datname,usename,procpid,sess_id,current_query from pg_stat_activity  where current_query LIKE 'insert%';

b、關閉正在執行的sql進程:select pg_cancel_backend(24562) ;

c、查看服務器內存情況:free -g

d、清理服務器緩存  sudo echo 3 > /proc/sys/vm/drop_caches

5、性能指標

文件大小 數據條數  用時

32G 250000001 17min

76G 650000001  80min


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM