Elasticsearch導出數據存入本地文件

本文轉載自查看原文 2021-03-26 11:08 292 Elasticsearch

直接上腳本

# -*- coding: utf-8 -*-

from elasticsearch import Elasticsearch


# 日志的配置環境
import platform
import logging.handlers
sys_platform = platform.system()
if sys_platform == "Windows":
    LOG_FILE_check = './app_cic.txt'
else:
    LOG_FILE_check = '/cic1.log'
handler = logging.handlers.RotatingFileHandler(LOG_FILE_check, maxBytes=1200 * 1024 * 1024,backupCount=10)  # 實例化handler  200M 最多十個文件
fmt = '\n' + '%(message)s'
formatter = logging.Formatter(fmt)  # 實例化formatter
handler.setFormatter(formatter)  # 為handler添加formatter
logger = logging.getLogger('check')  # 獲取名為tst的logger
logger.addHandler(handler)  # 為logger添加handler
logger.setLevel(logging.DEBUG)


# es = Elasticsearch()
es = Elasticsearch(["20.0.0.11:9200"], sniff_on_start=True, sniff_on_connection_fail=True,sniff_timeout=60)

import time

query_json = {
    "query":{
        "terms":{
            "site":[
                "百度搜索"
            ]
        }

    }
}



page_num = 1000  # 每次獲取數據
query = es.search(index='guoyan_index_v1', body=query_json, scroll='5m', size=page_num)
results = query['hits']['hits']  # es查詢出的結果第一頁
total = query['hits']['total']  # es查詢出的結果總量
scroll_id = query['_scroll_id']  # 游標用於輸出es查詢出的所有結果
every_num = int(total/page_num)  #
# print(results)
print("total",total)
print("scroll_id",scroll_id)
print("every_num",every_num)

alist = []
end_data_list = []
print("----------",int(total/page_num)+1)
for i in range(0, every_num):
# for i in range(100, 1000):
    print("正在讀取的位置是：",i)
    results_list = es.scroll(scroll_id=scroll_id, scroll='5m')['hits']['hits']
    for key in results_list:
        try:
            source = key['_source']["source"]
            other6 = key['_source']["other6"]
            result_str = other6 + " " + source
            end_data_list.append(result_str)
        except:
            pass
end_data_list = list(set(end_data_list))
print("去重以后的數據是條數是：",len(end_data_list))
for end_data in end_data_list:
    logger.info(end_data)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Elasticsearch：如何把Elasticsearch中的數據導出為CSV格式的文件 kafka消費數據存入elasticsearch代碼示例 elasticsearch 數據導出導入 Java數據存入文件和讀取文件 Elasticsearch加載本地已存在的數據data文件 hive 導出數據到本地 hive導出數據到本地文件報錯解決方法 JSON文件存入MySQL數據庫 elasticsearch-dump導入導出elasticsearch數據 Springboot 上傳CSV文件並將數據存入數據庫