[数据分析]利用pandasticsearch批量读取ES

本文转载自查看原文 2019-11-21 19:11 283

1.git地址

https://github.com/onesuper/pandasticsearch

2.建立连接

from pandasticsearch import DataFrame


username = b'xxxx'
password = b'xxxx'

df = DataFrame.from_es(url='IP:9200',
                       index='x'x'x'x',
                       username=username,
                       password=password,
                       doc_type='x'x'x'x',
                       compat=5
                      )

[注] 实测python3 会遇到编码问题

TypeError: a bytes-like object is required, not 'str'

3.修改源码

将~/anaconda3/lib/python3.7/site-packages/pandasticsearch/client.py中

    59             if username is not None and password is not None:
    60                 base64creds = base64.b64encode('%s:%s' % (username,password))
    61                 req.add_header("Authorization", "Basic %s" % base64creds)

修改为：

    if username is not None and password is not None:
        base64creds = bytes.decode(base64.b64encode(b'%s:%s' % (username,password)))
        req.add_header("Authorization", "Basic %s" % base64creds)

4.批量查询数据

limit()函数查询前20万条数据，to_pandas()转成pandas的dataframe

pd_df = df.limit(200000).to_pandas()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 利用Python进行简单数据分析--医院销售数据分析案例数据分析python技能之es数据提取数据分析 NLP-数据读取与数据分析 1，地图数据分析-SHP数据读取为什么要数据分析？数据分析数据分析【目录】利用Python进行数据分析(第2版) 利用Python数据分析-Numpy和Pands篇