花费 49 ms
ES基本查询语句教程

前言 es是什么? es是基于Apache Lucene的开源分布式(全文)搜索引擎,,提供简单的RESTful API来隐藏Lucene的复杂性。 es除了全文搜索引擎之外,还可 ...

Wed May 27 16:02:00 CST 2020 2 57673
Hive分区和桶的概念

Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了,虽然也有 Impala 等后起之秀,但目前从功能、稳定性等方面来说,Hive 的地位尚不可撼动。 其实这篇博文主要是想聊聊 ...

Wed Feb 22 23:49:00 CST 2017 0 19092
干货 | Elasticsearch多表关联设计指南

0、题记Elasticsearch多表关联问题是讨论最多的问题之一,如:博客和评论的关系,用户和爱好的关系。多表关联通常指:1对多,或者多对多。本文以星球问题会出发点,引申出ES多表关联认知,分析了4 ...

Sun Apr 26 03:43:00 CST 2020 0 6434
Hive 查看日志

日志记录了程序运行的过程,是一种查找问题的利器。Hive中的日志分为两种1. 系统日志,记录了hive的运行情况,错误状况。2. Job 日志,记录了Hive 中job的执行的历史过程。系统日志存储在 ...

Wed Feb 15 22:32:00 CST 2017 0 11531
ES分布式文档数据库讲解

简介ES是一个基于RESTful web接口并且构建在Apache Lucene之上的开源分布式搜索引擎。 同时ES还是一个分布式文档数据库,其中每个字段均可被索引,而且每个字段的数据均可被搜索,能 ...

Mon Jan 13 00:01:00 CST 2020 0 1582
Hive 体系结构

1、Hive架构与基本组成 下面是Hive的架构图。 图1.1 Hive体系结构 Hive的体系结构可以分为以下几部分: (1)用 ...

Wed Feb 15 22:43:00 CST 2017 0 2782
hive优化之------控制hive任务中的map数和reduce数

、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文 ...

Thu Feb 16 08:32:00 CST 2017 0 2545
Hive文件的存储格式

hive文件存储格式包括以下几类: TEXTFILE SEQUENCEFILE RCFILE 自定义格式 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文 ...

Tue Feb 21 05:04:00 CST 2017 0 1819
Hive插入数据的几种常用方法

Hive的几种常见的数据导入方式这里介绍四种:(1)、从本地文件系统中导入数据到Hive表;(2)、从HDFS上导入数据到Hive表;(3)、从别的表中查询出相应的数据并导入到Hive表中;(4)、在 ...

Tue Feb 14 22:34:00 CST 2017 0 1650
Hive组件以及执行过程

对Hive的基本组成进行了总结: 1、组件: 元存储(Metastore )-存储“系统目录以及关于表、列、分区等的元数据”的组件。驱动(Driver )- 控制 HiveQL 生命周期的 ...

Wed Feb 15 22:29:00 CST 2017 0 1616

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM