elasticsearch入门篇：数据存储方式研究：elasticsearch数据存储

本文转载自查看原文 2019-03-20 16:56 2563 数据存储

之前的两篇文章回顾：

第一篇介绍了数据库索引在模糊搜素方面的局限性，介绍了Lucene是如何通过倒排索引解决这个问题的。简单的介绍了一下倒排索引的存储原理。

第二篇通过一个单元测试简单的演示了一下插入和搜索的过程，最后给大家看了一下程序执行搜索和插入操作的时候，Lucene的工作目录里面生成的几个文件和文件的作用概要。

其实打开elasticsearch的工作目录可以发现elasticsearch里面有和Lucene的工作目录下相同的文件。接下来准备结合Lucene和elasticsearch讲讲这些文件。略过elasticsearch环境的搭建过程，直接进入工作目录查看，对比如下（第一张是我安装elasticsearch时候的安装目录，第二张图片是我在跑上一篇单元测试用例时候指定的临时文件夹，Lucene运行时候的临时文件放在了这里）：

可以看到：文件是一样的。

然后我们来看外层的目录结构，来体验elasticsearch在Lucene基础上做了什么，以及这么做的目的。

（1）首先说segements：因此可以看见每个

（2）然后说一下nodes：

可以看到默认有5个节点在elasticsearch启动之后工作。点开任一node可以看到每个node都有一个index和一个translog：

Elasticsearch的index类似于关系型数据库的库的概念，在保存数据前，要先创建索引。在集群中index和node的关系如下图：

（3）再说index和translog：

然后说translog：上一篇文章说到Lucene里面segments文件是数据存储最重要的文件。数据是由一个个segment组成的，数据先写入内存，经过设置的时间间隔将该时间段写入内存的数据全部刷到一个segment中，由于一段时间生成一个segment，避免了短时间内写入一个较大的磁盘文件，segment多了之后会进行merge成更大的segment。因此最初的数据写入的数据是在内存中完成，所以写入效率非常高。但是写入过程中如果掉电导致内存里面的数据没及时落盘，就会出现丢失数据的问题，所以Elasticsearch基于此现象实现了translog，只有在segment数据落盘后，Elasticsearch才会删除对应的translog。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Elasticsearch数据存储方式 Elasticsearch中数据是如何存储的 Elasticsearch中数据是如何存储的 Elasticsearch中数据是如何存储的 elasticsearch入门篇 Elasticsearch入门篇【Android开发日记】之入门篇（七）——Android数据存储（上）【Android开发日记】之入门篇（八）——Android数据存储（下）关于ElasticSearch与MySql的数据存储测试！ es学习（二）：elasticsearch 数据存储