ElasticStack學習（一）：ElasticStack介紹

本文轉載自查看原文 2019-06-30 20:33 1058 ElasticSearch/ ELK/ Elastic Stack

　　一、Elastic Stack的構成

　　1、ElasticSearch對數據進行搜索、分析和存儲，其是基於JSON的分布式搜索和分析引擎，專門為實現水平可擴展性、高可靠性和管理便捷性而設計的。

它的實現原理主要分為以下幾個步驟：

　　　　1）首先用戶將數據提交到ElasticSearch數據庫中；

　　　　2）再通過分詞控制器將對應的語句分詞；

　　　　3）將分詞結果及其權重一並存入，以備用戶在搜索數據時，根據權重將結果排名和打分，將返回結果呈現給用戶；

　　2、Kibana實現數據可視化，其作用就是在ElasticSearch中進行民航。Kibana能夠以圖表的形式呈現數據，並且具有可擴展的用戶界面，可以全方位的配置和管理ElasticSearch。

　　　　Kibana最早的時候是基於Logstash創建的工具，后被Elastic公司在2013年收購。

　　　　1）Kibana可以提供各種可視化的圖表；

　　　　2）可以通過機器學習的技術，對異常情況進行檢測，用於提前發現可疑問題；

　　3、Beats是一個面向輕量型采集器的平台，這些采集器可以從邊緣機器向Logstash、ElasticSearch發送數據，它是由Go語言進行開發的，運行效率方面比較快。從下圖中可以看出，不同Beats的套件是針對不同的數據源。

　　4、Logstash是動態數據收集管道，擁有可擴展的插件生態系統，支持從不同來源采集數據，轉換數據，並將數據發送到不同的存儲庫中。其能夠與ElasticSearch產生強大的協同作用，后被Elastic公司在2013年收購。

　　　　它具有如下特性：

　　　　1）實時解析和轉換數據；

　　　　2）可擴展，具有200多個插件；

　　　　3）可靠性、安全性。Logstash會通過持久化隊列來保證至少將運行中的事件送達一次，同時將數據進行傳輸加密；

　　　　4）監控；

　　　　對於日志的解決方案一般分為：日志搜索、格式化分析、全文檢索、風險告警；

　　二、ElasticSearch是什么？

　　ElasticSearch是一款非常強大的、基於Lucene的開源搜索及分析引擎，可以幫助你從海量數據中，快速找到相關的數據信息。

　　比如，當你在GitHub上搜索時，ElasticSearch不僅可以幫助你找到相關的代碼庫，還可以幫助你實現代碼級的搜索和高亮顯示；當你在網上購物時，ElasticSearch可以幫助你推薦相關的商品；當你打車時，ElasticSearch可以通過定位附近的乘客和司機，幫助平台優化調度。

　　除了搜索，結合Kibana、Logstash、Beats開源產品，Elastic Stack（簡稱ELK）還被廣泛運用在大數據近實時分析領域，包括：日志分析、指標監控、信息安全等。它可以幫助你探索海量結構化、非結構化數據，按需創建可視化報表，對監控數據設置報警閾值，通過使用機器學習，自動識別異常狀況。

　　ElasticSearch是基於Restful WebApi，使用Java語言開發的搜索引擎庫類，並作為Apache許可條款下的開放源碼發布，是當前流行的企業級搜索引擎。其客戶端在Java、C#、PHP、Python等許多語言中都是可用的。相應下載地址： https://www.elastic.co/guide/en/elasticsearch/client/index.html

　　所以，ElasticSearch具備兩個優勢：

　　1）天生支持分布式，可水平擴展；

　　2）提供了Restful接口，降低全文檢索的學習曲線，因為Restful接口，所以可以被任何編程語言調用；

　　說一下Lucene的優缺點：

　　優點：1）高性能；2）易擴展；

　　缺點：

　　1）只能基於Java語言開發；

　　2）類庫的接口學習曲線陡峭；

　　3）原生並不支持水平擴展；

　　三、為什么要學習ElasticSearch？

　　根據DB Engine的排名顯示，ElasticSearch是最受歡迎的企業級搜索引擎。根據https://db-engines.com/en/ranking網站排名可知，比較靠前的有三家大數據搜索引擎公司，除了ElasticSearch，還有Splunk和Solr。其中Solr也是基於Lucene。

　　1、在當前軟件行業中，搜索是一個軟件系統或平台的基本功能，學習ElasticSearch就可以為相應的軟件打造出良好的搜索體驗。

　　2、其次，ElasticSearch具備非常強的大數據分析能力。雖然Hadoop也可以做大數據分析，但是ElasticSearch的分析能力非常高，具備Hadoop不具備的能力。比如有時候用Hadoop分析一個結果，可能等待的時間比較長。

　　3、ElasticSearch可以很方便的進行使用，可以將其安裝在個人的筆記本電腦，也可以在生產環境中，將其進行水平擴展。

　　4、國內比較大的互聯網公司都在使用，比如小米、滴滴、攜程等公司。另外，在騰訊雲、阿里雲的雲平台上，也都有相應的ElasticSearch雲產品可以使用。

　　5、在當今大數據時代，掌握近實時的搜索和分析能力，才能掌握核心競爭力，洞見未來。（漲工資）

　　四、學習ElasticSearch的入手層面

　　1、開發層面

　　　　1）了解ElasticSearch有基本功能；2）底層分布式工作原理；3）針對數據進行數據建模；

　　2、運維層面

　　　　1）進行集群的容量規划；2）對集群進行滾動升級；3）對性能的優化；4）出現問題后，對問題的診斷與解決；

　　3、方案層面

　　　　1）學習ElasticSearch后，可以針對實際情況，解決搜索的相關問題；2）可以將ELK運用到大數據分析場景中；

　　五、ElasticSearch的主要功能及應用場景

　　1、主要功能：

　　　　1）、海量數據的分布式存儲以及集群管理，達到了服務與數據的高可用以及水平擴展；

　　　　2）、近實時搜索，性能卓越。對結構化、全文、地理位置等類型數據的處理；

　　　　3）、海量數據的近實時分析（聚合功能）

　　2、應用場景：

　　　　1）網站搜索、垂直搜索、代碼搜索；

　　　　2）日志管理與分析、安全指標監控、應用性能監控、Web抓取輿情分析；

　　六、Elastic Stack的生態圈

　　從上圖中可以看到，ElasticSearch做為ELK中的核心部分，它起到了數據存儲的作用。而Kibana在上層可以為使用者提供一個可視化的界面。Logstash和Beats可以將各種各樣的數據進行抓取和收集。

在右側的X-Pack部分，是Elastic公司所提供的幾種收費服務，同時Elastic公司也提供雲的解決方案。

　　七、ElasticSearch與DB的集成

　　針對上圖，可以分為兩種情況：

　　1、將ElasticSearch當成數據庫來存儲數據，好處是架構比較簡單；

　　2、若數據更新比較頻繁，同時需要考慮數據事務性時，應該先將數據存入數據庫，然后建立一個合適的同步機制，將數據同步到ElasticSearch中；

　　八、ELK在數據指標收集，日志分析的架構設計

　　從上圖中可以知道，通過Beats或者程序來進行數據方面的收集，當收集的數據量較大時，需要加入一層（Redis、Kafka、RabbitMQ）進行數據緩沖，然后將數據送入Logstash進行聚合及數據處理，最后通后ElasticSearch進行分詞、創建索引並存儲，通過Kibana或者Grafana這類圖形化工具進行數據的可視化和數據分析。

　　大家可關注我的公眾號

　　知識學習來源：《Elasticsearch核心技術與實戰》

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ElasticStack學習（二）：ElasticStack安裝與運行 ElasticStack的入門學習 ElasticStack學習（七）：ElasticSearch之Mapping初探 ElasticStack學習（三）：ElasticSearch基本概念 ElasticStack學習（五）：了解ElasticSearch索引與分詞 ElasticStack學習（四）：ElasticSearch文檔的CRUD使用 ElasticStack系列之二 & ElasticStack整體架構 ElasticStack分布式引擎技術棧（ELK）介紹 ElasticStack學習（八）：ElasticSearch索引模板與聚合分析初探 ElasticStack學習（十）：深入ElasticSearch搜索之QueryFiltering、多/單字符串的多字段查詢