04 Apache Solr: 目錄結構


     通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入了解Solr的安裝目錄結構和Solr示例的主目錄結構。
 

安裝目錄結構

  Solr 6.3.0安裝文件夾里面包含很多內容。這里挑選一些重要的目錄進行說明。目錄結構如下:

  • bin:大量的Solr控制台管理工具存在該目錄下。例如前面提到的solr\solr.cmd\post等。
    • contrib:該文件包含大量關於Solr的擴展。分別如下:
    • analysis-extras:該目錄下面包含一些相互依賴的文本分析組件。
    • clustering:該目錄下有一個用於集群檢索結果的引擎。
    • dataimporthandler:DIH是Solr中一個重要的組件,該組件可以從數據庫或者其他數據源導入數據到Solr中。
    • dataimporthandler-extras:這里面包含了對DIH的擴展。
    • extraction:集成Apache Tika,用於從普通格式文件中提取文本。
    • langid:該組件使得Solr擁有在建索引之前識別和檢測文檔語言的能力。
    • map-reduce:提供一些和Hadoop Map-Reduce協同工作的工具。
    • morphlines-cell:為Solr Cell類型的功能提供Kite Morphlines的特性。
    • morphlines-core:為Solr提供Kite Morphlines的特性。
    • uima:該目錄包含用於集成Apache UIMA的庫。
    • velocity:包含一個基於Velocity模板語言簡單檢索UI框架。
  • dist:在這里能找到Solr的核心JAR包和擴展JAR包。當我們試圖把Solr嵌入到某個應用程序的時候會用到核心JAR包。
    • solrj-lib:包含構建基於Solr的客戶端時會用到的JAR包。
    • test-framework:包含測試Solr時候會用到的JAR包。
  • docs:該文件夾里面存放的是Solr文檔,離線的靜態HTML文件,還有API的描述。但是個人覺得不是太有用,使用Solr Reference Guide更好。
  • example:包含Solr的簡單示例。在其中的exampledocs子文件夾下存放着前面提到過的用於在Windows環境下發送文檔到Solr的工具post.jar程序。
  • licenses:各種許可和協議。
  • server:在本地把Solr作為服務運行的必要文件都存放在這里。
    • contexts:啟動Solr的Jetty網頁的上下文配置。
    • etc:Jetty服務器配置文件,在這里可以把默認的8983端口改成其他的。
    • lib:Jetty服務器程序對應的可執行JAR包和響應的依賴包。
    • logs:默認情況下,日志將被輸出到這個文件夾。
    • modules:http\https\server\ssl等配置模塊。
    • resources:存放着Log4j的配置文件。這里可以改變輸出日志的級別和位置等設置。
    • scripts:Solr運行的必要腳本。
    • solr:運行Solr的配置文件都保存在這里。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的時候有用。子文件夾/configsets存放着Solr的示例配置文件。
    • solr-webapp:前面已經提到過的管理界面的站點就存放在這里。
    • tmp:存放臨時文件。

主目錄結構

     前面提到過,如果啟動的Solr實例不是示例中的一個,那么我們需要創建Core,這樣才能順利的完成索引的創建和查詢過程。每創建一個Core,都會產生一個對應的文件夾,這個文件夾就是這里要提到的主目錄,也是將來使用Solr的過程中會經常操作到的一類目錄。需要說明的是,在“獨立模式”和“雲模式”下,主目錄的結構是有些許差異的。
     獨立模式下:
 1 <solr-home-directory>/
 2    solr.xml
 3    core_name1/
 4       core.properties
 5       conf/
 6          solrconfig.xml
 7          managed-schema
 8       data/
 9    core_name2/
10       core.properties
11       conf/
12          solrconfig.xml
13          managed-schema
14       data/

  雲模式下:

1 <solr-home-directory>/
2    solr.xml
3    core_name1/
4       core.properties
5       data/
6    core_name2/
7       core.properties
8       data/
其中,有些文件是非常重要的:
  • solr.xml 為Solr服務器實例指定配置選項。具體如何配置,后面會專門講解。
  • 在每一個Core里面:
    • core.properties為每一個Core指定了諸如名稱,所屬集合,schema的位置等等屬性。
    • conf/solrconfig.xml控制高級行為。比如,你可以在該文件中指定數據目錄的替代位置。
    • conf/managed-schema存放文檔的描述。第三篇的創建Core小節提到過的數據驅動的Schema,就是在這里得到展現的,根據添加的不同的帶索引文件,managed-schema文件的內容會依據推導出的類型動態的調整。Schema定義一個字段集合的文檔。在這里既定義字段類型,又定義字段本身。字段類型定義非常的強大甚至還包含了Solr是如何處理進入字段的值和查詢值得描述的。
    • data/該目錄包含基礎的索引文件。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM