通過前面的介紹,我們已經能夠看到管理員界面並對Solr形成了一個感性的認識。本篇將在物理上深入了解Solr的安裝目錄結構和Solr示例的主目錄結構。
安裝目錄結構
Solr 6.3.0安裝文件夾里面包含很多內容。這里挑選一些重要的目錄進行說明。目錄結構如下:
- bin:大量的Solr控制台管理工具存在該目錄下。例如前面提到的solr\solr.cmd\post等。
- contrib:該文件包含大量關於Solr的擴展。分別如下:
- analysis-extras:該目錄下面包含一些相互依賴的文本分析組件。
- clustering:該目錄下有一個用於集群檢索結果的引擎。
- dataimporthandler:DIH是Solr中一個重要的組件,該組件可以從數據庫或者其他數據源導入數據到Solr中。
- dataimporthandler-extras:這里面包含了對DIH的擴展。
- extraction:集成Apache Tika,用於從普通格式文件中提取文本。
- langid:該組件使得Solr擁有在建索引之前識別和檢測文檔語言的能力。
- map-reduce:提供一些和Hadoop Map-Reduce協同工作的工具。
- morphlines-cell:為Solr Cell類型的功能提供Kite Morphlines的特性。
- morphlines-core:為Solr提供Kite Morphlines的特性。
- uima:該目錄包含用於集成Apache UIMA的庫。
- velocity:包含一個基於Velocity模板語言簡單檢索UI框架。
- dist:在這里能找到Solr的核心JAR包和擴展JAR包。當我們試圖把Solr嵌入到某個應用程序的時候會用到核心JAR包。
- solrj-lib:包含構建基於Solr的客戶端時會用到的JAR包。
- test-framework:包含測試Solr時候會用到的JAR包。
- docs:該文件夾里面存放的是Solr文檔,離線的靜態HTML文件,還有API的描述。但是個人覺得不是太有用,使用Solr Reference Guide更好。
- example:包含Solr的簡單示例。在其中的exampledocs子文件夾下存放着前面提到過的用於在Windows環境下發送文檔到Solr的工具post.jar程序。
- licenses:各種許可和協議。
- server:在本地把Solr作為服務運行的必要文件都存放在這里。
- contexts:啟動Solr的Jetty網頁的上下文配置。
- etc:Jetty服務器配置文件,在這里可以把默認的8983端口改成其他的。
- lib:Jetty服務器程序對應的可執行JAR包和響應的依賴包。
- logs:默認情況下,日志將被輸出到這個文件夾。
- modules:http\https\server\ssl等配置模塊。
- resources:存放着Log4j的配置文件。這里可以改變輸出日志的級別和位置等設置。
- scripts:Solr運行的必要腳本。
- solr:運行Solr的配置文件都保存在這里。solr.xml文件,提供全方位的配置;zoo.cfg文件,使用SolrCloud的時候有用。子文件夾/configsets存放着Solr的示例配置文件。
- solr-webapp:前面已經提到過的管理界面的站點就存放在這里。
- tmp:存放臨時文件。
主目錄結構
前面提到過,如果啟動的Solr實例不是示例中的一個,那么我們需要創建Core,這樣才能順利的完成索引的創建和查詢過程。每創建一個Core,都會產生一個對應的文件夾,這個文件夾就是這里要提到的主目錄,也是將來使用Solr的過程中會經常操作到的一類目錄。需要說明的是,在“獨立模式”和“雲模式”下,主目錄的結構是有些許差異的。
獨立模式下:
1 <solr-home-directory>/ 2 solr.xml 3 core_name1/ 4 core.properties 5 conf/ 6 solrconfig.xml 7 managed-schema 8 data/ 9 core_name2/ 10 core.properties 11 conf/ 12 solrconfig.xml 13 managed-schema 14 data/
雲模式下:
1 <solr-home-directory>/ 2 solr.xml 3 core_name1/ 4 core.properties 5 data/ 6 core_name2/ 7 core.properties 8 data/
其中,有些文件是非常重要的:
- solr.xml 為Solr服務器實例指定配置選項。具體如何配置,后面會專門講解。
- 在每一個Core里面:
- core.properties為每一個Core指定了諸如名稱,所屬集合,schema的位置等等屬性。
- conf/solrconfig.xml控制高級行為。比如,你可以在該文件中指定數據目錄的替代位置。
- conf/managed-schema存放文檔的描述。第三篇的創建Core小節提到過的數據驅動的Schema,就是在這里得到展現的,根據添加的不同的帶索引文件,managed-schema文件的內容會依據推導出的類型動態的調整。Schema定義一個字段集合的文檔。在這里既定義字段類型,又定義字段本身。字段類型定義非常的強大甚至還包含了Solr是如何處理進入字段的值和查詢值得描述的。
- data/該目錄包含基礎的索引文件。