RiSearch PHP
RiSearch PHP是一個高效,功能強大的搜索引擎,特別適用於中小型網站。RiSearch PHP非常快,它能夠在不到1秒鍾內搜索5000-10000個頁面。RiSearch是一個索引搜索引擎,這就意味着它先將你的網站做索引並建立一個數據庫來存儲你網站所有頁面的關鍵詞以便快速搜索。Risearch是全文搜索引擎腳本,它把所有的關鍵詞都編成一個文檔索引除了配置文件里面的定義排除的關鍵詞。 RiSearch使用經典的反向索引算法(與大型的搜索引擎相同),這就是為什么它會比其它搜索引擎快的原因。
PhpDig
PhpDig是一個采用PHP開發的Web爬蟲和搜索引擎。通過對動態和靜態頁面進行索引建立一個詞匯表。當搜索查詢時,它將按一定的排序規則顯示包含關鍵字的搜索結果頁面。PhpDig包含一個模板系統並能夠索引PDF,Word,Excel,和PowerPoint文檔。PHPdig適用於專業化更強、層次更深的個性化搜索引擎,利用它打造針對某一領域的垂直搜索引擎是最好的選擇。
OpenWebSpider
OpenWebSpider是一個開源多線程Web Spider(robot:機器人,crawler:爬蟲)和包含許多有趣功能的搜索引擎。
Sphider
Sphider是一個輕量級,采用PHP開發的web spider和搜索引擎,使用mysql來存儲數據。可以利用它來為自己的網站添加搜索功能。Sphider非常小,易於安裝和修改,已經有數千網站在使用它。
Snoopy
Snoopy是一個強大的網站內容采集器。提供獲取網頁內容,提交表單等功能。
Sphinx
Sphinx是一個基於SQL的全文檢索引擎,可以結合MySQL,PostgreSQL做全文搜索,它可以提供比數據庫本身更專業的搜索功能,使得應用程序更容易實現專業化的全文檢索。Sphinx特別為一些腳本語言設計搜索API接口,如PHP,Python,Perl,Ruby等,同時為MySQL也設計了一個存儲引擎插件。
Sphinx的特性:
- 高速索引 (在新款CPU上,近10 MB/秒);
- 高速搜索 (2-4G的文本量中平均查詢速度不到0.1秒);
- 高可用性 (單CPU上最大可支持100 GB的文本,100M文檔);
- 提供良好的相關性排名
- 支持分布式搜索;
- 提供文檔摘要生成;
- 提供從MySQL內部的插件式存儲引擎上搜索
- 支持布爾,短語, 和近義詞查詢;
- 支持每個文檔多個全文檢索域(默認最大32個);
- 支持每個文檔多屬性;
- 支持斷詞;
- 支持單字節編碼與UTF-8編碼;
Yioop!
Yioop! 是一個 PHP 的搜索引擎,可用於 Web 的一般用途搜索,或者可提供URL搜索以及各種文檔的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps.