mysql真的不能做搜索引擎嗎?


大家都對電商的商品查詢並不陌生,比如我們想根據商品名稱查詢所有商品信息。

 

有些技術的童鞋第一念頭是搜索引擎;有些技術的童鞋第一念頭是模糊查詢,如like?(如果商品信息存放到mysql里,我們一般使用like查詢)

我們都知道,不同的場景決定了不同技術的使用場景也不同,那我們該如何選擇呢?

那我們先做個實驗吧(實驗對象是mysql 8.0 community 版,windows10)

1.安裝mysql 8.0 community 版本 https://dev.mysql.com/downloads/windows/installer/8.0.html

  我使用的web版本 step by step

2.安裝客戶端SQLyog MySQ https://www.cr173.com/soft/22147.html

3 連接mysql  報錯:

SQLyog連接報錯 Error No.2058 Plugin caching_sha2_password could not be loaded

解決方法:windows 下cmd 登錄 mysql -u root -p 登錄你的 mysql 數據庫,然后 執行這條SQL:

 ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'password';

#password 是你自己設置的root密碼
4.插入數據

依賴包:

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.13</version>
        </dependency>    

程序

復制代碼
    public void mysqlOneByOneInsert() {
        // JDBC 驅動名及數據庫 URL
       String JDBC_DRIVER = "com.mysql.cj.jdbc.Driver";  
       String DB_URL = "jdbc:mysql://localhost:3306/www?useUnicode=true&characterEncoding=utf8&serverTimezone=GMT%2B8&useSSL=false";//鏈接的mysql
     
        // 數據庫的用戶名與密碼,需要根據自己的設置
        String USER = "root";
        String PASS = "wangwei456";
        try {
            long start=System.currentTimeMillis();
            Class.forName(JDBC_DRIVER);
            Connection connection = DriverManager.getConnection(DB_URL, USER, PASS);
            PreparedStatement   stmt = connection.prepareStatement("INSERT INTO PERSON(ID,NAME,AGE,ADDRESS,SALARY) values(?,?,?,?,?);");
            
            for(int i=0;i<1000000;i++) {
                stmt.setInt(1, i+1);
                stmt.setString(2, "mkyong"+i);
                stmt.setInt(3, i%100);
                stmt.setString(4, "address"+i);
                stmt.setFloat(5, 25000.00f);
                stmt.executeUpdate();
            }
             stmt.close();
             connection.close();
             System.out.println("耗時:"+(System.currentTimeMillis()-start)+" 毫秒");

        } catch (ClassNotFoundException e) {
            e.printStackTrace();

        } catch (SQLException e) {
            e.printStackTrace();
        }
        
    }
復制代碼

中間報錯:

java.sql.SQLException: The server time zone value '???ú±ê×??±??' is unrecognized or represents more 

解決方法:

在jdbc連接的url后面加上serverTimezone=GMT即可解決問題,如果需要使用gmt+8時區,需要寫成GMT%2B8

感受:mysql輸入插入速度(單條)簡直是龜速呀 耗時:4390167 毫秒=4390秒=73分鍾

1.精確查詢 無索引

SELECT * FROM PERSON WHERE NAME='mkyong99999'

耗時:0.747秒 

2.模糊查詢 無索引

SELECT * FROM PERSON WHERE NAME LIKE 'mkyong99999%'

查詢耗時:0.732秒

3.精確查詢 有索引

SELECT * FROM PERSON WHERE NAME='mkyong99999'

耗時:0.01秒

4.模糊查詢 有索引

FLUSH TABLES;
SELECT * FROM PERSON WHERE NAME LIKE 'mkyong99999%'

耗時:0.02秒

是不是很驚詫?看看執行計划

走的是索引。和很多人的常識是相反的。

5.無索引

SELECT * FROM PERSON WHERE ADDRESS='杭州大街100號99999'

耗時 0.911秒

6.無索引

FLUSH TABLES;
 SELECT * FROM PERSON WHERE ADDRESS LIKE '杭州大街100號99999'

耗時0.775秒

7.有索引

FLUSH TABLES;
SELECT * FROM PERSON WHERE ADDRESS='杭州大街100號99999'

 SELECT * FROM PERSON WHERE ADDRESS LIKE '杭州大街100號99999'

都是0.01秒

8.針對有些字段比較長,使用模糊查詢會慢的問題,mysql 從5.6后提供了全文檢索功能,以5.8為例 <https://dev.mysql.com/doc/refman/8.0/en/fulltext-search.html>

ngram Full-Text Parser提供了分詞的功能

創建全文索引

CREATE FULLTEXT INDEX add_index ON PERSON (ADDRESS) WITH PARSER ngram;

查詢

SELECT * FROM PERSON WHERE MATCH (ADDRESS) AGAINST('杭州大街100號99999');

耗時:23秒

 

 

小結:

  1.like查詢不一定不走索引,以實驗驗證為准

  2.商品量或者數據量比較小的情況下(通常100w以下),like查詢並不慢。

  3.搜索引擎在千萬,億級別或者以上起到的作用才會比較明顯,下篇會繼續分析。

  4.mysql提供的全文索引的使用還是在掌握的情況下再使用,否則反而會影響系統性能

參考文獻:

【1】https://blog.csdn.net/jared456/article/details/80380853

 【2】https://blog.csdn.net/weixin_37577564/article/details/80329775


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM