如何高效尋找素數

本文轉載自查看原文 2020-02-17 10:04 870 算法思維系列/ 高頻面試系列

素數的定義看起來很簡單，如果一個數如果只能被 1 和它本身整除，那么這個數就是素數。

不要覺得素數的定義簡單，恐怕沒多少人真的能把素數相關的算法寫得高效。比如讓你寫這樣一個函數：

// 返回區間 [2, n) 中有幾個素數 
int countPrimes(int n)

// 比如 countPrimes(10) 返回 4
// 因為 2,3,5,7 是素數

你會如何寫這個函數？我想大家應該會這樣寫：

int countPrimes(int n) {
    int count = 0;
    for (int i = 2; i < n; i++)
        if (isPrim(i)) count++;
    return count;
}

// 判斷整數 n 是否是素數
boolean isPrime(int n) {
    for (int i = 2; i < n; i++)
        if (n % i == 0)
            // 有其他整除因子
            return false;
    return true;
}

這樣寫的話時間復雜度 O(n^2)，問題很大。首先你用 isPrime 函數來輔助的思路就不夠高效；而且就算你要用 isPrime 函數，這樣寫算法也是存在計算冗余的。

先來簡單說下如果你要判斷一個數是不是素數，應該如何寫算法。只需稍微修改一下上面的 isPrim 代碼中的 for 循環條件：

boolean isPrime(int n) {
    for (int i = 2; i * i <= n; i++)
        ...
}

換句話說，i 不需要遍歷到 n，而只需要到 sqrt(n) 即可。為什么呢，我們舉個例子，假設 n = 12。

12 = 2 × 6
12 = 3 × 4
12 = sqrt(12) × sqrt(12)
12 = 4 × 3
12 = 6 × 2

可以看到，后兩個乘積就是前面兩個反過來，反轉臨界點就在 sqrt(n)。

換句話說，如果在 [2,sqrt(n)] 這個區間之內沒有發現可整除因子，就可以直接斷定 n 是素數了，因為在區間 [sqrt(n),n] 也一定不會發現可整除因子。

現在，isPrime 函數的時間復雜度降為 O(sqrt(N))，但是我們實現 countPrimes 函數其實並不需要這個函數，以上只是希望讀者明白 sqrt(n) 的含義，因為等會還會用到。

高效實現 `countPrimes`

高效解決這個問題的核心思路是和上面的常規思路反着來：

首先從 2 開始，我們知道 2 是一個素數，那么 2 × 2 = 4, 3 × 2 = 6, 4 × 2 = 8... 都不可能是素數了。

然后我們發現 3 也是素數，那么 3 × 2 = 6, 3 × 3 = 9, 3 × 4 = 12... 也都不可能是素數了。

看到這里，你是否有點明白這個排除法的邏輯了呢？先看我們的第一版代碼：

int countPrimes(int n) {
    boolean[] isPrim = new boolean[n];
    // 將數組都初始化為 true
    Arrays.fill(isPrim, true);

    for (int i = 2; i < n; i++) 
        if (isPrim[i]) 
            // i 的倍數不可能是素數了
            for (int j = 2 * i; j < n; j += i) 
                    isPrim[j] = false;
    
    int count = 0;
    for (int i = 2; i < n; i++)
        if (isPrim[i]) count++;
    
    return count;
}

如果上面這段代碼你能夠理解，那么你已經掌握了整體思路，但是還有兩個細微的地方可以優化。

首先，回想剛才判斷一個數是否是素數的 isPrime 函數，由於因子的對稱性，其中的 for 循環只需要遍歷 [2,sqrt(n)] 就夠了。這里也是類似的，我們外層的 for 循環也只需要遍歷到 sqrt(n)：

for (int i = 2; i * i < n; i++) 
    if (isPrim[i]) 
        ...

除此之外，很難注意到內層的 for 循環也可以優化。我們之前的做法是：

for (int j = 2 * i; j < n; j += i) 
    isPrim[j] = false;

這樣可以把 i 的整數倍都標記為 false，但是仍然存在計算冗余。

比如 n = 25，i = 4 時算法會標記 4 × 2 = 8，4 × 3 = 12 等等數字，但是這兩個數字已經被 i = 2 和 i = 3 的 2 × 4 和 3 × 4 標記了。

我們可以稍微優化一下，讓 j 從 i 的平方開始遍歷，而不是從 2 * i 開始：

for (int j = i * i; j < n; j += i) 
    isPrim[j] = false;

這樣，素數計數的算法就高效實現了，其實這個算法有一個名字，叫做 Sieve of Eratosthenes。看下完整的最終代碼：

int countPrimes(int n) {
    boolean[] isPrim = new boolean[n];
    Arrays.fill(isPrim, true);
    for (int i = 2; i * i < n; i++) 
        if (isPrim[i]) 
            for (int j = i * i; j < n; j += i) 
                isPrim[j] = false;
    
    int count = 0;
    for (int i = 2; i < n; i++)
        if (isPrim[i]) count++;
    
    return count;
}

該算法的時間復雜度比較難算，顯然時間跟這兩個嵌套的 for 循環有關，其操作數應該是：

n/2 + n/3 + n/5 + n/7 + ...
= n × (1/2 + 1/3 + 1/5 + 1/7...)

括號中是素數的倒數。其最終結果是 O(N * loglogN)，有興趣的讀者可以查一下該算法的時間復雜度證明。

以上就是素數算法相關的全部內容。怎么樣，是不是看似簡單的問題卻有不少細節可以打磨呀？

我最近精心制作了一份電子書《labuladong的算法小抄》，分為【動態規划】【數據結構】【算法思維】【高頻面試】四個章節，共 60 多篇原創文章，絕對精品！限時開放下載，在我的公眾號 labuladong 后台回復關鍵詞【pdf】即可免費下載！

歡迎關注我的公眾號 labuladong，技術公眾號的清流，堅持原創，致力於把問題講清楚！

labuladong

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C++之尋找素數（素數篩） HDU 1431 素數回文（高效判斷素數法）素數判斷算法(高效率）（轉）回文素數素數篩法素數對猜想孿生素數素數篩 C++尋找鞍點尋找“最好”（8）——牛頓法