描述
計算 1 至 n 中數字 X 出現的次數,其中 $n \ge 1,X \in [0,9]$。
解題思路
這是一道比較簡單的題目,舉個例子先:假設 $n=11, X=1$,那么就是求 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 這 11 個數字中 1 出現的次數,很容易能看出來結果為 4,在 1 和 10 中各出現了一次,在 11 中出現了兩次。
最簡單的辦法就是依次遍歷 1 至 n,再分別求每個數字中 X 出現的次數,代碼如下所示:
#include <stdio.h> // 計算數字 X 在 n 中出現的次數。 int countOne(int n, int x) { int cnt = 0; for (;n > 0;n /= 10) { if (n % 10 == x) { cnt++; } } return cnt; } // 計算數字 X 在 1-n 中出現的次數。 int count(int n, int x) { int cnt = 0; for (int i = 1;i <= n;i++) { cnt += countOne(i, x); } return cnt; } int main() { printf("%d\n", count(237, 1)); }
這個方法的缺點是時間復雜度太高,countOne 方法的時間復雜度是 $O({\log _{10}}n)$,count 方法的時間復雜度是 $O(n{\log _{10}}n)$。
一個更好的辦法是利用數學公式直接計算出最終的結果,該方法是依次求出數字 X 在個位、十位、百位等等出現的次數,再相加得到最終結果。這里的 $X \in [1,9]$,因為 $X=0$ 不符合下列規律,需要單獨計算。
首先要知道以下的規律:
- 從 1 至 10,在它們的個位數中,任意的 X 都出現了 1 次。
- 從 1 至 100,在它們的十位數中,任意的 X 都出現了 10 次。
- 從 1 至 1000,在它們的千位數中,任意的 X 都出現了 100 次。
依此類推,從 1 至 $10^i$,在它們的左數第二位(右數第 $i$ 位)中,任意的 X 都出現了 $10^{i-1}$ 次。
這個規律很容易驗證,這里不再多做說明。
接下來以 $n=2593, X=5$ 為例來解釋如何得到數學公式。從 1 至 2593 中,數字 5 總計出現了 813 次,其中有 259 次出現在個位,260 次出現在十位,294 次出現在百位,0 次出現在千位。
現在依次分析這些數據,首先是個位。從 1 至 2590 中,包含了 259 個 10,因此任意的 X 都出現了 259 次。最后剩余的三個數 2591, 2592 和 2593,因為它們最大的個位數字 3 < X,因此不會包含任何 5。
然后是十位。從 1 至 2500 中,包含了 25 個 100,因此任意的 X 都出現了 $25 \times 10=250$ 次。剩下的數字是從 2501 至 2593,它們最大的十位數字 9 > X,因此會包含全部 10 個 5。最后總計 250 + 10 = 260。
接下來是百位。從 1 至 2000 中,包含了 2 個 1000,因此任意的 X 都出現了 $2 \times 100=200$ 次。剩下的數字是從 2001 至 2593,它們最大的百位數字 5 == X,這時情況就略微復雜,它們的百位肯定是包含 5 的,但不會包含全部 100 個。如果把百位是 5 的數字列出來,是從 2500 至 2593,數字的個數與百位和十位數字相關,是 93+1 = 94。最后總計 200 + 94 = 294。
最后是千位。現在已經沒有更高位,因此直接看最大的千位數字 2 < X,所以不會包含任何 5。到此為止,已經計算出全部數字 5 的出現次數。
總結一下以上的算法,可以看到,當計算右數第 $i$ 位包含的 X 的個數時:
- 取第 $i$ 位左邊(高位)的數字,乘以 $10^{i-1}$,得到基礎值 $a$。
- 取第 $i$ 位數字,計算修正值:
- 如果大於 X,則結果為 $a + 10^{i-1}$。
- 如果小於 X,則結果為 $a$。
- 如果等 X,則取第 $i$ 位右邊(低位)數字,設為 $b$,最后結果為 $a + b + 1$。
相應的代碼非常簡單,效率也非常高,時間復雜度只有 $O({\log _{10}}n)$。
// 計算數字 X 在 1-n 中出現的次數。 int count(int n, int x) { int cnt = 0, k; for (int i = 1;k = n / i;i *= 10) { // k / 10 為高位的數字。 cnt += (k / 10) * i; // 當前位的數字。 int cur = k % 10; if (cur > x) { cnt += i; } else if (cur == x) { // n - k * i 為低位的數字。 cnt += n - k * i + 1; } } return cnt; }
當 X = 0 時,規律與上面給出的規律不同,需要另行考慮。
最主要的區別是,最高位中永遠是不會包含 0 的,因此,從個位累加到左起第二位就要結束,需要將上面代碼中 for 循環的判斷條件改為 k / 10 != 0。
其次是,第 $i$ 位的基礎值不是高位數字乘以 $10^{i-1}$,而是乘以 $10^{i-1}-1$。以 1 至 102 為例,千位中實際包含 3 個 0,但這三個 0 是來自於個位 2 計算得到的修正值,而非來自於基礎值。千位的基礎值是 0,因為不存在數字 01, 02, 03, ..., 09,即數字前是沒有前導 0 的。解決辦法就是將上面代碼中第 6 行改為 cnt += (k / 10 - 1) * i。
經過綜合與化簡,得到了以下代碼:
// 計算數字 0 在 1-n 中出現的次數。 int countZero(int n) { int cnt = 0, k; // k / 10 為高位的數字。 for (int i = 1;(k = n / i) / 10;i *= 10) { cnt += (k / 10) * i; // k % 10 為當前位的數字。 if (k % 10 == 0) { // n - k * i 為低位的數字。 cnt += n - k * i + 1 - i; } } return cnt; }
主要是將一些步驟進行了合並,令代碼比較簡練。
將上面兩段代碼進行合並,可以得到以下代碼,對 X 從 0 到 9 都有效:
// 計算數字 X 在 1-n 中出現的次數。 int count(int n, int x) { int cnt = 0, k; for (int i = 1;k = n / i;i *= 10) { // 高位的數字。 int high = k / 10; if (x == 0) { if (high) { high--; } else { break; } } cnt += high * i; // 當前位的數字。 int cur = k % 10; if (cur > x) { cnt += i; } else if (cur == x) { // n - k * i 為低位的數字。 cnt += n - k * i + 1; } } return cnt; }