計算1至n中數字X出現的次數


描述

計算 1 至 n 中數字 X 出現的次數,其中 $n \ge 1,X \in [0,9]$。

解題思路

這是一道比較簡單的題目,舉個例子先:假設 $n=11, X=1$,那么就是求 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 這 11 個數字中 1 出現的次數,很容易能看出來結果為 4,在 1 和 10 中各出現了一次,在 11 中出現了兩次。

最簡單的辦法就是依次遍歷 1 至 n,再分別求每個數字中 X 出現的次數,代碼如下所示:

#include <stdio.h>

// 計算數字 X 在 n 中出現的次數。
int countOne(int n, int x) {
	int cnt = 0;
	for (;n > 0;n /= 10) {
		if (n % 10 == x) {
			cnt++;
		}
	}
	return cnt;
}
// 計算數字 X 在 1-n 中出現的次數。
int count(int n, int x) {
	int cnt = 0;
	for (int i = 1;i <= n;i++) {
		cnt += countOne(i, x);
	}
	return cnt;
}
int main() {
	printf("%d\n", count(237, 1));
}

這個方法的缺點是時間復雜度太高,countOne 方法的時間復雜度是 $O({\log _{10}}n)$,count 方法的時間復雜度是 $O(n{\log _{10}}n)$。

一個更好的辦法是利用數學公式直接計算出最終的結果,該方法是依次求出數字 X 在個位、十位、百位等等出現的次數,再相加得到最終結果。這里的 $X \in [1,9]$,因為 $X=0$ 不符合下列規律,需要單獨計算。

首先要知道以下的規律:

  • 從 1 至 10,在它們的個位數中,任意的 X 都出現了 1 次。
  • 從 1 至 100,在它們的十位數中,任意的 X 都出現了 10 次。
  • 從 1 至 1000,在它們的千位數中,任意的 X 都出現了 100 次。

依此類推,從 1 至 $10^i$,在它們的左數第二位(右數第 $i$ 位)中,任意的 X 都出現了 $10^{i-1}$ 次。

這個規律很容易驗證,這里不再多做說明。

接下來以 $n=2593, X=5$ 為例來解釋如何得到數學公式。從 1 至 2593 中,數字 5 總計出現了 813 次,其中有 259 次出現在個位,260 次出現在十位,294 次出現在百位,0 次出現在千位。

現在依次分析這些數據,首先是個位。從 1 至 2590 中,包含了 259 個 10,因此任意的 X 都出現了 259 次。最后剩余的三個數 2591, 2592 和 2593,因為它們最大的個位數字 3 < X,因此不會包含任何 5。

然后是十位。從 1 至 2500 中,包含了 25 個 100,因此任意的 X 都出現了 $25 \times 10=250$ 次。剩下的數字是從 2501 至 2593,它們最大的十位數字 9 > X,因此會包含全部 10 個 5。最后總計 250 + 10 = 260。

接下來是百位。從 1 至 2000 中,包含了 2 個 1000,因此任意的 X 都出現了 $2 \times 100=200$ 次。剩下的數字是從 2001 至 2593,它們最大的百位數字 5 == X,這時情況就略微復雜,它們的百位肯定是包含 5 的,但不會包含全部 100 個。如果把百位是 5 的數字列出來,是從 2500 至 2593,數字的個數與百位和十位數字相關,是 93+1 = 94。最后總計 200 + 94 = 294。

最后是千位。現在已經沒有更高位,因此直接看最大的千位數字 2 < X,所以不會包含任何 5。到此為止,已經計算出全部數字 5 的出現次數。

總結一下以上的算法,可以看到,當計算右數第 $i$ 位包含的 X 的個數時:

  1. 取第 $i$ 位左邊(高位)的數字,乘以 $10^{i-1}$,得到基礎值 $a$。
  2. 取第 $i$ 位數字,計算修正值
    1. 如果大於 X,則結果為 $a + 10^{i-1}$。
    2. 如果小於 X,則結果為 $a$。
    3. 如果等 X,則取第 $i$ 位右邊(低位)數字,設為 $b$,最后結果為 $a + b + 1$。

相應的代碼非常簡單,效率也非常高,時間復雜度只有 $O({\log _{10}}n)$。

// 計算數字 X 在 1-n 中出現的次數。
int count(int n, int x) {
	int cnt = 0, k;
	for (int i = 1;k = n / i;i *= 10) {
		// k / 10 為高位的數字。
		cnt += (k / 10) * i;
		// 當前位的數字。
		int cur = k % 10;
		if (cur > x) {
			cnt += i;
		} else if (cur == x) {
			// n - k * i 為低位的數字。
			cnt += n - k * i + 1;
		}
	}
	return cnt;
}

當 X = 0 時,規律與上面給出的規律不同,需要另行考慮。

最主要的區別是,最高位中永遠是不會包含 0 的,因此,從個位累加到左起第二位就要結束,需要將上面代碼中 for 循環的判斷條件改為 k / 10 != 0。

其次是,第 $i$ 位的基礎值不是高位數字乘以 $10^{i-1}$,而是乘以 $10^{i-1}-1$。以 1 至 102 為例,千位中實際包含 3 個 0,但這三個 0 是來自於個位 2 計算得到的修正值,而非來自於基礎值。千位的基礎值是 0,因為不存在數字 01, 02, 03, ..., 09,即數字前是沒有前導 0 的。解決辦法就是將上面代碼中第 6 行改為 cnt += (k / 10 - 1) * i。

經過綜合與化簡,得到了以下代碼:

// 計算數字 0 在 1-n 中出現的次數。
int countZero(int n) {
	int cnt = 0, k;
	// k / 10 為高位的數字。
	for (int i = 1;(k = n / i) / 10;i *= 10) {
		cnt += (k / 10) * i;
		// k % 10 為當前位的數字。
		if (k % 10 == 0) {
			// n - k * i 為低位的數字。
			cnt += n - k * i + 1 - i;
		}
	}
	return cnt;
}

主要是將一些步驟進行了合並,令代碼比較簡練。

將上面兩段代碼進行合並,可以得到以下代碼,對 X 從 0 到 9 都有效:

// 計算數字 X 在 1-n 中出現的次數。
int count(int n, int x) {
	int cnt = 0, k;
	for (int i = 1;k = n / i;i *= 10) {
		// 高位的數字。
		int high = k / 10;
		if (x == 0) {
			if (high) {
				high--;
			} else {
				break;
			}
		}
		cnt += high * i;
		// 當前位的數字。
		int cur = k % 10;
		if (cur > x) {
			cnt += i;
		} else if (cur == x) {
			// n - k * i 為低位的數字。
			cnt += n - k * i + 1;
		}
	}
	return cnt;
}


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM