組合數公式:
1. C(n,m)=C(n,n-m)
2. C(n,m)=C(n-1,m-1)+C(n-1,m) 楊輝三角
等差數列:
通項公式:an=a1+(n-1)d
前n項和:s=n*a1+n(n-1)/2*d
等比數列:
通項公式:an=a1*q^(n-1)
前n項目和: s=a1*(1-q^n)/(1-q)
直線公式:
y=kx+b k=(y2-y1)/(x2-x1) b=y1-x1*(y2-y1)/(x2-x1)
兩直線平行k1=k2 兩直線垂直 k1*k2=-1
1. 給一條長度為1的線段,在線段上選取兩個點將其分成3段,求這三段能拼成三角形的概率?
根據三角形兩邊之和大於第三邊,兩邊之差小於第三邊,假設其中一段距離左端點的距離為x,另一段為y,令y>x,那么三段的長度分別為x, y-x, 1-y
根據兩邊之和大於第三邊有:y > 1/2 , y-x < 1/2 , x < 1/2, y-x > 0,這幾個條件可以確定一個三角形,面積是1/8,這代表x和y能構成三角形的取值范圍。
對於線段的切割,有 0<x<y<1, 也就是0<x<1, 0<y<1, x<y組成三角形的面積是1/2,那么1/8/(1/2)=1/4即為能組成三角形的概率。
2. 將54張撲克牌均分成3份,其中大小王在一份里面的概率是多少?
首先將54張牌均分成3份的分法有:M = C(54, 18)*C(36, 18)*C(18, 18)
大小王在一張牌中的分法有:N = C(3, 1)*C(52, 16)*C(36, 18)*C(18, 18)
那么N / M即為所求。
3. 有兩個盒子,50個紅球和50個黑球,現在設計一種分配方案,使得隨機選擇一個盒子,然后隨機選擇一個球,這個球是紅球的最大概率是多少?
分配方案:將一個盒子里放一個紅球,然后其他所有球都放到另一個盒子里面。
概率:1/2 * 1 + 1/2 * 49/99 = 74.7%
4. 將一個數組均勻打亂的算法?
令當前數組長度為n,在里面隨機選擇一個數,將其與最后一個數交換,然后再對前n-1個數做相同操作。
5. 利用異或進行兩數交換
a = a^b
b = a^b
a = a^b
分析:先令a=a^b,那么b=a^b=(a^b)^b=a,a=a^b=(a^b)^a=b
6. 不用比較符求出a,b的最大值
max=(abs(a+b)+abs(a-b))/2
分析:if a > b 有 max = (a+b+a-b)/2 = a
if a < b 有 max = (a+b+b-a)/2 = b
7. 不用加減乘除運算符求兩個數的和
while(b) {
sum = a^b;
carry = (a&b)<<1;
a = sum;
b = carry;
}
return a;
分析:a^b的意思是a和b在二進制下相加,但是不考慮進位,a&b在二進制下為1的位表示相加需要進位的地方,所以需要向左移一位,然后只要進位不為0,就需要再次和上一次不考慮進位的和用同樣的方法進行相加。
8. X>=5,X和X+2為素數,證明X+1是6的倍數
首先任意三個連續的自然數都有一個可以被3整除。
證明:對於n-1, n, n+1
假設n%3=0
假設n%3=1有(n-1)%3=0
假設n%3=2有(n+1)%3=0
得證。
因此由於X和X+2都是素數,那么X+1一定是3的倍數,由於X>=5且X和X+2都是素數那么它們一定是奇數所以X+1一定是偶數,X+1含有因子2和因子3所以一定能被6整除。
9. 隨即洗牌算法及其證明
在1~n隨機選一個數與a[n]交換,再從1~n-1隨機選一個數和a[n-1]交換,以此類推。這樣做可以做到均勻洗牌,也就是1~n的全排列可以等概率的均勻得到。
證明:首先從n個數中隨機選共有n種可能情況,然后在n-1個數中隨機選共有n-1種可能情況,那么可以獲得的情況有n*(n-1)*(n-2)*...*1種,相當於全排列,也就是全排列中的所有情況都可以等概率的得到。
10. 從海量數據(不能讀入內存中)中找中位數,數據都是32位的
解法一:采用分段讀入的方法,假設每次讀入n個數,用一個長度為n的優先隊列進行維護,這樣掃一遍海量數據,就可以的到數據中前n大的數,把這n個數去掉,假設海量數據有N個,那么下次就只讀入剩下的N-n個數,再找到的就是n+1~2n大的數,以此類推,直到找到第N/2個數。時間按復雜度是O(N/2/n*Nlogn)。
解法二:從32位入手,將每個數據按照二進制分成前后兩部分,分別為16位長度,先按照前16位,分成2^16個區間,掃一遍海量數據,統計每個區間一共有多少個數,然后可以確定中位數所在區間,之后就是在這個區間找第k個數,用后16位,將中位數所在的那個前16位區間分成2^16份,統計每個區間有多少個數,就可以確定中位數是哪個了,時間復雜度是O(n)。
11. 三門問題
三扇門,一扇后面有車,另外兩扇后面是羊,現在你選了一扇后,主持人打開一扇發現是羊,問你換不換,換了是車的概率是多少?不換是車的概率是多少?
用貝葉斯公式解釋一下:
P(你當前選擇的這扇門是車|主持人選擇的一扇門是羊) = P(你選擇的這扇門是車&主持人選擇的一扇門是羊) / P(主持人選擇的一扇門是羊)
= P(主持人選擇的一扇門是羊|你選擇的這扇門是車) * P(你選擇的這扇門是車) / P(主持人選擇的一扇門是羊)
= (1 * 1 / 3) / 1
= 1 / 3
所以更換另一扇門是車的概率為2 / 3, 不更換當前這扇門是車的概率是1 / 3。
12. 燒香問題
兩柱香,燒完一柱香所用時間都是1小時,找出一種可以判斷15分鍾的切割方法
先點燃香1的一端,同時點燃香2的兩端,當香2燃盡后,過了半小時,香1還剩一半,這時同時點燃香1的兩端就可以在15分鍾內燃盡。
13. 燈管問題
房間里有三盞燈分別由三個開關控制,只能進房間一次,需要找出哪個開關控制哪盞燈
先打開一盞燈一段時間,然后關閉它,打開另一盞燈,進入房間,可以確定當前開關控制着哪盞燈,然后摸一下,熱的那個就是之前那盞燈,剩下一盞燈對應沒打開過的那個開關。
14. 盲人分襪子
兩個盲人,每人都買了黑白兩對襪子,總共8只,但是他們把襪子混到了一起,現在要求找出一種方案,使得每人都有一對黑襪子和一對白襪子
每個人分別在一對襪子里拿一只就可以了。
15. 蓄水池采樣
問題1. 構造一個隨機數生成器,使得如果其生成數范圍在1~n則每個數被選中的概率都是1/n,比如范圍是1~2那么得到1和2的概率都是1/2,范圍是1~3則得到1,2,3點概率都是1/3。
構造方法是:首先令num=1,然后用1/2的概率去決定是否用2替換num,也就是令num=2,然后再用1/3的概率決定是否用3替換2,依此類推,對於第n個數n用1/n的概率決定是否用n去替換num。這樣下來,n個數替換結束后,num=1~n中任意數字的概率都是1/n。
證明: 開始只有1,那么1被選中的概率P(1)=1,之后添加了2,2被選中的概率是P(2)=1/2,此時1還能被選中的概率P(1最終保留下來)=P(1被選中)*P(2沒被選中的概率)=1*(1-1/2)=1/2,之后又添加了3,那么如果已經用2替換了1,此時2不被替換掉概率是P(2最終保留下來)=P(2被選中)*P(3沒被選中的概率)=1/2*(1-1/3)=1/3,也就是說范圍1~3內,最終生成了2的概率是1/3,再來看1,如果1一直沒被替換掉,也就是P(1最終保留下來)=P(1被選中)*P(2沒被選中)*P(3沒被選中)=1*(1-1/2)*(1-1/3)=1*1/2*2/3=1/3,也就是說在1~3的范圍內,最終生成了1點概率也是1/3。
那么對於n個數最終生成第m個數的情況,有:
P(m最終保留下來)=P(m被選中)*P(m+1沒被選中)*P(m+2沒被選中)*...*P(n沒被選中)
=1/m*(1-1/(m+1))*(1-1/(m+2))*...*(1-1/n)
=1/m*m/(m+1)*(m+1)/(m+2)*...*(n-1)/n
=1/n
也就是說n個數中,每個數都是等概率被選中的,得證。
問題2. 在1~n的范圍內選出k個數,保證1~n每個數被選中的概率相等。
構造方法是:先保留1~k,然后增加一個數k+1,拿他替換1~k中的數字的概率是k/k+1,替換必須是等概率的1/k,對於第n個數,拿他替換1~k中的數字的概率是k/n,這樣可以保證范圍在1~n的所有數中每個數被選到這k個數中的概率都是k/n。相當於把上個問題的1變成了k。
證明:首先只有k個數的時候它們被選中的概率是1,那么第k+1個數選進來,這k個數中的某一個ki不被替換的概率是
P(ki保留下來)=P(ki被選中)*[P(k+1被選中)*P(k+1沒有替換ki)+P(k+1沒被選中)]=1*[k/(k+1)*(k-1)/k+1/(k+1)]=k/(k+1)
對於m保留到最后的概率為
P(m保留到最后)=P(m被選中)*[P(m+1被選中)*P(m+1沒替換m)+P(m+1沒被選中)]*[P(m+2被選中)*P(m+2沒替換m)+P(m+2沒被選中)]*...*[P(n被選中)*P(n沒替換m)+P(n沒被選中)]
=k/m*[k/(m+1)*(k-1)/k+(m+1-k)/(m+1)]*[k/(m+2)*(k-1)/k+(m+2-k)/(m+2)]*...*[k/n*(k-1)/k+(n-k)/n]
=k/m*m/(m+1)*(m+1)/(m+2)*...*(n-1)/n
=k/n
也就是說n中的任意一個數被選到k個數里的概率都是k/n,得證。
應用1. 給個很長的鏈表,不知道具體有多少節點,現在只允許遍歷鏈表一次,讓從鏈表中選擇k個節點,並且鏈表中節點都是等概率被選中的。
先遍歷前k個節點,然后從第k+1個節點開始,每增加一個節點,如果這個節點是第i個,都保證它有k/i的概率被選中,並且以1/k的概率去替換k個節點中的一個,當遍歷完鏈表之后k個節點即為滿足等概率條件被選取的節點。
16. 用隨機數生成器rand5()去構造一個隨機數生成器rand7()
用兩個隨機數生成器rand5()可以均勻生成25個五進制數,然后將這些五進制轉換為10進制是6~30,減去5得到1~25,然后將22~25舍棄,也就是得到這幾個數就重新取,將1~21三個一組分成7組,也就是模7同余的數放到一組。
類似的還可以用rand7去組合rand10:用兩個rand7生成49個數,然后去掉9個,4個一組。
rand2和rand5去組合rand10:rand2=0時返回rand5,rand2=1時返回rand5+5。
rand2和rand7去組合rand10:rand2=0時返回rand7,rand2=1時返回rand7+7去掉最后四個數。
17. 幼兒園有4名男孩和若干名女孩,現在加入一名兒童,性別隨機,然后隨機挑出一名兒童是男孩,問加入的那名兒童是女孩的概率。
運用貝葉斯公式解決:A表示挑出了一名男孩 B1表示加入了一名男孩 B2表示加入了一名女孩
現在求 P(B2|A)=P(B2A)/P(A)=P(A|B2)P(B2)/[P(A|B1)P(B1)+P(A|B2)P(B2)],因為加入兒童的性別是隨機的,因此,P(B1)=P(B2)=1/2,假設開始有N名女孩,那么上式
P(B2|A)=P(A|B2)/(P(A|B1)+P(A|B2))=4/(N+1)/[5/(N+1)+4/(N+1)]=4/9。
18. 擲骰子,正面朝上的數字有多大就給多少錢,問最多願意花多少錢去玩這個游戲?
計算收益的數學期望,骰子六個面,每個面朝上的概率是1/6,那么受益的期望是 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6=3.5 所以最多花3.5元去玩。
子問題:如果能擲兩次,第二次可以選擇擲或者不擲,並且如果第二次擲了,那么受益只能按照第二次的給,問願意花多少錢去玩?
已知擲一次期望收益是3.5元,也就是說第二次期望受益是3.5元,所以如果第一次擲出了4 5 6的話,第二次肯定不擲了,否則還是要擲一發試試的,第一次擲出4 5 6的概率是1/2,所以選擇擲第二次的概率也是1/2,第一次如果擲出了1 2 3的話,受益應該按照第二次的算,也就是3.5,第一次如果擲出了4 5 6的話,收益按照第一次算也就是4*1/3+5*1/3+6*1/3=5,那么最終期望受益是5*1/2+3.5*1/2=4.25
19. 桶里面有M個白球,每次從桶中取一個球,不管是白球還是紅球都染紅然后再放回去,問將桶中所有球都染紅的期望次數是多少?
令E[i]表示桶里已經有i個紅球,將剩下的球都染紅的期望次數,那么有E[i]=(i/M)*E[i]+(1-i/M)*E[i+1]+1, 化簡后有E[i]=E[i+1]+M/(M-i)
有P[M]=0,可以進行遞推P[M-1]=P[M]+M/1=M, P[M-2]=P[M-1]+M/2=M+M/2, P[M-3]=P[M-2]+M/3=M+M/2+M/3, ... , P[0]=P[1]+1=1+M/(M-1)+...+M/3+M/2+M
20. 無窮多只兔子,體重不一,從里面選出10只,挑出重量最大的A,然后再選20只,挑出其中重量最大的B,問A比B大的概率是多少?
相當於一共挑出來30只兔子,分成兩堆,一堆10只,一堆20只,問重量最大的兔子在第一堆中的概率是多少,C(10,1) / C(30,1) = 1/3
21. 擲骰子直到出現6為止,問出現6的期望次數是多少?
設擲出6的期望次數為E,那么當前成功的概率是1/6,失敗的概率是5/6,成功的話擲1次,失敗的話擲1次后還要再擲E次,所以期望遞推公式是
E=1/6*1+5/6*(1+E),E=6
22. 一把寶劍,目前是1級,每往上升一級需要一個寶石,升級成功率是50%,等級小於5的時候,失敗不會降級,等級大於5的時候,失敗會降一級,問將寶劍升到9級至少需要寶石的期望數量。
設E[i]表示從等級i-1升到i的期望寶石數量,那么對於i<=5,有 E[i]=1/2*1+1/2*(1+E[i]),有E[i]=2,對於i>5的情況有 E[i]=1/2*1+1/2*(1+E[i-1]+E[i]),表示如果成功花費一塊寶石,如果失敗,首先需要花費一塊寶石,然后降一級到i-2所以需要先升到i-1花費E[i-1]塊寶石,然后再升到i需要E[i]塊寶石,得到E[i]=E[i-1]+2,那么有E[2]=E[3]=E[4]=E[5]=2,
E[6]=4, E[7]=6, E[8]=8, E[9]=10,從1級升到9級需要E[2]+E[3]+...E[9]=36塊寶石。
23. 兩個人輪流拋硬幣,先拋到正面者可以吃到蘋果,問先手吃到蘋果的概率是?
P(先手吃到蘋果的概率)=P(先手第一次拋出正面)+P(先手第二次拋出正面)+P(先手第三次拋出正面)+...+P(先手第n次拋出正面) ,其中n是趨於無窮大的。
=P(先手第一次拋出正面)+P(先手第一次沒拋出正面)*P(后手第一次沒拋出正面)*P(先手第二次拋出正面)+...+P(先手第一次沒拋出正面)*P(后手第一次沒拋出正面)*...*P(先手第n-1次沒拋出正面)*P(后手第n-1次沒拋出正面)*P(先手第n次拋出正面)
=1/2+1/2*1/2*1/2+...+1/2*1/2*...*1/2+...
=1/2+1/2^3+1/2^5+...+1/2^n+...
等比數列的前n項和,s=a1(1-q^n)/(1-q)其中n是趨於無窮大的,那么n趨於無窮時s=1/2*(1-1/4^n)/(1-1/4)=2/3。
24. 一對夫婦,先后生了兩個孩子,其中一個是女孩,問另一個是男孩的概率是多少?
因為題目說了是"先后",所以需要討論先后順序,總共四種可能:(男男),(女女),(男女),(女男),其中一個是女孩,那么總共只有其中三種情況,這三種情況中一女一男總共兩種情況,因此答案是2/3。
如果不分先后順序的話,那總共只有(女女)和(男女)兩種情況,答案就是1/2了。
25. 一個國家里的每個家庭都只想要男孩,他們會一直生,直到生出一個男孩為止,問這個國家的男女比例是多少?
單看每個家庭,男孩個數的期望E1=1,因為生出一個男孩后就不會再生。女孩的期望個數是E2,生女孩的情況有 (男) (女男) (女女男) (女女女男) ... (女女...女男),
E2=1/2*0+1/2*1/2*1+1/2*1/2*1/2*2+...+(n-1)*(1/2)^n+...
=(1/2)^2+2*(1/2)^3+3*(1/2)^4+...+(n-1)*(1/2)^n+...
2E2=1/2+2*(1/2)^2+3*(1/2)^3+...+n*(1/2)^n+...
2E2-E2=E2=1/2+(1/2)^2+(1/2)^3+...+(1/2)^n+...
等比數列的前n項和是E2=(1/2)*[1-(1/2)^n]/(1-1/2)=1
E1=E2=1男女孩期望個數都是1,所以比例是1:1
26. 平均要取多少次(0,1)之內的隨機數才能讓其和超過1?
e次,e是自然對數的底。
27. 兩個人在一個圓桌上放硬幣,直到擺不下就算輸,問先手的必勝策略?
先手將硬幣放桌子中間,然后后手放在哪個位置,先手就放在其對稱的位置。
28. 一個矩形蛋糕,中間有個矩形空洞,矩形空洞並不是位於蛋糕中心,如何一刀將蛋糕分成面積相同的兩份?
取蛋糕中心點和空洞中心點的連線,然后沿着這條線切割,肯定可以將矩形蛋糕和空洞平分,那么它倆面積的差肯定也是平分的。
29. N*M的巧克力,每次只能將一塊掰成兩塊,問掰成N*M的小塊至少需要掰多少次?
N*M-1次,因為每掰一次只能增加一塊巧克力。或者這樣做,先掰成M塊,需要M-1次,再將這M塊掰成N*M塊,需要M*(N-1)次,總共M*N-1次。
30. N個數,每個數都不超過N-1(至少有一個數重復了),現在告訴你有一個數是重復的,如何找出這個數?如果每個數都不超過N+1,每個數都不重復,問1~N+1少了哪個?
1. 用這N個數的和減去1~N-1的和。
2. 用1~N+1的和減去這N個數的和。
31. 判斷一個數是不是2的冪
一個數是2的冪,那么二進制表達式中最高位是1,其他位全是0,所以直接判斷b&(b-1)是否為0就可以了。
33. A和B分別在兩座島上,B有病,A有葯,C有船,船上有箱子,箱子要是不上鎖東西會被偷走,A和B各自有把鎖,問A如何將葯運給B?
首先A把葯放到箱子里面,然后上鎖,運到B這里后B上自己的鎖,再運回A,A將自己的鎖打開,再運回B,B打開自己的鎖就行了。
34. 兩種葯A和B,每天分別吃一粒A和B,現在打開葯瓶A,倒出一片在手上,然后打開葯瓶B不小心倒出了兩片在手上,問如何保證不浪費葯片的前提下正確服葯?
再倒出一片A葯片,然后將每片葯都等分,現在有四堆,分兩天吃,每天都在每堆里面選擇一半,可以組成A+B。
35. 如何用一個天平、7g和2g的砝碼稱三次將140g砝碼分成50g和90g?
第一次將140g分成70g和70g
第二次一邊放9g一邊放70g,然后得到61g
第三次一邊放9g一邊放61g,得到50g。。。
36. 三筐水果,分別是蘋果、梨、蘋果和梨混合,每個筐的標簽都是錯的,現在要求從一個筐子里面選出一個水果,然后判斷出每個筐子的實際情況。
拿貼着混合標簽的筐子里面的一個水果,如果是蘋果,那么這個筐子一定全是蘋果,然后另外兩個筐子不是梨就是混合,貼着梨的肯定不是梨,肯定是混合,那么貼着混合的肯定是梨。如果第一次拿的是梨也同理。
37. 25匹馬,速度都不同,一共5個賽道,不能計時,一次只能知道五匹馬的速度快慢,問至少需要多少場比賽才能分出前三名?
把這25匹馬分成5組,賽五場,然后每場最快的馬拿出來再賽一場,就知道最快的馬了,根據最后這場的前三名,找出它們之前所在的組,因為第四第五名的馬所在的組肯定不會有哪匹馬能成為2、3名,對於最后一輪前三名所在的組,第一名所在的組中速度第2、3快的有可能成為所有馬中2、3快的,第二名所在的組中速度第1、2快的有可能成為所有馬中第2、3快的,然后第三名中速度最快的有可能成為所有馬中第3快的。這樣一來這五匹馬再賽一輪,取前兩名就是所有馬中第2、3快的。總共需要比7次。
38. 給10億個數排序
使用位圖bitmap,10億個數有10^9,假設里面最大的數是10^9,那么分成20組,每組5*10^7個,然后對於每個數字num,將bitset第num位置為1,總共遍歷20次就能完成排序。
bitset<10000000> bitmap將占用10000000bit的內存,也就是1250000Byte。
下面的代碼對10000000個數據進行排序,分兩次讀入,第一次讀入[0,5000000)范圍內的數據,第二次讀入[5000000,1000000)范圍內的數據。排序思想和技術排序一樣。
#include <cstdio> #include <bitset> #include <time.h> #include <stdlib.h> using namespace std; const int max_each_scan = 5000000; // 每次讀入的數字范圍 int main() { clock_t begin = clock(); // 開始計時 bitset<max_each_scan> bitmap; // 位圖使用bitset FILE *fp_unsort_file = fopen("unsort.txt", "r"); int num; while(fscanf(fp_unsort_file, "%d ", &num)!=EOF) { if(num < max_each_scan) bitmap.set(num, 1); // 將第一組數據存入位圖中 } FILE *fp_sort_file = fopen("sort.txt", "w"); for(int i=0;i<max_each_scan;++i) { if(bitmap[i]) fprintf(fp_sort_file, "%d ", i); } int result=fseek(fp_unsort_file, 0, SEEK_SET); // 將文件光標移動到文件的開始 if(result) printf("fseek failed!\n"); else { bitmap.reset(); while(fscanf(fp_unsort_file, "%d ", &num)!=EOF) { // 將第二組數據存入位圖中 if(num >= max_each_scan && num < (max_each_scan<<1)) { num -= max_each_scan; bitmap.set(num,1); } } for(int i=0;i<max_each_scan;++i) { if(bitmap[i]) fprintf(fp_sort_file, "%d ", i + max_each_scan); } } clock_t end=clock(); // 記錄程序運行結束的時間 printf("Time cost is %ds\n",(end-begin)/CLOCKS_PER_SEC); fclose(fp_sort_file); fclose(fp_unsort_file); return 0; }
39. 在10億條數據中找出重復出現次數最多的前n條
使用位圖的思想,將10^9的數據分成1000組,每組10^6個,然后對這10^9條數據進行1000次遍歷,注意沒法一次存到內存中,只能從文件中每次讀取一個,然后判斷當前數據是否在[0,10^6), [10^6,2*10^6), ... , [999*10^6,10^9)范圍內,對於每一組范圍都通過偏移將數據映射到[0,10^6)內部,統計其出現次數,然后使用優先隊列維護n個元素,用每一組范圍的統計結果來更新優先隊列即可。
如果指明數據時IP地址的話,由於IP地址是32位的,因此總共可能有2^32種情況存在,將其分為2^10組即可。
示例代碼:
#include <cstdio> #include <queue> #include <utility> #include <string.h> using namespace std; int times[10000001]; const int max_each_scan = 10000000; typedef pair<int,int> P; priority_queue< P, vector<P>, greater<P> > q; int main() { FILE *unsort_file = fopen("data.txt", "r"); for(int i=1;i<=10;++i) { int num; memset(times, 0, sizeof(times)); while(fscanf(unsort_file, "%d", &num)==1) { if(max_each_scan*(i-1)<num && num<=max_each_scan*i) ++times[num-(i-1)*max_each_scan]; } for(int j=1;j<=max_each_scan;++j) { if(times[j]) { q.push(P(times[j],j+(i-1)*max_each_scan)); if(q.size() == 11) q.pop(); } } if(fseek(unsort_file, 0, SEEK_SET)) { printf("fseek failed\n"); return -1; } } while(!q.empty()) {printf("%d\n",q.top().second);q.pop();} return 0; }
40. 要求在10億個32位整數中找到第k大的數,10億個數太多沒發存到內存中,只能存到文件中。兩種解法,一是可以將32位數分成兩段,開辟一個2^16大小的數組,然后遍歷所有數據,將每個數據高16位對應數組每個元素,統計每個區間的元素個數,然后判斷第k大的數在哪個區間中,這樣就確定了這個數據的高16位,之后再遍歷一遍,統計高16位滿足條件的數中低16位落到指定區間的個數,然后就可以判斷第k大的數是哪個了。
還有一種解法是用位圖的思想,將數據分成2^10個區間,每個區間長度都是2^22,使用優先隊列記錄每個區間前k大的數即可。