數學&概率題&智力題&算法題 總結


組合數公式:

1. C(n,m)=C(n,n-m)

2. C(n,m)=C(n-1,m-1)+C(n-1,m) 楊輝三角

等差數列:

通項公式:an=a1+(n-1)d

前n項和:s=n*a1+n(n-1)/2*d

等比數列:

通項公式:an=a1*q^(n-1)

前n項目和: s=a1*(1-q^n)/(1-q)

直線公式:

y=kx+b   k=(y2-y1)/(x2-x1)   b=y1-x1*(y2-y1)/(x2-x1)

兩直線平行k1=k2 兩直線垂直 k1*k2=-1

 

1. 給一條長度為1的線段,在線段上選取兩個點將其分成3段,求這三段能拼成三角形的概率?

根據三角形兩邊之和大於第三邊,兩邊之差小於第三邊,假設其中一段距離左端點的距離為x,另一段為y,令y>x,那么三段的長度分別為x, y-x, 1-y

根據兩邊之和大於第三邊有:y > 1/2 , y-x < 1/2 , x < 1/2, y-x > 0,這幾個條件可以確定一個三角形,面積是1/8,這代表x和y能構成三角形的取值范圍。

對於線段的切割,有 0<x<y<1, 也就是0<x<1, 0<y<1, x<y組成三角形的面積是1/2,那么1/8/(1/2)=1/4即為能組成三角形的概率。

 

2. 將54張撲克牌均分成3份,其中大小王在一份里面的概率是多少?

首先將54張牌均分成3份的分法有:M = C(54, 18)*C(36, 18)*C(18, 18)

大小王在一張牌中的分法有:N = C(3, 1)*C(52, 16)*C(36, 18)*C(18, 18)

那么N / M即為所求。

 

3. 有兩個盒子,50個紅球和50個黑球,現在設計一種分配方案,使得隨機選擇一個盒子,然后隨機選擇一個球,這個球是紅球的最大概率是多少?

分配方案:將一個盒子里放一個紅球,然后其他所有球都放到另一個盒子里面。

概率:1/2 * 1 + 1/2 * 49/99 =  74.7%

 

4. 將一個數組均勻打亂的算法?

令當前數組長度為n,在里面隨機選擇一個數,將其與最后一個數交換,然后再對前n-1個數做相同操作。

 

5. 利用異或進行兩數交換

a = a^b

b = a^b

a = a^b

分析:先令a=a^b,那么b=a^b=(a^b)^b=a,a=a^b=(a^b)^a=b

 

6. 不用比較符求出a,b的最大值

max=(abs(a+b)+abs(a-b))/2

分析:if a > b 有 max = (a+b+a-b)/2 = a

        if a < b 有 max = (a+b+b-a)/2 = b

 

7. 不用加減乘除運算符求兩個數的和

while(b) {

  sum = a^b;

  carry = (a&b)<<1;

  a = sum;

  b = carry;

}

return a;

分析:a^b的意思是a和b在二進制下相加,但是不考慮進位,a&b在二進制下為1的位表示相加需要進位的地方,所以需要向左移一位,然后只要進位不為0,就需要再次和上一次不考慮進位的和用同樣的方法進行相加。

 

8. X>=5,X和X+2為素數,證明X+1是6的倍數

首先任意三個連續的自然數都有一個可以被3整除。

證明:對於n-1, n, n+1

假設n%3=0

假設n%3=1有(n-1)%3=0

假設n%3=2有(n+1)%3=0

得證。

因此由於X和X+2都是素數,那么X+1一定是3的倍數,由於X>=5且X和X+2都是素數那么它們一定是奇數所以X+1一定是偶數,X+1含有因子2和因子3所以一定能被6整除。

 

9. 隨即洗牌算法及其證明

在1~n隨機選一個數與a[n]交換,再從1~n-1隨機選一個數和a[n-1]交換,以此類推。這樣做可以做到均勻洗牌,也就是1~n的全排列可以等概率的均勻得到。

證明:首先從n個數中隨機選共有n種可能情況,然后在n-1個數中隨機選共有n-1種可能情況,那么可以獲得的情況有n*(n-1)*(n-2)*...*1種,相當於全排列,也就是全排列中的所有情況都可以等概率的得到。

 

10. 從海量數據(不能讀入內存中)中找中位數,數據都是32位的

解法一:采用分段讀入的方法,假設每次讀入n個數,用一個長度為n的優先隊列進行維護,這樣掃一遍海量數據,就可以的到數據中前n大的數,把這n個數去掉,假設海量數據有N個,那么下次就只讀入剩下的N-n個數,再找到的就是n+1~2n大的數,以此類推,直到找到第N/2個數。時間按復雜度是O(N/2/n*Nlogn)。

解法二:從32位入手,將每個數據按照二進制分成前后兩部分,分別為16位長度,先按照前16位,分成2^16個區間,掃一遍海量數據,統計每個區間一共有多少個數,然后可以確定中位數所在區間,之后就是在這個區間找第k個數,用后16位,將中位數所在的那個前16位區間分成2^16份,統計每個區間有多少個數,就可以確定中位數是哪個了,時間復雜度是O(n)。

 

11. 三門問題

三扇門,一扇后面有車,另外兩扇后面是羊,現在你選了一扇后,主持人打開一扇發現是羊,問你換不換,換了是車的概率是多少?不換是車的概率是多少?

用貝葉斯公式解釋一下:

P(你當前選擇的這扇門是車|主持人選擇的一扇門是羊) = P(你選擇的這扇門是車&主持人選擇的一扇門是羊) / P(主持人選擇的一扇門是羊)

                                                                    = P(主持人選擇的一扇門是羊|你選擇的這扇門是車) * P(你選擇的這扇門是車) / P(主持人選擇的一扇門是羊)

                                                                    = (1 * 1 / 3) / 1

                                                                    = 1 / 3

所以更換另一扇門是車的概率為2 / 3, 不更換當前這扇門是車的概率是1 / 3。

 

12. 燒香問題

兩柱香,燒完一柱香所用時間都是1小時,找出一種可以判斷15分鍾的切割方法

先點燃香1的一端,同時點燃香2的兩端,當香2燃盡后,過了半小時,香1還剩一半,這時同時點燃香1的兩端就可以在15分鍾內燃盡。

 

13. 燈管問題

房間里有三盞燈分別由三個開關控制,只能進房間一次,需要找出哪個開關控制哪盞燈

先打開一盞燈一段時間,然后關閉它,打開另一盞燈,進入房間,可以確定當前開關控制着哪盞燈,然后摸一下,熱的那個就是之前那盞燈,剩下一盞燈對應沒打開過的那個開關。

 

14. 盲人分襪子

兩個盲人,每人都買了黑白兩對襪子,總共8只,但是他們把襪子混到了一起,現在要求找出一種方案,使得每人都有一對黑襪子和一對白襪子

每個人分別在一對襪子里拿一只就可以了。

 

15. 蓄水池采樣

問題1. 構造一個隨機數生成器,使得如果其生成數范圍在1~n則每個數被選中的概率都是1/n,比如范圍是1~2那么得到1和2的概率都是1/2,范圍是1~3則得到1,2,3點概率都是1/3。

構造方法是:首先令num=1,然后用1/2的概率去決定是否用2替換num,也就是令num=2,然后再用1/3的概率決定是否用3替換2,依此類推,對於第n個數n用1/n的概率決定是否用n去替換num。這樣下來,n個數替換結束后,num=1~n中任意數字的概率都是1/n。

證明: 開始只有1,那么1被選中的概率P(1)=1,之后添加了2,2被選中的概率是P(2)=1/2,此時1還能被選中的概率P(1最終保留下來)=P(1被選中)*P(2沒被選中的概率)=1*(1-1/2)=1/2,之后又添加了3,那么如果已經用2替換了1,此時2不被替換掉概率是P(2最終保留下來)=P(2被選中)*P(3沒被選中的概率)=1/2*(1-1/3)=1/3,也就是說范圍1~3內,最終生成了2的概率是1/3,再來看1,如果1一直沒被替換掉,也就是P(1最終保留下來)=P(1被選中)*P(2沒被選中)*P(3沒被選中)=1*(1-1/2)*(1-1/3)=1*1/2*2/3=1/3,也就是說在1~3的范圍內,最終生成了1點概率也是1/3。

那么對於n個數最終生成第m個數的情況,有:

P(m最終保留下來)=P(m被選中)*P(m+1沒被選中)*P(m+2沒被選中)*...*P(n沒被選中)

                        =1/m*(1-1/(m+1))*(1-1/(m+2))*...*(1-1/n)

                        =1/m*m/(m+1)*(m+1)/(m+2)*...*(n-1)/n

                        =1/n

也就是說n個數中,每個數都是等概率被選中的,得證。

問題2. 在1~n的范圍內選出k個數,保證1~n每個數被選中的概率相等。

構造方法是:先保留1~k,然后增加一個數k+1,拿他替換1~k中的數字的概率是k/k+1,替換必須是等概率的1/k,對於第n個數,拿他替換1~k中的數字的概率是k/n,這樣可以保證范圍在1~n的所有數中每個數被選到這k個數中的概率都是k/n。相當於把上個問題的1變成了k。

證明:首先只有k個數的時候它們被選中的概率是1,那么第k+1個數選進來,這k個數中的某一個ki不被替換的概率是

P(ki保留下來)=P(ki被選中)*[P(k+1被選中)*P(k+1沒有替換ki)+P(k+1沒被選中)]=1*[k/(k+1)*(k-1)/k+1/(k+1)]=k/(k+1)

對於m保留到最后的概率為

P(m保留到最后)=P(m被選中)*[P(m+1被選中)*P(m+1沒替換m)+P(m+1沒被選中)]*[P(m+2被選中)*P(m+2沒替換m)+P(m+2沒被選中)]*...*[P(n被選中)*P(n沒替換m)+P(n沒被選中)]

                     =k/m*[k/(m+1)*(k-1)/k+(m+1-k)/(m+1)]*[k/(m+2)*(k-1)/k+(m+2-k)/(m+2)]*...*[k/n*(k-1)/k+(n-k)/n]

                     =k/m*m/(m+1)*(m+1)/(m+2)*...*(n-1)/n

                     =k/n

也就是說n中的任意一個數被選到k個數里的概率都是k/n,得證。

應用1. 給個很長的鏈表,不知道具體有多少節點,現在只允許遍歷鏈表一次,讓從鏈表中選擇k個節點,並且鏈表中節點都是等概率被選中的。

先遍歷前k個節點,然后從第k+1個節點開始,每增加一個節點,如果這個節點是第i個,都保證它有k/i的概率被選中,並且以1/k的概率去替換k個節點中的一個,當遍歷完鏈表之后k個節點即為滿足等概率條件被選取的節點。

 

16. 用隨機數生成器rand5()去構造一個隨機數生成器rand7()

用兩個隨機數生成器rand5()可以均勻生成25個五進制數,然后將這些五進制轉換為10進制是6~30,減去5得到1~25,然后將22~25舍棄,也就是得到這幾個數就重新取,將1~21三個一組分成7組,也就是模7同余的數放到一組。

類似的還可以用rand7去組合rand10:用兩個rand7生成49個數,然后去掉9個,4個一組。

rand2和rand5去組合rand10:rand2=0時返回rand5,rand2=1時返回rand5+5。

rand2和rand7去組合rand10:rand2=0時返回rand7,rand2=1時返回rand7+7去掉最后四個數。

 

17. 幼兒園有4名男孩和若干名女孩,現在加入一名兒童,性別隨機,然后隨機挑出一名兒童是男孩,問加入的那名兒童是女孩的概率。

運用貝葉斯公式解決:A表示挑出了一名男孩  B1表示加入了一名男孩  B2表示加入了一名女孩

現在求 P(B2|A)=P(B2A)/P(A)=P(A|B2)P(B2)/[P(A|B1)P(B1)+P(A|B2)P(B2)],因為加入兒童的性別是隨機的,因此,P(B1)=P(B2)=1/2,假設開始有N名女孩,那么上式

P(B2|A)=P(A|B2)/(P(A|B1)+P(A|B2))=4/(N+1)/[5/(N+1)+4/(N+1)]=4/9。

 

18. 擲骰子,正面朝上的數字有多大就給多少錢,問最多願意花多少錢去玩這個游戲?

計算收益的數學期望,骰子六個面,每個面朝上的概率是1/6,那么受益的期望是 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6=3.5 所以最多花3.5元去玩。

子問題:如果能擲兩次,第二次可以選擇擲或者不擲,並且如果第二次擲了,那么受益只能按照第二次的給,問願意花多少錢去玩?

已知擲一次期望收益是3.5元,也就是說第二次期望受益是3.5元,所以如果第一次擲出了4 5 6的話,第二次肯定不擲了,否則還是要擲一發試試的,第一次擲出4 5 6的概率是1/2,所以選擇擲第二次的概率也是1/2,第一次如果擲出了1 2 3的話,受益應該按照第二次的算,也就是3.5,第一次如果擲出了4 5 6的話,收益按照第一次算也就是4*1/3+5*1/3+6*1/3=5,那么最終期望受益是5*1/2+3.5*1/2=4.25

 

19. 桶里面有M個白球,每次從桶中取一個球,不管是白球還是紅球都染紅然后再放回去,問將桶中所有球都染紅的期望次數是多少?

令E[i]表示桶里已經有i個紅球,將剩下的球都染紅的期望次數,那么有E[i]=(i/M)*E[i]+(1-i/M)*E[i+1]+1, 化簡后有E[i]=E[i+1]+M/(M-i)

有P[M]=0,可以進行遞推P[M-1]=P[M]+M/1=M, P[M-2]=P[M-1]+M/2=M+M/2, P[M-3]=P[M-2]+M/3=M+M/2+M/3, ... , P[0]=P[1]+1=1+M/(M-1)+...+M/3+M/2+M

 

20. 無窮多只兔子,體重不一,從里面選出10只,挑出重量最大的A,然后再選20只,挑出其中重量最大的B,問A比B大的概率是多少?

相當於一共挑出來30只兔子,分成兩堆,一堆10只,一堆20只,問重量最大的兔子在第一堆中的概率是多少,C(10,1) / C(30,1) = 1/3

 

21. 擲骰子直到出現6為止,問出現6的期望次數是多少?

設擲出6的期望次數為E,那么當前成功的概率是1/6,失敗的概率是5/6,成功的話擲1次,失敗的話擲1次后還要再擲E次,所以期望遞推公式是

E=1/6*1+5/6*(1+E),E=6

 

22. 一把寶劍,目前是1級,每往上升一級需要一個寶石,升級成功率是50%,等級小於5的時候,失敗不會降級,等級大於5的時候,失敗會降一級,問將寶劍升到9級至少需要寶石的期望數量。

設E[i]表示從等級i-1升到i的期望寶石數量,那么對於i<=5,有 E[i]=1/2*1+1/2*(1+E[i]),有E[i]=2,對於i>5的情況有 E[i]=1/2*1+1/2*(1+E[i-1]+E[i]),表示如果成功花費一塊寶石,如果失敗,首先需要花費一塊寶石,然后降一級到i-2所以需要先升到i-1花費E[i-1]塊寶石,然后再升到i需要E[i]塊寶石,得到E[i]=E[i-1]+2,那么有E[2]=E[3]=E[4]=E[5]=2,

E[6]=4, E[7]=6, E[8]=8, E[9]=10,從1級升到9級需要E[2]+E[3]+...E[9]=36塊寶石。

 

23. 兩個人輪流拋硬幣,先拋到正面者可以吃到蘋果,問先手吃到蘋果的概率是?

P(先手吃到蘋果的概率)=P(先手第一次拋出正面)+P(先手第二次拋出正面)+P(先手第三次拋出正面)+...+P(先手第n次拋出正面) ,其中n是趨於無窮大的。

                             =P(先手第一次拋出正面)+P(先手第一次沒拋出正面)*P(后手第一次沒拋出正面)*P(先手第二次拋出正面)+...+P(先手第一次沒拋出正面)*P(后手第一次沒拋出正面)*...*P(先手第n-1次沒拋出正面)*P(后手第n-1次沒拋出正面)*P(先手第n次拋出正面)

                             =1/2+1/2*1/2*1/2+...+1/2*1/2*...*1/2+...

                             =1/2+1/2^3+1/2^5+...+1/2^n+...

等比數列的前n項和,s=a1(1-q^n)/(1-q)其中n是趨於無窮大的,那么n趨於無窮時s=1/2*(1-1/4^n)/(1-1/4)=2/3。

 

24. 一對夫婦,先后生了兩個孩子,其中一個是女孩,問另一個是男孩的概率是多少?

因為題目說了是"先后",所以需要討論先后順序,總共四種可能:(男男),(女女),(男女),(女男),其中一個是女孩,那么總共只有其中三種情況,這三種情況中一女一男總共兩種情況,因此答案是2/3。

如果不分先后順序的話,那總共只有(女女)和(男女)兩種情況,答案就是1/2了。

 

25. 一個國家里的每個家庭都只想要男孩,他們會一直生,直到生出一個男孩為止,問這個國家的男女比例是多少?

單看每個家庭,男孩個數的期望E1=1,因為生出一個男孩后就不會再生。女孩的期望個數是E2,生女孩的情況有 (男) (女男) (女女男) (女女女男) ... (女女...女男),

E2=1/2*0+1/2*1/2*1+1/2*1/2*1/2*2+...+(n-1)*(1/2)^n+...

    =(1/2)^2+2*(1/2)^3+3*(1/2)^4+...+(n-1)*(1/2)^n+...

2E2=1/2+2*(1/2)^2+3*(1/2)^3+...+n*(1/2)^n+...

2E2-E2=E2=1/2+(1/2)^2+(1/2)^3+...+(1/2)^n+...

等比數列的前n項和是E2=(1/2)*[1-(1/2)^n]/(1-1/2)=1

E1=E2=1男女孩期望個數都是1,所以比例是1:1

 

26. 平均要取多少次(0,1)之內的隨機數才能讓其和超過1?

e次,e是自然對數的底。

 

27. 兩個人在一個圓桌上放硬幣,直到擺不下就算輸,問先手的必勝策略?

先手將硬幣放桌子中間,然后后手放在哪個位置,先手就放在其對稱的位置。

 

28. 一個矩形蛋糕,中間有個矩形空洞,矩形空洞並不是位於蛋糕中心,如何一刀將蛋糕分成面積相同的兩份?

取蛋糕中心點和空洞中心點的連線,然后沿着這條線切割,肯定可以將矩形蛋糕和空洞平分,那么它倆面積的差肯定也是平分的。

 

29. N*M的巧克力,每次只能將一塊掰成兩塊,問掰成N*M的小塊至少需要掰多少次?

N*M-1次,因為每掰一次只能增加一塊巧克力。或者這樣做,先掰成M塊,需要M-1次,再將這M塊掰成N*M塊,需要M*(N-1)次,總共M*N-1次。

 

30. N個數,每個數都不超過N-1(至少有一個數重復了),現在告訴你有一個數是重復的,如何找出這個數?如果每個數都不超過N+1,每個數都不重復,問1~N+1少了哪個?

1. 用這N個數的和減去1~N-1的和。

2. 用1~N+1的和減去這N個數的和。

 

31. 判斷一個數是不是2的冪

一個數是2的冪,那么二進制表達式中最高位是1,其他位全是0,所以直接判斷b&(b-1)是否為0就可以了。

 

33. A和B分別在兩座島上,B有病,A有葯,C有船,船上有箱子,箱子要是不上鎖東西會被偷走,A和B各自有把鎖,問A如何將葯運給B?

首先A把葯放到箱子里面,然后上鎖,運到B這里后B上自己的鎖,再運回A,A將自己的鎖打開,再運回B,B打開自己的鎖就行了。

 

34. 兩種葯A和B,每天分別吃一粒A和B,現在打開葯瓶A,倒出一片在手上,然后打開葯瓶B不小心倒出了兩片在手上,問如何保證不浪費葯片的前提下正確服葯?

再倒出一片A葯片,然后將每片葯都等分,現在有四堆,分兩天吃,每天都在每堆里面選擇一半,可以組成A+B。

 

35. 如何用一個天平、7g和2g的砝碼稱三次將140g砝碼分成50g和90g?

第一次將140g分成70g和70g

第二次一邊放9g一邊放70g,然后得到61g

第三次一邊放9g一邊放61g,得到50g。。。

 

36. 三筐水果,分別是蘋果、梨、蘋果和梨混合,每個筐的標簽都是錯的,現在要求從一個筐子里面選出一個水果,然后判斷出每個筐子的實際情況。

拿貼着混合標簽的筐子里面的一個水果,如果是蘋果,那么這個筐子一定全是蘋果,然后另外兩個筐子不是梨就是混合,貼着梨的肯定不是梨,肯定是混合,那么貼着混合的肯定是梨。如果第一次拿的是梨也同理。

 

37. 25匹馬,速度都不同,一共5個賽道,不能計時,一次只能知道五匹馬的速度快慢,問至少需要多少場比賽才能分出前三名?

把這25匹馬分成5組,賽五場,然后每場最快的馬拿出來再賽一場,就知道最快的馬了,根據最后這場的前三名,找出它們之前所在的組,因為第四第五名的馬所在的組肯定不會有哪匹馬能成為2、3名,對於最后一輪前三名所在的組,第一名所在的組中速度第2、3快的有可能成為所有馬中2、3快的,第二名所在的組中速度第1、2快的有可能成為所有馬中第2、3快的,然后第三名中速度最快的有可能成為所有馬中第3快的。這樣一來這五匹馬再賽一輪,取前兩名就是所有馬中第2、3快的。總共需要比7次。

 

38. 給10億個數排序

使用位圖bitmap,10億個數有10^9,假設里面最大的數是10^9,那么分成20組,每組5*10^7個,然后對於每個數字num,將bitset第num位置為1,總共遍歷20次就能完成排序。

bitset<10000000> bitmap將占用10000000bit的內存,也就是1250000Byte。

下面的代碼對10000000個數據進行排序,分兩次讀入,第一次讀入[0,5000000)范圍內的數據,第二次讀入[5000000,1000000)范圍內的數據。排序思想和技術排序一樣。

#include <cstdio>
#include <bitset>
#include <time.h>
#include <stdlib.h>
using namespace std;

const int max_each_scan = 5000000;  // 每次讀入的數字范圍

int main()
{
    clock_t begin = clock();   // 開始計時
    bitset<max_each_scan> bitmap;   // 位圖使用bitset
    
    FILE *fp_unsort_file = fopen("unsort.txt", "r");
    int num;
    while(fscanf(fp_unsort_file, "%d ", &num)!=EOF)
    {
        if(num < max_each_scan) bitmap.set(num, 1);   // 將第一組數據存入位圖中
    }

    FILE *fp_sort_file = fopen("sort.txt", "w");
    for(int i=0;i<max_each_scan;++i)
    {
        if(bitmap[i]) fprintf(fp_sort_file, "%d ", i);
    }
    
    int result=fseek(fp_unsort_file, 0, SEEK_SET);   // 將文件光標移動到文件的開始
    if(result) printf("fseek failed!\n");
    else
    {
        bitmap.reset();
        while(fscanf(fp_unsort_file, "%d ", &num)!=EOF)
        {
                        // 將第二組數據存入位圖中
            if(num >= max_each_scan && num < (max_each_scan<<1))
            {
                num -= max_each_scan;
                bitmap.set(num,1);
            }
        }
        for(int i=0;i<max_each_scan;++i)
        {
            if(bitmap[i]) fprintf(fp_sort_file, "%d ", i + max_each_scan);
        }
    }
    clock_t end=clock();   // 記錄程序運行結束的時間
    printf("Time cost is %ds\n",(end-begin)/CLOCKS_PER_SEC);
    fclose(fp_sort_file);
    fclose(fp_unsort_file);
    return 0;
}

 

39. 在10億條數據中找出重復出現次數最多的前n條

使用位圖的思想,將10^9的數據分成1000組,每組10^6個,然后對這10^9條數據進行1000次遍歷,注意沒法一次存到內存中,只能從文件中每次讀取一個,然后判斷當前數據是否在[0,10^6), [10^6,2*10^6), ... , [999*10^6,10^9)范圍內,對於每一組范圍都通過偏移將數據映射到[0,10^6)內部,統計其出現次數,然后使用優先隊列維護n個元素,用每一組范圍的統計結果來更新優先隊列即可。

如果指明數據時IP地址的話,由於IP地址是32位的,因此總共可能有2^32種情況存在,將其分為2^10組即可。

示例代碼:

#include <cstdio>
#include <queue>
#include <utility>
#include <string.h>
using namespace std;

int times[10000001];
const int max_each_scan = 10000000;
typedef pair<int,int> P;
priority_queue< P, vector<P>, greater<P> > q;

int main()
{
    FILE *unsort_file = fopen("data.txt", "r");
    for(int i=1;i<=10;++i)
    {
        int num;
        memset(times, 0, sizeof(times));
        while(fscanf(unsort_file, "%d", &num)==1)
        {
            if(max_each_scan*(i-1)<num && num<=max_each_scan*i) ++times[num-(i-1)*max_each_scan];
        }
        for(int j=1;j<=max_each_scan;++j) 
        {
            if(times[j])
            {
                q.push(P(times[j],j+(i-1)*max_each_scan));
                if(q.size() == 11) q.pop();
            }    
        }
        if(fseek(unsort_file, 0, SEEK_SET))
        {
            printf("fseek failed\n");
            return -1;
        }
    }
    while(!q.empty()) {printf("%d\n",q.top().second);q.pop();}
    return 0;
}

 

40. 要求在10億個32位整數中找到第k大的數,10億個數太多沒發存到內存中,只能存到文件中。兩種解法,一是可以將32位數分成兩段,開辟一個2^16大小的數組,然后遍歷所有數據,將每個數據高16位對應數組每個元素,統計每個區間的元素個數,然后判斷第k大的數在哪個區間中,這樣就確定了這個數據的高16位,之后再遍歷一遍,統計高16位滿足條件的數中低16位落到指定區間的個數,然后就可以判斷第k大的數是哪個了。

還有一種解法是用位圖的思想,將數據分成2^10個區間,每個區間長度都是2^22,使用優先隊列記錄每個區間前k大的數即可。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM