@鮮宏大牛果斷使用js將搶書的誤差提高到毫秒級, wid表示真心的很佩服鮮宏大牛!
wid的水平雖說不怎么樣, 但內心說, wid也想嘗試着將搶書的誤差提高到毫秒級, 思考了一會, 還真有思路了! 現分享給大家, 權當拋磚引玉, 期待更加精妙的算法!
·思路簡介:
在這個湯姆大叔送書的活動中, 時間是關鍵, 如果能抓准服務器的時間, 可以說勝算將得到很大的提高, 如何抓取服務器時間? 我們知道在通過HTTP對服務器發起請求時, 在響應的服務器頭文件中包含所請求網頁的相關條件信息, 其中有個Date頭域, 里面記錄着相關的時間, 我們就通過這個來獲取cnblogs的服務器時間。
更多關於服務器頭文件響應的介紹, 請點擊這里.
直接來看相關的代碼:
#!/usr/bin/python #------------------------------------------------------------------------------- # Name: GrabBook.py # Purpose: # # Author: Mr.Wid # # Created: 22-10-2012 # Copyright: (c) Mr.Wid 2012 # Licence: GNU GPL #------------------------------------------------------------------------------- import re import time import urllib import urllib2 import httplib import cookielib username = 'mr_wid' #你的用戶名, 改為你的 password = 'xxxxxxxx' #你的密碼 #先定義好編碼轉換函數 def en(x): return x.encode('utf-8') def cn(x): return x.decode('utf-8') #獲取cnblogs服務器時間 def GetCnblogsServerTime(): """獲取cnblogs服務器時間 GetCnblogsServerTime() -> list NOTE: 原理是通過服務器頭文件響應獲取服務器時間 """ conn = httplib.HTTPConnection( 'www.cnblogs.com' ) conn.request( 'GET', '/' ) response = conn.getresponse() ts = response.getheader('date') ltime = time.strptime( ts[5:25], '%d %b %Y %H:%M:%S' ) #按照特定時間格式將字符串轉換為時間類型 serverTime = time.strftime( '%H:%M:%S', time.localtime(time.mktime(ltime)+ 8*3600 )).split(':') #將GMT時間轉換為北京時間並以列表形式返回, -> [ hour, minute, second ] return serverTime #登錄博客園 def cnblogs_login(): """登錄博客園 cnblogs_login() -> None """ params_post = urllib.urlencode({ '__EVENTTARGET': '', '__EVENTARGUMENT': '', '__VIEWSTATE': r'/wEPDwULLTE1MzYzODg2NzZkGAEFHl9fQ29udHJvbHNSZXF1aXJlUG9zdEJhY2tLZXlfXxYBBQtjaGtSZW1lbWJlcm1QYDyKKI9af4b67Mzq2xFaL9Bt', '__EVENTVALIDATION': r'/wEWBQLWwpqPDQLyj/OQAgK3jsrkBALR55GJDgKC3IeGDE1m7t2mGlasoP1Hd9hLaFoI2G05', 'tbUserName':en(username), 'tbPassword':en(password), 'btnLogin':en('登錄') }) cookie=cookielib.CookieJar() opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie)) urllib2.install_opener(opener) login_response=urllib2.urlopen('http://passport.cnblogs.com/login.aspx?',params_post) #給大叔發表一條評論 def PuhsishContent( content ): """給大叔發表一條評論 PuhsishContent( string content ) -> None """ comment_post = urllib.urlencode({ '__VIEWSTATE':en('/wEPDwUJNDYwODU2NjU1ZGQ='), 'txbComment': en(content), 'btnSubmint': en('提交評論') }) page = urllib2.urlopen( r'http://m.cnblogs.com/mobileAddComment.aspx?id=101461&entry=2733027', comment_post ) data = page.read() page.close() print cn( data ) #開始搶書 def PuhsishContentInTime(): luckHour = [ 10, 12, 14, 16, 18, 20 ] #這是幸運小時數 cnblogs_login() #登錄博客園 while True: serverTime = GetCnblogsServerTime() #獲取服務器時間 print serverTime if int(serverTime[0]) in luckHour and int(serverTime[1]) == 59: #當最新評論的分鍾數為59分59秒時准備搶書 for i in range( int(serverTime[2]), 60 ): #進入最后倒計時階段
time.sleep(1) time.sleep(0.75) #在59分59秒750毫秒時開始提交評論, 可自行調節毫秒數, sleep參數單位為秒 PuhsishContent( '大叔我來搶書啦~搶搶搶搶搶......' ) print '搶書任務完成, 下一輪搶書任何將在55分鍾后自動執行, 等待...' time.sleep(55 * 60) #休息55分鍾, 湯姆大叔說了, 連評無效
#time.sleep(1) #休息1秒再獲取服務器時間
#執行搶書動作 PuhsishContentInTime() #這次真可以慢慢掛這個搶書了, 掛三天說不定就真有了!
在
time.sleep(0.75) #59分59秒后延遲750毫秒后開始搶書, 可自行調節毫秒數, sleep參數為秒
這行就是可自行調節的毫秒數, 輸入小數表示毫秒級。
提示: 這里是使用了一個while True的死循環, 在獲取時間是會產生大量的請求, 如果cnblogs一定時間內的請求數量有限制的話, 可以在while True里加上time.sleep(1)休息一秒再獲取服務器時間, 對搶書的動作執行是沒多大影響的, 在示例代碼中我已將該句添加, 但是又將其注釋掉了,
#time.sleep(1) ##休息1秒再獲取服務器時間
這樣就會產生大量的請求, 注釋掉的原因是為了可以方便的查看每秒能產生多少次請求, 即每秒與服務器時間校對的頻率, wid這平均每秒校對15次左右, 確保時間與服務器同步, 剩下的就僅是網絡的延遲問題了。
期待更加精妙的算法!
--------------------
wid, 2012.10.22