刷票一般要突破以下限制:
1、驗證碼識別
2、同一ip不可連續投票
解決辦法
1、用tesseract工具,鏈接在此 https://code.google.com/p/tesseract-ocr/ (人人還是加不了https鏈接)
2、使用代理,國內可以的代理服務器可以從這里找到 http://cn-proxy.com/
程序語言當然用python
瀏覽器投票的流程如下
1、向服務器發送請求,服務器返回驗證碼和表單
2、填好表單,發送到服務器
可以用firefox+httpfox插件查看整個事件過程,以及發送請求的POST和GET數據格式
使用python的urllib2庫實現上述過程
1、向服務器請求驗證碼
可以用
+BEGIN python
import urllib
urllib.urlretrieve(imgurl,imgfile)#imgurl可以從頁面源代碼找到
+END
但是由於每次請求服務器,都會重新生成驗證碼,所以這樣請求道的驗證碼即便識別出來,再POST進去時也會提示錯誤。解決辦法時使用cookie
+BEGIN python
import cookie
import urllib2
cookiejar=cookielib.MozillaCookieJar(cookieFilename)
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar))
response=opener.open(imgurl)
+END
如果需要使用代理服務器,則可以這樣寫
+BEGIN python
import cookie
import urllib2
proxy_line='127.0.0.1:8087'
cookieFilename='cookie.txt'
cookiejar=cookielib.MozillaCookieJar(cookieFilename)
opener=urllib2.build_opener(urllib2.ProxyHandler({'http':proxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar))
response=opener.open(imgurl,timeout=2)#設置超時時間
+END
這樣就是以本機8087端口帶有cookie驗證訪問服務器,下一步識別出驗證碼,依然帶cookie POST進服務器即可。
2、保存驗證碼到本地
上面response即返回得到的驗證碼二進制流,寫入文件用下面代碼
+BEGIN python
content=response.read()
fp=file(imgfile,'wb')#將二進制圖片保存
fp.write(content)
fp.close()
+END
3、驗證碼識別
驗證碼識別用tesseract,由於tesseract沒有提供python接口,這里用系統調用外部命令
用法為
+BEGIN python
import os
imgfile='img.jpg'
out
用python刷票
# -*- coding: utf-8 -*- import os import urllib import urllib2 import string import socks import httplib2 import cookielib import time import random tes='tesseract.exe' filepath='./' imgurl='http://example.com/vote/img.jsp' myurl="http://example.com/vote" voteInfoId='xxxxxxxx' headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'}#, # 'Cookie':'324E661DE12427BD71CE63DF436A80D1'} imgfile=filepath + '/img.jpg' outfile=filepath + '/out' proxy_file=filepath+'/proxy.txt' user_file=filepath+'/user2.txt' cookieFilename=filepath +'/cookies.txt' #myproxy_line='211.142.236.137:80' #cookieJarFileLWP=cookielib.LWPCookieJar(cookieFilename) cookieFileJar=cookielib.FileCookieJar(cookieFilename) #opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieMozillaJar)) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieFileJar)) f_user=open(user_file) f_proxy=open(proxy_file) proxy_all=f_proxy.read().split('\n') f_user=open(user_file) user_all=f_user.read().split('\n') count=1 cookieFileJar=cookielib.FileCookieJar(cookieFilename)#使用cookie登陸 while True: i=random.randint(1,100) j=random.randint(1,60) #print user_all.length() user_line=user_all[i] myproxy_line=proxy_all[j] for myproxy_line in [myproxy_line]:#f_proxy: #使用代理和cookie opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar)) try: response2=opener.open(imgurl,timeout=1)#返回二進制圖片 except Exception,e: print 'I can not connect the server,try again' continue content=response2.read() fp=file(imgfile,'wb')#將二進制圖片保存 fp.write(content) fp.close() outcmd="%s %s %s -l eng digits -psm 7" %(tes,imgfile,outfile) print 'I begin to recognize the CAPTCHA code ..' os.system(outcmd) code_file=open(filepath+'/out.txt') mycode_line=code_file.readline() code_file.close() if len(mycode_line)<=3: print 'I guess the CAPTCHA code is %s,but I think it\'s error.' % (mycode_line) continue mycode=mycode_line[0:4] print 'I guess the CAPTCHA code is %s' % (mycode) mylist=user_line.split('----') proxy_list=myproxy_line.split(':') myid=mylist[0]#.decode('utf-8') myname=mylist[1]#.decode('utf-8') mycomm=mylist[2]#.decode('utf-8') data={'method':'vote', 'voteInfoId':voteInfoId, 'forward':'***', 'info1':myid, 'info2':myname, 'info3':mycomm, 'inputCode':mycode, 'submit':'確定'} print 'Now I begin to vote...' print 'the user is %s' % (myid) print 'the name is %s' % (myname) print 'the comment is %s' % (mycomm) post_data=urllib.urlencode(data) try: response=opener.open(myurl,post_data) except Exception,e: print 'I can\'t connect the server ,so vote is failure' continue content=response.read() #img_req=opener.open(imgurl) #cookieFileJar.save(cookieFilename) #req=opener.open(myurl,post_data) #req=urllib2.Request(myurl,data=post_data,headers=headers) fp=file('test.html','w') print 'I put the received html to the file test.html' fp.write(content) fp.close() #outcmd="%s %s %s" %(tes,imgfile,outfile) #count+=1 #print cookieFileJar
日志說明在人人上