/1 前言/
今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜索引擎了,我們可以借助Google龐大的搜索資源找到一些自己想要的資源,可能是一些收費電影,可能是一些奇門小說,可能是某個角落的種子,不管怎么說,Google搜索還是挺給力的,但是呢,有梯子的我們可能都遇到過,我們搜索的多了,會有下圖的這種情況。

這種驗證碼呢,叫做ReCaptcha驗證碼,相對來說,是比較繁瑣的驗證碼之一。
當然了,ReCaptcha不止谷歌一家在用,國外的網站很多都是使用這種驗證碼,但是在國內不多,因為在國內比較容易被牆,所以用的少。但是我們是高端玩家,在自由的Internet中,我們怎么可能只局限於國內,下面,我們就針對ReCaptcha驗證碼進行破解。
/2 測試網站預覽/
測試網站:https://www.google.com/recaptcha/api2/demo
谷歌提供的范例,實際網站驗證碼和這個一模一樣。
ReCaptcha驗證碼樣式,如下圖所示。

/3 為什么使用第三方平台/
今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜索引擎了。老讀者們可能知道,年前的時候我用第三方服務破解了B站的登錄,沒有來得及上車的小伙伴可以戳這兩篇文章:干貨|Python大佬手把手帶你破解嗶哩嗶哩網滑動驗證(上篇),干貨|Python大佬手把手帶你破解嗶哩嗶哩網滑動驗證(下篇)。但是經常逛B站的小伙伴們肯定都知道B站目前已經更改了登錄方式,想了解之前B站自動登錄的小伙伴可以戳這里:Python奇淫技巧之自動登錄嗶哩嗶哩,所以我那篇文章真是趕上了末班車,但是然並卵,現在肯定是登錄不了了。后期有時間,給大家整理一篇關於B站破解的新文章學習一下。
嗯,看到這可能有人會對我不屑一顧,說辣雞才會用第三方平台,要是按照技術來划分的話,我是真的辣雞,哈哈~~
但是這里要抬杠一下,並不是說用第三方平台就是辣雞,我們可以想象一下,如果是滑動驗證碼,我們當然有一試的能力,python可以調用OpenCV,看看文檔,當然是可以實現了。但是有個問題是,你可能針對的一個網站的滑動驗證識別好了,但是在每個網站的滑動驗證碼都不太一樣的情況下,在用OpenCV識別的時候,可能就會出現識別率低的情況。要是在公司,一直完不成任務,嗯,,,等着被炒魷魚吧,再說,像谷歌人機個人也解決不了,沒有NB的機器學習是不可能的,所以只能用第三方平台,畢竟,完成任務才是首要任務。
話不多說,這里選用的第三方平台:https://2captcha.com/zh?from=8779379。
/4 為什么使用第三方平台/
我們先來了解一下現在打碼平台機制大概都有哪些,不是很全面,但是可以參考一下。
第一種呢:就是打碼平台訓練好各種各樣的數據,比如,哪些是花,哪些是車,然后我們把圖片發送給打碼平台,他給我們結果,但是這樣會有個問題,如果訓練的不好,我們這邊的結果也是很不好的,各種不准確,影響效果
第二種:就是平台雇人,我們把整個驗證碼都給打碼平台,平台找人幫助我們點擊,然后把結果給我們,我們在登錄了或者做其他
我們可以看出來,肯定是第二種更加靈活的,現在階段,機器再NB,至少 在驗證碼上准確率還是不如我們人類這么機智的。
2captcha平台目前采用的就是第二種方式,賺取的是中間差價,但是識別率是我用過最高的,曾經因為選錯了平台,一直不成功,加班加點,鼠標都被我砸壞了,唉,所以,選擇一個合適的平台還是很重要的
/5 所需工具/
Chromedriver:瀏覽器驅動,可以理解為一個沒有界面的chrome瀏覽器。
Selenium:用於模擬人對瀏覽器進行點擊、輸出、拖拽等操作,就相當於是個人在使用瀏覽器,也常常用來應付反爬蟲措施。
/6 總結/
寫到這里,文章字數已經將近2000字了,介於篇幅原因,這篇文章主要介紹了第三方打碼平台(點擊閱讀原文可以獲取)和破解的理論部分,下一篇文章將詳細介紹破解谷歌人機的具體過程,下篇文章會配上較多的圖和代碼,小伙伴們敬請期待吧!