手把手使用Python教你破解谷歌(Google)人機驗證碼—上篇


/1 前言/

  今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜索引擎了,我們可以借助Google龐大的搜索資源找到一些自己想要的資源,可能是一些收費電影,可能是一些奇門小說,可能是某個角落的種子,不管怎么說,Google搜索還是挺給力的,但是呢,有梯子的我們可能都遇到過,我們搜索的多了,會有下圖的這種情況。

 

  這種驗證碼呢,叫做ReCaptcha驗證碼,相對來說,是比較繁瑣的驗證碼之一。

  當然了,ReCaptcha不止谷歌一家在用,國外的網站很多都是使用這種驗證碼,但是在國內不多,因為在國內比較容易被牆,所以用的少。但是我們是高端玩家,在自由的Internet中,我們怎么可能只局限於國內,下面,我們就針對ReCaptcha驗證碼進行破解。

/2 測試網站預覽/

  測試網站:https://www.google.com/recaptcha/api2/demo

  谷歌提供的范例,實際網站驗證碼和這個一模一樣。

  ReCaptcha驗證碼樣式,如下圖所示。

 

/3 為什么使用第三方平台/

  今天呢,咱們來說一下Google,我們都知道,Google是目前地表最強的搜索引擎了。老讀者們可能知道,年前的時候我用第三方服務破解了B站的登錄,沒有來得及上車的小伙伴可以戳這兩篇文章:干貨|Python大佬手把手帶你破解嗶哩嗶哩網滑動驗證(上篇)干貨|Python大佬手把手帶你破解嗶哩嗶哩網滑動驗證(下篇)。但是經常逛B站的小伙伴們肯定都知道B站目前已經更改了登錄方式,想了解之前B站自動登錄的小伙伴可以戳這里:Python奇淫技巧之自動登錄嗶哩嗶哩,所以我那篇文章真是趕上了末班車,但是然並卵,現在肯定是登錄不了了。后期有時間,給大家整理一篇關於B站破解的新文章學習一下。

  嗯,看到這可能有人會對我不屑一顧,說辣雞才會用第三方平台,要是按照技術來划分的話,我是真的辣雞,哈哈~~

  但是這里要抬杠一下,並不是說用第三方平台就是辣雞,我們可以想象一下,如果是滑動驗證碼,我們當然有一試的能力,python可以調用OpenCV,看看文檔,當然是可以實現了。但是有個問題是,你可能針對的一個網站的滑動驗證識別好了,但是在每個網站的滑動驗證碼都不太一樣的情況下,在用OpenCV識別的時候,可能就會出現識別率低的情況。要是在公司,一直完不成任務,嗯,,,等着被炒魷魚吧,再說,像谷歌人機個人也解決不了,沒有NB的機器學習是不可能的,所以只能用第三方平台,畢竟,完成任務才是首要任務。

  話不多說,這里選用的第三方平台:https://2captcha.com/zh?from=8779379。

 

/4 為什么使用第三方平台/

  我們先來了解一下現在打碼平台機制大概都有哪些,不是很全面,但是可以參考一下。

  第一種呢:就是打碼平台訓練好各種各樣的數據,比如,哪些是花,哪些是車,然后我們把圖片發送給打碼平台,他給我們結果,但是這樣會有個問題,如果訓練的不好,我們這邊的結果也是很不好的,各種不准確,影響效果

  第二種:就是平台雇人,我們把整個驗證碼都給打碼平台,平台找人幫助我們點擊,然后把結果給我們,我們在登錄了或者做其他

  我們可以看出來,肯定是第二種更加靈活的,現在階段,機器再NB,至少 在驗證碼上准確率還是不如我們人類這么機智的。

  2captcha平台目前采用的就是第二種方式,賺取的是中間差價,但是識別率是我用過最高的,曾經因為選錯了平台,一直不成功,加班加點,鼠標都被我砸壞了,唉,所以,選擇一個合適的平台還是很重要的

 

/5 所需工具/

  Chromedriver:瀏覽器驅動,可以理解為一個沒有界面的chrome瀏覽器。

  Selenium:用於模擬人對瀏覽器進行點擊、輸出、拖拽等操作,就相當於是個人在使用瀏覽器,也常常用來應付反爬蟲措施。

 

/6 總結/

  寫到這里,文章字數已經將近2000字了,介於篇幅原因,這篇文章主要介紹了第三方打碼平台(點擊閱讀原文可以獲取)和破解的理論部分,下一篇文章將詳細介紹破解谷歌人機的具體過程,下篇文章會配上較多的圖和代碼,小伙伴們敬請期待吧!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM