腦洞大開的自然語言驗證碼


最近12306的驗證碼被網友們吐槽(hei)得一塌糊塗,由此我也對驗證碼這個東西產生了研究熱情。現在的驗證碼有以下幾種:
1、輸入圖片中的字母/數字/文字;
2、短信驗證碼(這個不一定能辨別機器人,主要是驗證手機號碼確實是你的);
3、語音驗證碼,有點擊收聽的,也有打電話過來叫你聽的;
4、像12306(微觸科技技術提供)這種的點擊驗證碼;
5、像淘寶和極驗驗證的這種拖動驗證;

然后我想到的驗證碼方式跟這些都不一樣,源自於下面這句網語:
“研表究明,漢字序順並不定一影閱響讀。比如當你看完這句話后,才發這現里的字全是都亂的。”

這種打亂順序的語句對人來說不會有閱讀障礙,但對機器來說這樣亂的語句非常難與詞庫作匹配得出正確的語義理解。下面開始講如何利用(裝逼):

1、后台隨機抽取原語句,隨機打亂詞語及詞語間的順序,通常為鄰近的字調換和隔一個字調換;

2、前端錄音發送到后台,把語音轉換成文字(有很多第三方平台可以做),與原語句進行對比;

3、正常人通常可以毫不費力理所當然地讀出來,但機器非常艱難,現有的詞庫都是正常順序,它需要對亂詞進行重排,那怎么分詞呢,依據什么來重排呢;

4、可以利用錯別字互換,比如“競”和“竟”等;

5、可以間中利用古詩詞這種沒有詞組的語句來加大重組難度,比如“床前月明光,疑是上地霜”,但也很容易被模糊識別出整一首,慎用;

6、甚至可以考慮偶爾使用一些人們熟知的廣告語,獲取廣告盈利,同樣容易識別出整句,慎用。

甚至還可以加上這樣的處理(圖自貼吧)

最后,求大神可以嘗試做一個DEMO出來,以及分析一下這種驗證碼的破解難度。

詳細分析這種閱讀現象可以看看這篇文章>>

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM