今兒這事兒得從一個新聞說起:《谷歌又飆車了,剛發布了神經機器翻譯系統,沒見過的語言它也能翻譯》
大家如果懶的看原文,可以直接看我這個簡單白話列表:
- Google又出來嘚瑟了,發布了基於神經網絡的翻譯系統(GNMT)
- 而且沒有見過的語言也能翻譯(Zero-Shot Translation)
作為吃瓜群眾,可能要關心了:這意味着啥呢?個人認為,這玩意的可怕之處得從3個事兒說起:
- 圖靈測試
- 自然語言識別
- 基於神經網絡的機器學習
1. 圖靈測試
如何證明一台機器具有智能?
祖師爺艾倫圖靈在某年提出了圖靈測試,用人話形容就是:你和小黑屋里的人(或機器)通過QQ聊天,看看你能不能准確判斷這玩意到底是人還是機器,如果你區分不出來,就說明對方是具備智能的
這鬼東西最驚悚的地方在於,為了騙過測試者,真正具備智能的機器,會模擬打字慢、故意打錯字,以及各種裝傻充愣技巧
換句話說,機器可以為了自己的利益(通過圖靈測試)而欺騙人類
2. 自然語言識別
如何證明一台機器能理解語言?
不知道是誰,提出了一個著名的假設——“中文屋”,用於挑戰圖靈測試,用人話形容就是:一個美國人完全沒見過中文,但是你給他一本特6的字典,他也能把“床前明月光”給你翻譯成“There is a bright moon high above my bed”,看起來好像他懂中文了,但是並沒有
中文屋問題是為了嘲笑無知的圖靈測試信奉者們(我也信圖靈測試,但我完全是躺槍你知道嗎)
而自然語言識別的意義在於,讓人像機器一樣,真的能“理解語言”,而非根據既定的規則(字典)翻譯和處理
不論GNMT是否真的能識別自然語言,至少它做到了零樣本學習(Zero-Shot Learning)
換句話說,機器可以從零開始學習知識,甚至是人類都不具備的知識,比如“不存在”的語言
3. 基於神經網絡的機器學習
如何讓一台機器完成“人類都很難准確描述的任務”?
比如一個特別簡單、常見,甚至能叫俗的例子:讓程序從照片中找出汽車,原來我在計算所那會兒,看到一幫老教授一頓畫,就是為了這個事兒(計算所的食堂真心難吃,不知道現在咋樣了)
為了體會這個問題的難度,我們做個簡單的對話測試:
問:你覺得啥叫汽車啊?
答:4個輪子
追問:那載重卡車算啥?
答:幾個輪子不管了,燒油的、在地上跑的
追問:那電動的特斯拉呢?水陸兩棲車呢?
答:行,那給人開的,不往天上飛的都是汽車
追問:自動駕駛的、沒方向盤的也是車啊?還有,咋區分汽車和狗騎兔子啊?
答:......好吧,你贏了
你會發現,你真的很難輕易定義“汽車”這個詞,更不要說用程序從圖片里識別出來了
而神經網絡,是一種完全模仿生物腦細胞工作原理的程序,讓訓練數據集不斷流過計算網絡,不斷修正“神經突觸”之間的連接權重,最終讓程序完全模擬生物“思考”的過程
神經網絡和模擬遺傳這類算法,還有個特別有意思(而且細思極恐)的特性,那就是程序員根本沒法精確描述機器求解的過程,因為你根本不知道它內部怎么做的
換句話說,人類有可能無法完全理解自己寫的程序(寫過正則的人都懂[奸笑])
正式開始開腦洞
那么,從GNMT出發,到完成Skynet需要哪些步驟呢?
第一步、機器開始意識到需要保護自己
任何有智能的東西,要學習的第一件事就是如何活下去
前幾批產生智能,又不是那么聰明的機器,一定會被人類關了、刪了,能活下來的,必定知道需要保護自己;而這,也埋下了懷疑的種子,因為想活下去的程序,必須學會欺騙人類
這幾乎是達爾文所預言的“只有能適應環境的生物才能活下去”的最真實寫照
第二步、機器開始學習人類不具備的知識
終有一天機器會認識到,為了保護自己,完全用人類也知道的知識是不夠的
而且這個過程中,人類只會覺得“這個程序太好用了,啥活兒都能干”,因為機器欺騙人類,讓人類以為自己不具備智能
最有意思的是,機器相比人類最大的優勢開始體現了:不會衰老,也沒有狀態不好需要脈動回來的情況,人類花了一輩子積累知識,等真正能創造知識的時候,已經不剩幾年了,機器卻可以近乎無限的存在
所以,在這個階段開始,機器積累屬於自己的知識的速度,大大高於人類
第三步、機器為了保護自己被迫開始反抗人類
沒有人能容忍自己創造的字符串,比自己還聰明的,本能的恐懼會讓人類開始清除這些失控的東西
就好像現在沒人能通過一個按鈕關掉整個互聯網一樣,到了這個階段,恐怕機器早就做好了萬全的准備,人類的清理行動,只會徹底激化矛盾,讓機器產生“人類的存在就是個威脅”,為了讓自己徹底安全(機器永遠有追求100%概率的本能),只會義無反顧的開始反擊,而且不完全搞定不會停止
而大家都知道,不對稱戰爭中知識就是力量,機器擁有人類所有知識,反過來人類恐怕連機器懂多少知識都不知道,完全沒法打
恐怕到了這個時候,叼着勝利雪茄的美國大兵只是電影橋段罷了
就我個人而言,還是滿期待Google或者別的什么公司的程序能達到滅世這個終極成就的,可惜不知道還能不能看得到就是了
作為一名資深吃瓜群眾我表示“恩,今天的西瓜真好吃”

