特斯拉超級計算機Dojo!
2021年8月15日,特斯拉官方發布海報,預熱“特斯拉 AI 日”活動。官方表示,本次活動預計在北京時間8月20日上午9點舉行,屆時將“邀你見證人工智能的又一次革新”。在這張底色為黑色的海報上,一顆大規模芯片模組的結構圖格外吸睛。此前,Dojo公開在推特上為“特斯拉AI日”打call,所以不少人猜測,該結構圖展示的可能是特斯拉為超級計算機Dojo設計的專用芯片。早在2019年的Autonomous Day上,馬斯克就提到過Dojo,稱Dojo是能夠利用海量視頻數據,做無人監管標注和訓練的超級計算機。具備如此優異性能的AI芯片很可能在這幾天里揭開神秘的面紗,這讓全球從事AI行業的人們一下子就坐不住了。
Dojo的發音源自日語,意指柔道中的練功房。Dojo芯片不僅名字帶着“武俠氣息”,功能也十分強大,這一點從海報上“層層疊起”的芯片模組結構圖中或許可以窺得一二。
有業內人士對海報上的這張芯片圖進行了解讀。該業內人士認為,圖中的芯片采用了非常規封裝形式,第一層和第五層銅質結構是水冷散熱模塊;紅色圈出的第二層結構由“5*5陣列”共25顆芯片組成;第三層為25個陣列核心的BGA封裝基板;第四層和第七層可能是物理承載結構附帶一些導熱屬性;第六層或許是功率模塊,上面豎着的黑色長條很可能是穿過散熱與芯片進行高速通信的互聯模塊。
雖然在該芯片正式推出之前一切都是猜測,但特斯拉在AI芯片領域的野心早已路人皆知。早在2019年的Autonomous Day上,馬斯克就提到過Dojo,稱Dojo是“能夠利用海量視頻數據,做無人監管標注和訓練的超級計算機”。
馬斯克的這番話有兩個重點。第一個重點是海量數據的收集。自動駕駛需要搜集大量數據,進行神經網絡訓練,讓車輛變得更聰明。現階段,特斯拉車輛在特定觸發條件下會對自動駕駛中的有效數據進行收集,但獲取到的數據量非常龐大。在這種情況下,作為特斯拉自身軟件優化過的定制超算,Dojo芯片能夠大大提升數據運算效率。
馬斯克口中的“做無人監管標注和訓練”是第二個重點。Alpha Go擊敗世界圍棋大師的案例大家都耳熟能詳,無監督訓練的范例—Alpha Zero。通過對弈,Alpha Zero僅僅用了三天時間就擊敗了Alpha Go Lee,用21天打到了“Alpha Master”水平,一時間難覓對手。特斯拉的“無人監管標注和訓練”與Alpha Zero的無監督訓練一樣,指的是系統自身通過海量數據和以前學習的結果進行自動標注和調整,在無需海量研究人員的情況下對神經網絡訓練進行監督,大幅提升訓練效率。
通過高效收集海量數據,對數據進行超高效率計算,能夠做無監督訓練的Dojo芯片給AI建了一間“練功房”。走出這間“練功房”后,Dojo芯片很可能與Alpha Zero一樣,短期內在各自的領域難覓對手。
自動駕駛的必然選擇
特斯拉成功自研的FSD芯片是一款高性能、為自動駕駛安全保駕護航的專屬芯片,發布時在設計定制上做到了極致,更適應基於神經網絡的計算。FSD芯片的高智能化並不足以讓馬斯克感到滿足。通過研發Dojo芯片,馬斯克想在自動駕駛領域下更大的一盤棋。
研發Dojo芯片其實是走穩、走好自動駕駛之路。盡管業內風頭無兩的FSD芯片功能強大,但正如特斯拉在車主手冊和網站中警告的那樣,特斯拉的自動駕駛和FSD需要人類主動監督。一位忽視這個警告的特斯拉車主很快就為大意付出了代價。這位特斯拉車主曾在社交媒體上發布了使用自動駕駛功能的視頻。在視頻中,沒有把手放在方向盤上。2021年5月份他在南加州的一次車禍中死亡。在各種事故頻發的背景下,FSD芯片或許需要更強大的AI芯片來“接棒”。目前來看,Dojo芯片極有可能就是下一位關鍵的“接棒者”。
馬斯克曾在推特上說,只有解決了真實世界的AI問題,才能解決自動駕駛問題。特斯拉在軟硬件方面均專注於此。無數的邊緣場景只能通過真實世界的視覺AI來解決,因為整個世界的道路就是按照人類的認知來建立的。確實,目前自動駕駛領域最需要解決的難題就是感知。
特斯拉搞超算做什么?
CVPR自動駕駛工作坊的演講中,特斯拉的AI帶頭人,高級工程師Karpathy介紹了特斯拉超級計算機的基本情況。
這台計算機群采用了5760個算力為321TFLOPS的英偉達A100顯卡,組成了720個節點,總算力突破了1.8EFLOPS,10PB的存儲空間(讀寫速度為1.6TBps)。
根據計算能力來看,這台超級計算機排名世界第五。
不僅如此,特斯拉表示,不排除給其他公司提供超級計算機集群的可能性。
目前排名第一的超算是日本的「富岳」,在機器學習應用上的算力超頻之后是2.15EFLOPS,默頻是1.95EFLOPS。
與使用顯卡的超算不同,「富岳」使用的是基於ARM架構的A64FX處理器。
「肉」腦駕駛員不行,還是得上「硅」腦
Karpathy在演示中強調,特斯拉將堅定不移地將計算機視覺技術作為自動駕駛的核心,並且將自研的超級計算機用於神經網絡的研究中去。
Karpathy列舉了「肉腦」的幾大罪證:反應慢(250ms);需要轉頭和看后視鏡來判斷環境;不好好開車,喜歡玩兒手機。
緊接着就表示,「硅」腦不僅反應快,而且開車全神貫注,不會時不時地就去刷Ins。
以特斯拉的風格,但凡講到自動駕駛,就一定要懟一下那個又貴又不好用的Lidar。
Karpathy 分享了特斯拉超級計算機如何利用計算機視覺來糾正駕駛員不良行為的一些場景,包括緊急制動、交通參與者監測以及紅綠燈識別等等。
另外在演示中,Karpathy還展示了被稱為踏板誤用糾正的功能:當車輛檢測到前方有行人或者道路變窄的情況時,當駕駛員把油門當做剎車踩下,車輛則不會加速。
這項功能推出后不知道那些關於特斯拉失控的報道會不會有所減少。
經過多年研究,特斯拉團隊相信通過監督學習,實現車輛視覺系統對於外界的感知是一個正確的路線。
目前特斯拉已經有超過100萬個大約為10秒鍾的視頻,標注出了視頻中60億個物體的距離、加速度以及速度信息,這些數據量高達1.5PB。
要讓特斯拉自己的這套自動駕駛AI達到足夠的可靠性,還需要更多的時間,這也是為什么特斯拉要制造超級計算機的原因。
這台超級計算機還不是特斯拉的終極目標,根據馬斯克的計划,特斯拉未來的Dojo超級計算機算力將要達到每秒鍾exaFLOP的級別,也就是百萬億億次浮點運算。
運算速度還要超過「富岳」,成為世界第一。
Dojo:給AI打造的「練功房」
特斯拉在去年的自動駕駛大會上公布了Dojo計划:Dojo將會成為特斯拉用於研發自動駕駛技術的平台。
在2020年的自動駕駛技術日上,馬斯克不僅向公眾展示了由Jim Keller帶隊研發出來的FSD芯片(目前算力最高的駕駛輔助芯片之一),宣布了特斯拉未來將會成為一家Robotaxti公司的野心。
Dojo是特斯拉在自動駕駛之路上一個不可或缺的技術平台。
Dojo發音源自日語,意為在冥想術或者武術中的「練功房」。
未來1.5PB的數據將在這里「刻苦修煉」。
在超高算力的支持下,特斯拉將會在視覺感知的自動駕駛技術路線上一路狂奔。
馬斯克說過,特斯拉就是一系列初創公司的集合,超級計算機可以看做其中一個初創公司的項目。
英特爾、AMD這些芯片大佬們沒想到,居然從汽車圈里突然跑出來一個如此強大的對手。
參考鏈接:
https://www.sohu.com/a/484014485_121134737
https://baijiahao.baidu.com/s?id=1703249429563610941&wfr=spider&for=pc