AI專家一席談:復用算法、模型、案例,AI Gallery帶你快速上手應用開發


摘要: 華為雲社區邀請到了AI Gallery的負責人嚴博,聽他談一談AI Gallery的設計初衷、經典案例以及未來規划。

本文分享自華為雲社區《AI專家一席談:復用算法、模型、案例,AI Gallery帶你快速上手應用開發》,作者:華為雲社區精選 。

你見過哪些有趣又實用的AI開發案例呢?

比如讓靜態照片上的人物開口唱歌,動漫角色也可以哦;再比如通過識別各類野生動物並分析種群結構,進而實施保護;又或者智能檢測口罩佩戴的規范性,助力疫情防護……

這些場景化的AI案例,都可以在華為雲AI Gallery上找到對應的模型,通過不斷訓練,你也可以實現。AI Gallery上擁有算法、模型、數據、Notebook等豐富而優質的AI資產, 開發者可以直接復用這些資產,解決AI應用開發的難題。

縱觀AI應用的整個開發流程,從數據采集、標注,到算法模型的構建,每個環節都會產生許多可以復用的AI資產,而AI Gallery的目的就是充分發揮這些資產的效用,提高AI開發效率。

那么,它是如何匯聚這些AI資產,又是如何讓資產效用最大化地幫助到開發者高效的進行AI開發呢?

華為雲社區邀請到了AI Gallery的負責人嚴博士,聽他談一談AI Gallery的設計初衷、經典案例以及未來規划。

人工智能有三駕馬車:數據、算法、算力。從這三點看,當前的AI應用開發進入到了什么階段?

人工智能是人類在不斷探索和發展一個領域,因為事先沒有定義好有哪些階段,所以很難回答我們當前處在哪個階段。但是有一個很明顯的感知,人工智能發展比10年之前有顯著的進步,大量應用也越來越多。

這個契機是2012年以深度學習為代表的一類算法得到突破。 在此之前,大家更關注的是算法,大家都是在用數據降維和一些分類器的方案去做機器學習相關的AI開發,訓練的數據體量也很小。

在2012年的契機點上,有了算力的加持,再通過算法和大量的數據迭代,我們看到AI開發模型的精度有了量級的提升。 隨着這個量級提升之后,它能夠在更多的行業和領域去應用AI技術來提高生產力。

但是,當前這個階段人工智能還不能像人類那樣,可以通過少量數據的學習獲得邏輯推演能力。人工智能本質上還是通過大量的數據進行擬合和迭代,讓它能夠“記住”數據再去做一些推理,但它並不具備邏輯推演能力。不過,相比過去10年,AI最終的准確率已經有了提升,它的應用領域也進一步拓展。

往后展望,我們還會在算力上有進一步的突破,再加上整個算法和數據的加持,最終能訓練出精度更高,甚至是像人類那樣能夠獲得邏輯推演能力的AI。

一個完整的AI應用開發流程包括哪些環節,其中的挑戰是什么?

一般是三個流程。

第一個環節是數據准備, 需要采集數據,對數據進行清洗,轉換的工作。每一個環節都有自己的挑戰。以數據為例,采集階段會有政策法律上的限制,數據孤島很難被打破。另外還要對數據進行有效的標注,這需要大量的人力才能完成,經濟成本較高。

第二個階段是建模, 基於准備好的數據,選擇合適的算法,開發相關的模型。要考慮訓練出來的模型的應用場景。比如AI應用是放在移動端上的,還是放在雲端服務器上,這兩者對推理的時延、准確率的要求都是不同的。因此AI開發的建模過程,要綜合理解AI應用的場景,再去選擇合適的算法工藝架構。它和只追求精度或者推理速度的學術領域不一樣,我們需綜合考慮,所以挑戰比較高。

第三個階段是基於模型來進行具體的AI應用的開發, 它圍繞具體的應用場景,配合開發一些IT系統、軟件、UI交互等。比如算法工程師負責建模開發,到了應用開發階段可能是由應用工程師承擔,它的角色是變換的。作為應用開發工程師,收到的是已經開發完的模型,但這個模型推理的時延和精度可能都達不到理想狀態。這個時候就要通過壓縮,蒸餾的技術進一步優化它。如果精度達不到,還得考慮最終這個應用是否能夠通過一些巧妙設計來規避這些問題。

AI Gallery是不是為了解決上述環節中的一些問題?它的設計初衷是什么?

現在很多開發流程都是平台化的,AI開發的每個階段都會產生一些數字資產:算法、模型、數據集,可能還有一些處理的函數、方法之類的。我們希望有一個地方能夠把這些東西都沉淀和積累下來,以方便后續的開發者復用之前的一些成果, 這也是我們設計AI Gallery的初衷。

當越來越多的開發者分享各種場景下的AI資產,AI Gallery可以包含全場景各種精度的實驗,這時其他開發者也能根據最終的開發場景直接拿來即用這些資產。

打個比方,AI開發的三個階段可能是由不同角色介入的,如果應用工程師想介入到AI開發中,但又缺少相應的數據和算法工程師該怎么辦?AI Gallery里就有訓練好的模型,應用工程師拿來即用就可以了。從這個角度來看,它可以提高整體的開發效率。

開發者選擇算法或者模型首要考量是什么?在這一點上,AI Gallery是如何應對的?

如果是選數據的話,一般是基於它的行業和領域場景,看有沒有合適的數據,這個是跟領域和行業強相關的。當前我們提供了數據的分享的機制,有很多開發者已經共享了開源標准場景的數據集,來供大家在ModelArts上快速地驗證自己的想法。

算法方面,開發者首要考量的是算法最后產生的模型是不是自己想要的,以及算法在訓練時的輸入數據格式,訓練所需的開銷、運行算法的環境等等。

模型方面,先要明確應用開發是部署在雲上、邊緣側,還是端側,這對於最后的應用場景很重要。其次是推理的時延,諸如醫療場景的數據會很大,它的推理就是異步的,但有些場景要求的是實時推理,可能對推理響應的時間要求很高。最后是精度,要評估應用場景對精度的敏感度。

綜上,在AI開發的每一個階段,都有很多需要考慮的指標、量綱。我們要做的就是把這些量綱和指標准化出來,能夠讓發布AI資產的開發者填寫這些指標,方便使用的人去瀏覽、篩選和檢索,快速找到他想要的東西。

AI Gallery有哪些經典案例可以給開發者介紹一下?

對於視覺領域的一些經典算法如YOLO、ResNet50,官方已經做了大量的適配,但這些算法其實沒有沉淀到這個領域和行業里面的。因此我們基於內部的一些項目,也去做了一些AI的實踐案例。比如說水表讀數,安全帽檢測等等。這些案例可能是使用同一個具體的算法,但是應用在不同的領域和行業場景。

后續會讓我們的伙伴、高校的老師、開發者一起來分享他們的案例,這樣,其他的開發者也能通過閱讀這些案例快速的復現,加速整個端到端的開發。

在此也為大家推薦一些AI Gallery上的經典案例:

安全帽檢測水表讀數識別工地場景的鋼筋盤點使用PPO算法玩超級馬里奧兄弟與中國象棋AI對戰

像工業安全帽檢測、水表讀數,都是基於華為在行業內的一些項目沉淀出來的案例。這些案例生產的模型可以達到工業級的要求,它可以直接部署使用。唯一的區別是數據,當前我們只提供一個樣例的數據,如果大家能夠采集到更多更好的數據,訓練出來的模型精度也會非常不錯。

在AI Gallery發布AI資產后,開發者能享受到什么權益?

對於ISV伙伴來說,AI Gallery是和華為雲雲市場打通的,因此他們可以上架雲市場,商業售賣資產模型,直接獲得商業利益。

對於開發者來說,當前更多的是個人成就和榮譽的提升。后續我們也在積極的引入個人開發者計划,讓普通的個人開發者去參與到整個項目之中,真正地進入到實戰環節,既能獲得實踐的鍛煉,也能夠得到經濟上的回報。

AI Gallery是如何助力普惠AI的?

一是資產和案例的積累。 當前已經有很多開發者在AI Gallery上貢獻主流的開源數據集,其他人直接驗證算法時可以拿來即用。在算法和模型方面,官方也已經把很多常用算法做了預集成。高校也在將一些經典論文的算法發布到AI Gallery分享。

二是分享機制。 開發者可以把算法和模型分享到AI Gallery,然后我們正在嘗試采取一些激勵的機制,讓他們更有動力分享。

三是針對端到端的案例場景,我們上線了案例庫。 當前案例雖然還不是很多,但后續華為官方以及ISV、伙伴、個人開發者會陸續將開發和交付的項目案例總結發布進來,讓廣大開發者通過學習這些案例來加速應用開發過程。

AI Gallery的未來規划是怎樣的?

第一個方向是加速行業和企業的AI應用落地。 首先就是通過資產沉淀提高AI開發效率。其次是我們正在做項目的需求廣場,以及開發者的認證機制,通過減少開發環節的鏈路,讓更多的開發者和伙伴通過AI Gallery開發和交付AI項目,最終幫助行業和企業解決問題,加速應用的落地。

另一個方向主要是面向學習教育的場景。 現在我們基於大量的算力和數據去做迭代式的訓練和開發,但很多高校的硬件可能跟不上,需要在雲上進行教學實踐。所以面向教育行業,面向個人開發者學習的場景,我們也打算做一些事情,包括教學課程,論文解讀等等。

最終我們希望把這兩條線打通,既能提供教學培訓、學習的一站式解決方案,也能夠讓開發者把學習到的知識通過真實的交付場景實踐出來。

 

點擊關注,第一時間了解華為雲新鮮技術~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM