AI研討會直播:《人工智能開發前沿》實戰系列公開課第1期


報名鏈接:https://www.slidestalk.com/m/276?__fuid=31832

活動背景

業務需求、數據、算法、算力等因素,決定人工智能技術走向產業落地面臨各種挑戰。博客園聯合示說網以及產業內人工智能技術領域的工程師講師,結合實踐案例,推出《人工智能開發前沿》實戰系列公開課,將涵蓋邊緣到雲端、訓練到推理、算法模型到工程實踐等一系列人工智能實踐學習課程。課程內容詳實豐富,既包括前沿技術介紹和演示,也提供動手實操和練習項目。

歡迎廣大AI及大數據領域的開發者、學生、研究人員共同參與學習研討!

議程安排

19:30 – 20:15 《持久化內存技術在實時決策系統中的應用》
20:15 – 21:00 《Spark Shuffle RPMem擴展: 借助持久內存與RDMA加速Spark 數據分析》
21:00 – 21:05 活動抽獎

講師及議題

講師介紹陳宬,新加坡國立大學博士,第四范式高性能計算組,資深系統優化工程師,專注於新一代存儲介質在AI系統,數據庫以及操作系統層的優化。
議題介紹:實時決策系統,如實時推薦、實時反欺詐,要求系統在極短的時間內對用戶產生的數據進行處理,並拉取已訓練好的超高維模型進行打分預測。這一過程中將涉及實時特征提取,超高緯模型參數查詢等多步操作。為了滿足強實時性的要求,決策系統需要把用於提取特征的數據以及超高緯模型的參數存儲在DRAM內存中。在實際部署過程中,我們發現這部分內存數據量可以多達10TB級甚至更高。借助Intel Optane DC memory(PMEM)持久化內存高容量,持久化等特性,可以很好的降低實時決策系統內存數據的存儲成本,並大大加快傳統DRAM-based內存系統因節點失效所需的恢復時間。我們將介紹我們利用PMDK對第四范式自研的兩項核心科技:實時特征提取數據庫RTIDB和高緯參數服務器集群進行優化的成果。

講師介紹張建,英特爾亞太研發有限公司大數據部門的軟件工程經理,專注於大數據和機器學習中存儲方案優化。
議題介紹:Spark中Shuffle密集型的作業的性能通常會受限於Shuffle過程中磁盤I/O和CPU開銷。同時,很多工作證明簡單的用更快的存儲介質和網絡來加速Shuffle很難達到良好的效果。我們將介紹如何利用持久化內存與高性能RDMA網絡來加速Spark Shuffle。Spark Shuffle RPMem擴展提供了一個基於PMem和RDMA來加速Shuffle的方案,它采用PMem作為Shuffle的存儲介質,利用PMDK用戶態編程庫進行數據讀寫,減小用戶態、內核態切換與文件系統開銷;用基於RDMA網絡協議異構的傳輸層實現高性能數據傳輸;還將RDMA直接注冊在PMem上,減少內存拷貝。 初步測試結果表明,相對傳統Shuffle方案,Spark Shuffle RPMem擴展可以對Shuffle密集型作業帶來顯著的性能提升和時延下降。

活動支持

英特爾AI實踐日工作組

合作伙伴

博文視點

活動獎品(抽獎)

· 博文視點出版的技術書籍3本
· 100元JD電子購物卡3張

更多參會福利

· 前50位有效報名聽眾,將有機會獲得英特爾中國編寫的《制造行業AI實踐手冊》一本
· 所有有效報名的開發者聽眾,參會資格審核通過后會得到隨機紅包
· 所有在線開發者,根據在線時長、互動提問優質問題,獲得0.3-10元不等的隨機紅包

報名鏈接:https://www.slidestalk.com/m/276?__fuid=31832

掃二維碼報名:

掃二維碼報名:

</div<


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM