百度BML
一、產品介紹
百度機器學習BML(Baidu Machine Learning)是一款端到端的AI開發和部署平台。基於BML,用戶可以一站式完成數據處理、模型訓練與評估、服務部署等工作。平台提供了高性能的集群訓練環境,海量算法框架與模型案例,以及操作便捷的預測服務工具。用戶可以專注於模型與算法本身,並得到優質的模型與預測效果。
二、應用場景
BML可以幫助企業和開發者實現圖像識別、視頻分析、語音識別、推薦、預測等多種業務場景,賦能金融、教育、醫療、安防、零售、工業制造等多種行業。
用戶類型,工作區適合公民數據科學家,關注易用性和使用時長;訓練適合專家數據科學家,關注性能和資源利用率;預測適合業務管理和運維人員,關注性能和資源利用率。
模型訓練,支持多種深度/機器學習框架,一鍵發起大規模訓練作業,最大化提升訓練效率及效果。主要包括四部分:深度學習作業、機器學習作業、AutoDL作業、AutoML作業。
1.深度學習作業,集成了多種開源的深度學習框架。用戶可以使用不同的框架,編寫代碼進行多輪訓練和迭代,並將產生的模型和各種數據上傳到BOS存儲上。
2.機器學習作業,自主研發的豐富、高效、成熟的機器學習算法和開源RAPIDS-cuML GPU版本機器學習算法。主要應用於大數據的統計與分析、數據挖掘、模型訓練、商業智能等領域。
3.AutoDL作業,自動深度學習產品,利用先進的遷移學習或者神經網絡架構搜索技術,針對業務提供數據進行訓練。初學者只需提交數據便可得到高品質模型,經驗豐富的工程師拿到平台提供的高品質模型后可繼續研究。
4.AutoML作業,簡化算法建模和模型調參的繁瑣過程,自動進行超參數學習,進而自動構建高精度模型,節省人力,降低機器學習門檻。
三、產品特色
1.快速上手,點開即用的Jupyter Lab運行環境,內置多種框架和常用軟件包,為您免去配置環境帶來的困擾。同時支持多種Auto算法,簡化算法建模和模型調參的繁瑣過程,自動進行超參數學習,進而自動構建高精度模型,節省人力。
2.一站式開發和部署,在控制台進行簡單點擊或使用API調用,可一站式完成發起訓練任務、獲取訓練模型、啟動預測服務,覆蓋了AI開發&部署的全流程。
3.靈活,支持主流框架如TensorFlow/Pytorch/Keras/Caffe/Mxnet/PaddlePaddle/XGBoost/Scikit-Learn等,支持用戶CCE私有集群,CPU實例支持自定義第三方軟件庫。三個核心服務采用模塊式設計,可靈活解耦,與您現有工作流程無縫對接。
4.高性能,所有后端資源采用容器技術,可快速啟動和釋放,多機多卡的分布式訓練和對企業級超大規模數據的支持,可顯著縮短訓練、調整和部署模型所需時間。
四、產品使用
BML包括三個部分,機器學習是連續的周期過程,工作區數據處理-訓練模型-預測服務進行生產部署和實驗,然后,您可以結合更多業務數據,根據實際使用情況,重新訓練模型來提高預測准確性。
1.工作區:內置了完全托管的交互式編程環境Jupyter Lab,實現數據處理和代碼調試。內置TensorFlow、Keras、PyTorch、Caffe、Mxnet、Chainer、CNTK和PaddlePaddle等算法框架的交互式代碼編輯及運行環境。
2.訓練:支持多種深度/機器學習框架,一鍵發起大規模訓練作業,最大化提升訓練效率及效果。包括四部分:深度學習作業、機器學習作業、AutoDL作業、AutoML作業。
(1).深度學習作業,支持新建作業,作業參數配置,以及進行作業的終止、克隆、刪除、查看作業詳情、作業運行詳情、資源信息列表、查看日志分析等功能。
(2).機器學習作業,支持新建作業、數據標准化、訓練作業參數配置(邏輯回歸二分類、KMeans聚類、RAPIDS-cuML等),以及進行作業的終止、克隆、刪除、查看作業詳情、查看運行詳情、查看作業結果等功能。
(3).AutoDL作業,支持新建作業、數據上傳、作業參數配置(圖像分類-遷移學習、圖像分類-ENAS)、模型預測部署,以及進行作業的終止、克隆、刪除、查看作業詳情、查看運行詳情、查看作業結果等功能。
(4).AutoML作業,支持新建作業、作業參數配置(Logistic Regression)、模型預測部署,以及進行作業的終止、克隆、刪除、查看作業詳情、查看運行詳情、查看作業結果等功能。
邏輯回歸通過用戶給定的調參訓練數據、調參測試數據,自動選擇最優的模型訓練超參數,再配合模型訓練數據,輸出一個訓練好的模型給用戶。
3.預測:快速將訓練好的模型部署為高可用的在線服務,靈活選用多種計算部件加速預測執行,並可以通過A/B Testing,灰度升級,服務監控等完成模型試驗迭代和服務運維管理。
支持創建預測模型(指定預測模型的數據文件和容器鏡像)、創建模板配置(用於配置計算集群資源和服務策略)、創建站點(配置調度服務,搭建高可用預測集群)。
百度Easy DL
一、產品介紹
EasyDL定制化訓練和服務平台零算法基礎定制高精度AI模型,零算法基礎定制高精度AI模型。
二、應用場景
1.圖片分類,可識別一張圖中是否是某類物體/狀態/場景,適用於圖片中主體或者狀態單一的場景;
2.物體檢測,可識別圖中每個物體的位置、名稱,適合有多個主體、或要識別位置及數量的場景;
3.圖片分割,可識別圖中每個物體的名稱、位置(像素級輪廓)並計數,適合圖中有多個主體、需要識別主體位置或輪廓的場景;
4.聲音分類,可識別音頻中是什么類型的聲音,多應用於生產或泛安防場景中監控異常聲音等;
5.文本分類,可判斷一段文本是否屬於某一個自定義的類別,適用於文本篩選、文本歸類、文本聚合等多種應用場景;
6.視頻分類,定制視頻分類模型,可以分析視頻的內容,識別出視頻內人體做的是什么動作,物體/環境發生了什么變化;
7.商品分類,訓練定制化商品檢測模型,平台提供海量預置商品圖片,開放基於百度大規模零售數據的預訓練模型、及數據增強合成技術,實現低成本獲得高精度商品檢測AI模型服務;
三、產品特色
1.可視化操作,無需機器學習專業知識,模型創建-數據上傳-模型訓練-模型發布全流程可視化便捷操作,最快15分鍾即可獲得一個高精度模型;
2.高精度效果,EasyDL底層結合百度 AutoDL/AutoML技術,針對用戶數據自動獲得最優網絡和超參組合,基於少量數據就能獲得出色效果和性能的模型;
3.端雲結合,訓練完成的模型可發布為雲端API或離線SDK,靈活適配各種使用場景及運行環境;
4.數據支持,全方位支持訓練數據的高質量采集與高效標注,支持在模型迭代過程中不斷擴充數據,助力提升模型效果
四、產品使用
1.創建模型,確定模型名稱,記錄希望模型實現的功能;
2.上傳並標注數據,對上傳的圖片、文本、音頻、視頻,進行分類標注或拉框標注;
3.訓練模型並校驗效果,選擇應用類型和算法,一鍵訓練模型;
4.發布模型,訓練時,選擇應用類型,將模型以雲端API或SDK的方式發布使用;
百度AI Studio
一、產品介紹
AI Studio是基於百度深度學習平台飛槳的一站式AI開發平台,提供在線編程環境、免費GPU算力、海量開源算法和開放數據,幫助開發者快速創建和部署模型。
二、應用場景
百度AI Studio是針對AI學習者的在線一體化開發實訓平台。本平台集合了AI教程, 深度學習樣例工程, 各領域的經典數據集, 雲端的超強運算及存儲資源, 以及比賽平台和社區。
從而解決學習者在AI學習過程中的一系列難題, 例如教程水平不一, 教程和樣例代碼難以銜接, 高質量的數據集不易獲得,以及本地難以使用大體量數據集進行模型訓練。
1.比賽,支持參賽者將使用指定數據集, 分析數據, 然后運用機器學習、深度學習、數據挖掘等知識, 建立算法模型, 解決問題得出結果, 最后將結果提交;通過比賽檢測AI技能、知識掌握的水平, 在解決問題中發揮自己的聰明才智, 同時獲取獎勵。
2.教育,AI Studio教育版是百度大腦推出的雲端AI在線教育平台,幫助學校、機構建立自己的線上教學班級,提供從教案項目、AI在線實訓環境、教學管理的教學全流程一站式解決方案;
教育版具有如下四大特性,全方位滿足您的AI教學需求:
(1).一站式教學服務,解決教學互動、教學測試、學習過程跟蹤、學生管理的主要問題;
(2).海量業內最新教案項目, 提供百度官方推薦全套教學課程資料、實踐項目;
(3).獨家線上高性能教學實踐環境, 理論教育與在線實踐相結合,邊學邊練,知行合一;
(4).穩定服務保障,背靠百度技術積累,打造真正安全穩定的在線AI學習環境;
三、產品特色
百度AI Studio平台分為項目大廳、數據集、比賽、教育四大部分,平台預置了Python語言環境, 以及百度PaddlePaddle深度學習開發框架. 同時用戶可以在其中自行加載Scikit-Learn等機器學習庫;平台還為所有用戶提供超強免費算力。
1.項目:2000+優質公開項目,覆蓋CV、NLP、推薦算法等眾多AI熱門領域,完美支持Notebook、腳本及圖形化任務。
2.數據集:1000+開放數據集,種類多樣,支持數據集預覽、下載、上傳,單次上傳容量高達100G。
3.比賽:新手練習賽、常規賽、高級算法大賽,比賽持續更新上線,獎金禮品豐厚,更有招聘綠色通道等你來拿。
4.教育:合作高校300+,為線上教學提供從教學項目、AI在線實訓環境、教學管理的全流程一站式解決方案。
(1).一站式教學管理系統,課堂教育與在線課程打通,解決老師課前教學、課中互動、課后測驗的主要問題;追蹤學生學習進度,在線批改學生實戰項目作業,發布作業成績;
(2).一鍵即用雲端訓練環境,雲端集成免安裝,聯網可用;交互式在線編程環境;
(3).免費CPU/GPU算力資源,免費提供價值千萬的CPU/GPU算力;支持千人同時並發深度學習模型訓練;
5.算力卡: Notebook項目配備Tesla V100高級算力資源,Tesla V100為當今市場上加速人工智能、高性能計算和圖形的數據中心 GPU 中的精尖之作。
四、產品使用
1.項目,用於創建, 管理, 查看各種項目,分為公開項目、我的項目、我的收藏三個板塊,進行項目查詢、修改、刪除、查看項目詳情;項目的運行、停止和部署;創建項目,填寫信息、選擇標簽、配置資源、添加數據集,創建成功;
2.數據集,支持公開數據集、個人數據集、收藏數據集三個板塊,進行數據集查看、收藏、公開、查詢;創建數據集,填寫信息,上傳文件,創建成功;
3.比賽,分常規賽和技術大賽;常規賽,單輪,提交結果符合指標要求;技術大賽,多輪,在比賽中取得很好的排名;
4.教育,支持一站式教學管理系統、一鍵即用雲端訓練環境、免費CPU/GPU算力資源;
(1).教師-教學班級管理,支持教師個人信息修改和班級管理;
(2).教師-學生管理,支持學生新增、刪除、修改、邀請、導入和導出;
(3).教師-教學專區,支持教學內容、學習跟蹤、教學大綱、項目統計、測評考試等功能;
(4).教師-班級信息,進行班級的后台運維管理;
(5).學生-身份驗證,支持邀請碼加入班級,或主動加入班級;
(6).學生-項目學習,支持進入班級項目學習、課程課節學習、查看教學大綱等功能;
5.算力卡,支持算力申請、算力使用、算力耗費明顯;