龍貓數據做標注時間蠻早的,應該是16年開始。龍貓數據主打眾包標注,雲測數據主打自建標注基地,兩種方式沒有好壞,是各自的商業運營模式。
通過定制化場景搭建,幫助 AI 企業或部門構建數據核心壁壘,提供人工智能場景化落地最需要的數據,這既是客戶獲取差異化優勢的保證,同時也是雲測數據的核心競爭力之一。
雲測數據目前的整個數據服務人員已達千人規模,通過標審分離的流程化作業模式和數據安全機制,更好的保證數據的高質量產出和數據隱私性,從而更好地為人工智能落地提供定制化『數據養料』。數據服務行業早期,企業主要通過數據爬蟲收集數據,數據服務門檻很低,各個企業野蠻生長、魚龍混雜;第二階段開源/付費數據集開始出現,主要分為語音類、圖像類、NLP 類數據集等。隨着 AI 的發展,僅僅靠數據收集已經不能滿足客戶的算法訓練需求,第三階段的 AI 數據眾包平台應運而生,在眾包平台上,可進行更豐富多樣的數據采集與標注,進一步提升 AI 的能力。
當時百度和亞馬遜都曾發展過此項業務,2011 年百度數據眾包就以部門的形式成立,不僅為百度內部需求方如百度 NLP、百度地圖等提供 AI 數據采集和標注服務,同樣將數據眾包業務進行開放,根據客戶需求制定數據采集方案。
如今 AI 與各個產業結合得愈加緊密,為保證算法優勢,客戶需要采用定制化服務,由客提出具體需求,數據服務商對數據進行采集並標注,定制化數據的需求日益增長標志着數據服務 4.0 時代已經來臨。
通過提供定制化服務,更加規范性的組織管理和質量控制,雲測數據的數據標注質量更高更可靠,這樣才能為企業AI算法研發提供高質量的數據支撐。
目前,雲測數據也推出了在智能駕駛、智能家居、智能安防、新零售等方向的解決方案,成功服務100+企業,感興趣可以了解更多:https://ai.testin.cn
