自然語言處理技術(NLP)在多個領域有着廣泛運用,比如情感分析、文本相似度、評論觀點抽取、文本分類、詞法分析等等,算法模型訓練離不開大量標注好的文本,動輒幾萬條、幾十萬條,有的公司是算法人員自己用excel標注,效率非常低。最近找到了在線標注的文本標注工具,給大家介紹一下,工具鏈接見底部。
1. 配置標注工具
標注工具配置起來非常簡單,只需要填寫一級標簽和對應的code值就好了,比如我要標注一段文字中的省市區。如果你需要多級文本標簽的標注工具,可以和客服小妹講,讓客服小妹催下研發…大家多反饋,說不定就優先研發呢。
另外,為了讓標注人員了解標注規定,下面的標注規則盡量也要填寫清楚。
2. 預覽標注工具
在這一步可以看下你剛才配置的標注工具的效果。總的來說操作很簡單。順便吐槽一下,樣例文本居然是廣告。
3. 發布標注項目
你可以在京東眾智這個平台上選擇一個或者多個標注團隊為你標注,這當然比自己的工程師高效而且節約很多…和標注團隊確定好價格、預付費以及具體標注要求就好了。工具使用費是給平台的,目前是免費。總的來說,一定是比找其他標注平台要更便宜的。
4.驗收與導出
你是可以在平台上查看發布項目的狀態的,可以驗收,驗收不合格還能回滾讓標注團隊重新做。結算之后就能導出標注結果了。
注冊鏈接
http://biao.jd.com/business/centerNew