背景介紹
自然語言是人類智慧的結晶,自然語言處理是人工智能中最為困難的問題之一,而對自然語言處理的研究也是充滿魅力和挑戰的。
在業界,搜狐深耕互聯網資訊傳播,多年來始終保持着對自然語言處理技術應用的不斷探索,積累了豐碩的成果。在學界,清華大學作為頂尖學府,其計算機系在自然語言處理這個前瞻領域收獲了大量理論及實踐的重要成就。
作為先行者,搜狐攜手清華計算機系共同發起本屆內容識別算法大賽,旨在通過提供業務場景、真實數據、專家指導,選拔和培養有志於自然語言處理領域的算法研究、應用探索的青年才俊,共同探索更多可能、開啟無限未來。
競賽任務
給定若干文章,目標是判斷文章的核心實體以及對核心實體的情感態度。每篇文章識別最多三個核心實體,並分別判斷文章對上述核心實體的情感傾向(積極、中立、消極三種)。
概念定義
實體:
人、物、地區、機構、團體、企業、行業、某一特定事件等固定存在,且可以作為文章主體的實體詞。
核心實體:
文章主要描述、或擔任文章主要角色的實體詞。
注:參賽對象:全日制在校大學生(本科、碩士、博士均可)。