視覺模式的相似性度量是視覺計算中的一個基礎問題,設計一個有效的相似性度量准則對於提高視覺分析系統的性能極為關鍵。度量學習旨在利用訓練數據學習出有效的距離度量,進而有效地描述樣本之間的相似度。傳統的度量學習算法大多數都是學習出一個線性的馬氏距離,因而不能有效地描述樣本的非線性結構。本報告介紹本研究組近年所提出一種新的深度度量學習方法及其在視覺分析中的應用。通過構造一個深度神經網絡,在網絡的頂層設計任務相關的目標函數優化網絡的參數,從而更好地學習出鑒別度量空間。所提出的方法在包含人臉識別、行人識別、物體識別、圖像集分類、目標跟蹤和視覺搜索等多個視覺分析的應用中驗證了其有效性。