Bilinear CNN Models for Fine-grained Visual Recognition
CVPR 2015
本文提出了一種雙線性模型( bilinear models),一種識別結構,該結構由兩個特征提取器產生,兩個輸出是圖像每一個位置的外積(outer product),然后進行 pool,得到最終的圖像描述算子。這種結構可以對局部 pairwise feature interactions 以平移不變的方式進行建模。而且,可以產生不同的無序的文字描述,像 Fisher vector, VLAD and O2P。