一

1

與傳統的監督學習不同，few-shot leaning的目標是讓機器學會學習；使用一個大型的數據集訓練模型，訓練完成后，給出兩張圖片，讓模型分辨這兩張圖片是否屬於同一種事物。比如訓練數據集中有老虎、大象、汽車、鸚鵡等圖片樣本，訓練完畢后給模型輸入兩張兔子的圖片讓模型判斷是否是同一種事物，或者給模型兔子和狗的圖片去判斷。

2

訓練的目的是靠着Support Set提供的一點信息，讓模型判斷出Query中的圖片是otter這個類別，盡管訓練數據集中沒有otter這個類別。
k-way n-shot Support Set

k-way: the support set has k classes;

n-shot: every class has n samples.
k way表示支撐集中的類別，n shot表示支撐集中每個類別包含的樣本數量

3

隨着Support Set中類別增加，分類准確率會降低

因為3選1比6選1更容易，准確率更高;

同樣地，Support Set中shot數量增加，分類准確率會提高

4

idea：學習一個相似度函數

sim函數來計算兩張圖片x和x'的相似度，

例如兩張狗的圖片x₁和x₂，一張貓的圖片x₃，sim(x₁,x₂)=1, sim(x₁,x₃)=0，sim(x₂,x₃)=0

基本思想：

（1）首先，從一個大樣本數據集中學習一個相似度函數

（2）然后，用相似度函數來做預測

①用query和support set的每一個樣本逐一作比較；

②找出相似度得分最高的樣本

5 常用的數據集

（1）Omniglot

https://github.com/brendenlake/omniglot or https://www.tensorflow.org/datasets/catalog/omniglot

（2）Mini-ImageNet

二連體網絡Siamese Network

兩種訓練Siamese Network的方法

1 每次取兩個樣本，比較他們的相似度

需要用到一個大的帶標簽的數據集來訓練神經網絡，利用訓練集來構造正樣本Positive Samples和負樣本Negative Samples

Positive Samples：每次從一個類別中隨機抽取兩張圖片，把標簽設置為1，即相似度滿分，用這樣的方法，也從其他類別中抽取圖片，標簽都設置為1；

Negative Samples：隨機抽取一個類中的一張圖片，排除掉這個類，再從其他類中隨機抽取一張圖片，把標簽設置為0，即相似度為0，這樣構造負樣本。

搭建一個卷積神經網絡來提取特征，輸入圖片記為x，輸出特征向量記作f(x)

訓練神經網絡，將准備好的圖片輸入神經網絡f，提取的兩個特征向量記作h₁，h₂，z = |h₁-h₂|，再通過一個全連接層輸出一個標量，最后使用sigmoid函數得到一個0~1之間的輸出，這個輸出就可以衡量兩個圖片之間的相似度，sim(x₁,x₂)。兩張圖片屬於同一個類別，那么輸出應該接近1，如果兩張圖片屬於不同類別，那么輸出應該接近0。損失函數是標簽Target=1與sim(x₁,x₂)之間的差別，用來更新全連接層和神經網絡f的參數（注意這里的圖片輸入的是同一個神經網絡）之所以叫做連體網絡，是這個網絡的結構頭部連在一起，如下圖所示