Tensorflow的采樣方法：candidate sampling(zhuan)

本文轉載自查看原文 2018-10-06 17:30 1640 機器學習/ 一個AI貓的日常

zhuanzi:https://blog.csdn.net/u010223750/article/details/69948463

采樣介紹

假如我們有一個多分類任務或者多標簽分類任務，給定訓練集

我們想學習到一個通用函數

完整的訓練方法，如使用softmax或者Logistic回歸需要對每個訓練數據計算所有類

“candidate sampling”訓練方法包括為每一個訓練數據

C i = T i \cup S i

TensorFlow中各種采樣

這里寫圖片描述
其中：

softmax vs. logistic

在使用tensoflow的時候，我們有時候會糾結選擇什么樣的損失函數比較好，softmax和logistic在表達形式上是有點區別的，但是也不是很大，而且對於普通的softmax_cross_entropy_with_logits和sigmoid_cross_entropy_with_logits也都能夠進行多分類任務，那么他們之間的區別是什么的？

就我個人所想到的，使用sigmoid_cross_entropy_with_logits和softmax_cross_entropy_with_logits的最大的區別是類別的排他性，在分類任務中，使用softmax_cross_entropy_with_logits我們一般是選擇單個標簽的分類，因為其具有排他性，說白了，softmax_cross_entropy_with_logits需要的是一個類別概率分布，其分布應該服從多項分布(也就是多項logistic regression)，我們訓練是讓結果盡量靠近這種概率分布，不是說softmax_cross_entropy_with_logits不能進行多分，事實上，softmax_cross_entropy_with_logits是支持多個類別的，其參數labels也沒有限制只使用一個類別，當使用softmax_cross_entropy_with_logits進行多分類時候，以二類為例，我們可以設置真實類別的對應labels上的位置是0.5,0.5，訓練使得這個文本盡量傾向這種分布，在test階段，可以選擇兩個計算概率最大的類作為類別標簽，從這種角度說，使用softmax_cross_entropy_with_logits進行多分，實際上類似於計算文本的主題分布。

但是對於sigmoid_cross_entropy_with_logits，公式

tensorflow提供了下面兩種candidate sample方法

tf.nn.nce_loss
tf.nn.sampled_softmax_loss

對比與之前討論的，從最上面的圖中的training loss采用的方法可以知道， tf.nn.nce_loss使用的是logistic 而tf.nn.sampled_softmax_loss采用的是softmax loss，其實這兩者的區別也主要在這兒，采用logistic loss的本質上還是訓練

個人看法，對於多標簽多類別的分類任務使用Logistic比較好，對於多標簽單類別的分類任務使用softmax比較好，采樣中，采用tf.nn.sampled_softmax_loss訓練cbow模型比較好，而 tf.nn.nce_loss訓練skip-gram比較好。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 隨機采樣方法整理與講解（MCMC、Gibbs Sampling等）隨機采樣方法整理與講解（MCMC、Gibbs Sampling等）采樣方法 - Sampling Matters in Deep Embedding Learning（Distance weighted sampling） - 1 - 論文學習采樣方法 mysql報關於用戶密碼1045(28000)，幾種處理方法 (zhuan) 常用的采樣方法采樣之蒙特卡羅方法隨機采樣方法（接受-拒絕采樣，MCMC蒙特卡洛采樣、Gibbs采樣） STM32——ADC采樣時間、采樣周期、采樣頻率計算方法深度學習中圖像上采樣的方法