原文:使用tensorflow訓練模型時可能出現nan的幾種情況

最近在做基於MTCNN的人臉識別和檢測的項目,在訓練模型的過程中總是會不定時地出現損失值為nan的情況,Debug了好久終於找到了問題所在,這里總結以下可能出現nan的幾種情況: 在分類問題中,我們經常使用到交叉熵損失函數,需要注意的是:由於交叉熵損失函數里有對數計算,因此對數的真數部分不能為 ,所以我們在計算計算交叉熵時需要給這個真數部分限定一個范圍,否則會出現數值下溢的問題,我們可以采取的辦法 ...

2018-09-10 16:47 0 4418 推薦指數:

查看詳情

tensorflow 訓練網絡loss突然出現nan情況

1、問題描述:開始訓練一切都是那么的平靜,很正常!   突然loss變為nan,瞬間懵逼! 2、在網上看了一些解答,可能是梯度爆炸,可能是有關於0的計算。然后我覺得可能是關於0的吧,然后進行了驗證。 3、驗證方法:因為我使用的是softmax loss, 我直接打印每一步的輸出向量中的最大值 ...

Fri May 10 23:59:00 CST 2019 0 1558
keras訓練cnn模型loss為nan

keras訓練cnn模型loss為nan 1.首先記下來如何解決這個問題的:由於我代碼中 model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy']) 即損失函數 ...

Mon Mar 25 18:03:00 CST 2019 0 3316
tensorflow 訓練的時候loss=nan

出現loss為nan 可能是使用了relu激活函數,導致的.因為在負半軸上輸出都是0 ...

Wed May 08 22:26:00 CST 2019 0 474
使用TensorFlow訓練模型的基本流程

本文已在公眾號機器視覺與算法建模發布,轉載請聯系我。 使用TensorFlow的基本流程 本篇文章將介紹使用tensorflow訓練模型的基本流程,包括制作讀取TFRecord,訓練和保存模型,讀取模型。 准備 語言:Python3 庫:tensorflow、cv2 ...

Fri Jul 05 17:41:00 CST 2019 0 4980
tensorflow如何使用TPU訓練模型

  首先檢測TPU存在: tpu = tf.distribute.cluster_resolver.TPUClusterResolver()  #如果先前設置好了TPU_NAME環境變量,不需要再 ...

Sat Feb 29 21:26:00 CST 2020 0 1918
神經網絡訓練出現nan錯誤

現在一直在用TensorFlow訓練CNN和LSTM神經網絡,但是訓練期間遇到了好多坑,現就遇到的各種坑做一下總結 1.問題一;訓練CNN的時候出現nan CNN是我最開始接觸的網絡,我的研究課題就是利用CNN,LSTM等網絡對人體動作做識別。動作數據來源於手機的加速度計,做動作的人在固定 ...

Wed Jan 24 05:07:00 CST 2018 0 1650
使用caffe訓練Loss變為nan的原因總結

梯度爆炸 原因:梯度變得非常大,使得學習過程難以繼續 現象:觀察log,注意每一輪迭代后的loss。loss隨着每輪迭代越來越大,最終超過了浮點型表示的范圍,就變成了NaN。 措施: 1. 減小solver.prototxt中的base_lr,至少減小一個數量級。如果有多個loss ...

Tue Dec 26 05:47:00 CST 2017 0 2110
python出現nan情況分析

nan代表Not A Number(不是一個數),它並不等於0。 情況一: 0 * float('inf') 結果為:nan float('inf') / float('inf') 結果為:nan float('inf') - float('inf') 結果為:nan float ...

Wed Oct 30 22:42:00 CST 2019 0 7784
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM