from_logits是一個布爾量,當from_logits=True的時候,該層會將output做normalize(softmax)
因此,一個直觀的理解就是layerA with activation + softmax + loss(from_logits=False)與layerA + loss(from_logits=True)等效
from_logits是一個布爾量,當from_logits=True的時候,該層會將output做normalize(softmax)
因此,一個直觀的理解就是layerA with activation + softmax + loss(from_logits=False)與layerA + loss(from_logits=True)等效
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。