from_logits是一个布尔量,当from_logits=True的时候,该层会将output做normalize(softmax)
因此,一个直观的理解就是layerA with activation + softmax + loss(from_logits=False)与layerA + loss(from_logits=True)等效
from_logits是一个布尔量,当from_logits=True的时候,该层会将output做normalize(softmax)
因此,一个直观的理解就是layerA with activation + softmax + loss(from_logits=False)与layerA + loss(from_logits=True)等效
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。