花费 5 ms
DeiT:使用Attention蒸馏Transformer

题目:Training data-efficient image transformers & distillation through attention 【GiantPandaCV导语】Deit是一个全Transformer的架构,没有使用任何的卷及操作。其核心是将蒸馏方法引入VIT ...

Fri Sep 24 18:19:00 CST 2021 0 241

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM