BERT预训练tensorflow模型转换为pytorch模型


在Bert的预训练模型中,主流的模型都是以tensorflow的形势开源的。但是huggingface在Transformers中提供了一份可以转换的接口(convert_bert_original_tf_checkpoint_to_pytorch.py)。
但是如何在windows的IDE中执行呢?

  • 首先,需要安装transformers (可以挂国内清华、豆瓣源之类的加速)
pip install transformers
  • 其次,下载tf版本的bert预训练模型goole的预训练模型,下载的模型文件解压后如下:
    image
  • 写tf2torch.py脚本且放在模型同目录中,脚本内容如下:
    image
import transformers.models.bert.convert_bert_original_tf_checkpoint_to_pytorch as con


con.convert_tf_checkpoint_to_pytorch(
    r'.\bert_model.ckpt',
    r'.\bert_config.json',
    r'.\pytorch_bert.bin'
)

convert_tf_checkpoint_to_pytorch中三个参数分别是:bert模型名称、config文件地址,输出的pytorch文件保存地址

  • 然后运行tf2torch.py文件得到如下文件,多了一个pytorch_bert.bin文件
    image
  • 最后注意:可以忽略TensorFlow checkpoint(以bert_model.ckpt开头的三个文件),但是一定要保留配置文件(bert_config.json)和词汇表文件(vocab.txt),因为PyTorch模型也需要这些文件。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM