采用Google預訓bert實現中文NER任務

本文轉載自查看原文 2018-12-22 16:18 2972 NLP

本博文介紹用Google pre-training的bert（Bidirectional Encoder Representational from Transformers）做中文NER（Name Entity Recognition）

第一步： git clone https://github.com/google-research/bert.git ，存放在 bert文件中

第二步：下載BERT-Base Chinese模型，存放在checkpoint文件中

相關文件結構如下：

BERT
|____ bert
|____NERdata
|____ BERT_NER.py
|____ checkpoint
|____ output

第三步：

run：

python BERT_NER.py   \
                  --task_name="NER"  \ 
                  --do_train=True   \
                  --do_eval=True   \
                  --do_predict=True
                  --data_dir=NERdata   \
                  --vocab_file=checkpoint/vocab.txt  \ 
                  --bert_config_file=checkpoint/bert_config.json \  
                  --init_checkpoint=checkpoint/bert_model.ckpt   \
                  --max_seq_length=128   \
                  --train_batch_size=32   \
                  --learning_rate=2e-5   \
                  --num_train_epochs=3.0   \
                  --output_dir=./output/result_dir/ 
預測結果存放在result_dir目錄中
以上所有參數都是基於bert官方默認參數

參考：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於BERT的中文命名實體識別任務(BERT-BiLSTM-CRF-NER) NLP 基於kashgari和BERT實現中文命名實體識別（NER）基於BERT預訓練的中文命名實體識別TensorFlow實現中文NER的那些事兒1. Bert-Bilstm-CRF基線模型詳解&代碼實現 pytorch中：使用bert預訓練模型進行中文語料任務，bert-base-chinese下載。中文NER的那些事兒2. 多任務，對抗遷移學習詳解&代碼實現 ELECTRA中文預訓練模型開源，性能依舊媲美BERT 中文NER的那些事兒6. NER新范式！你問我答之MRC詳解&代碼實現預訓練模型（三）-----Bert 中文NER的那些事兒3. SoftLexicon等詞匯增強詳解&代碼實現