文本分類(TextCNN,Keras)


數據集是網上找的

 

流程:

  1. 加載數據集,去停用詞
  2. 使用 Keras 的 Tokenizer 將每一文本用數字表示
  3. 創建 TextCNN 模型,訓練並預測

 

在 1080Ti 上 batch_size = 128 時每一 epoch 用時 2 s,跑 6、7 個 epoch 測試集准確率就到 1.0000 了 。。數據集太小太簡單

 

也可以使用詞袋模型進行實驗,這里不在贅述

 

項目完整地址:https://github.com/cyandn/DS/tree/master/text-classification

 

參考:

https://www.jianshu.com/p/3c8591a12bd6

https://blog.csdn.net/edogawachia/article/details/79446354

https://blog.csdn.net/John_xyz/article/details/79210088

http://www.52nlp.cn/tag/textcnn

https://hunto.github.io/nlp/2018/03/29/TextCNN%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB%E8%AF%A6%E8%A7%A3.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM