keras實現textcnn

本文轉載自查看原文 2019-03-14 09:39 1109 NLP learning

https://github.com/MoyanZitto/keras-cn/blob/master/docs/legacy/blog/word_embedding.md  這個鏈接將帶有embeding層的cnn實現及訓練的過程講的很清楚

構建好帶有embedding層的textcnn模型后，model.fit時傳入的x_train是二維的要訓練的詞對應的標號。下面的代碼會將詞進行標號。


import keras.preprocessing.text as T
from keras.preprocessing.text import Tokenizer

text1 = 'some/thing to eat'
text2 = 'some thing to drink'
texts = [text1, text2]
print(' '.join(text1.split('/')))
tokenizer = Tokenizer(num_words=None) # num_words:None或整數,處理的最大單詞數量。少於此數的單詞丟掉
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
print(sequence)
word_index = tokenizer.word_index
data = pad_sequences(sequences, maxlen=10)
print(data)
print('Found %s unique tokens.' % len(word_index))
print(tokenizer.word_counts) # [('some', 2), ('thing', 2), ('to', 2), ('eat', 1), ('drink', 1)]
print(tokenizer.word_index) # {'some': 1, 'thing': 2,'to': 3 ','eat': 4, drink': 5}
print(tokenizer.word_docs) # {'some': 2, 'thing': 2, 'to': 2, 'drink': 1, 'eat': 1}
print(tokenizer.index_docs)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 文本分類（TextCNN，Keras） pytorch實現自己的textCNN [NLP] TextCNN模型原理和實現使用TextCNN實現文本分類 textRNN & textCNN的網絡結構與代碼實現！ Keras實現RNN模型 Keras實現風格遷移 FM算法keras實現 keras實現MobileNet CRF keras代碼實現