deep QA 基於生成的chatbot系統

本文轉載自查看原文 2017-08-25 16:00 1757

deep QA: https://github.com/Conchylicultor/DeepQA

基於論文： https://arxiv.org/pdf/1506.05869.pdf

數據集默認存儲在項目中的data文件夾中，

clone項目的的時候，Cornell Movie Dialog 是一起下載

其他的數據集： OpenSubtitles， Supreme Court Conversation Data， Ubuntu Dialogue Corpus 需要額外下載，使用時通過參數-- corpus **指定

自定義的數據集，可根據既定的模式使用 https://github.com/Conchylicultor/DeepQA/tree/master/data/lightweight ，使用時通過參數 --corpus lightweight --datasetTag <name>指定

將 tokens = nltk.word_tokenize(sentencesToken[i]) 換成 tokens = list (jieba.cut(sentencesToken[i]))

直接運行main函數

讀取數據： textdata.py將文本按照出現的次序轉換成數字編碼，同時生成字典

處理好的數據存儲在self.trainingSample中，

字典：

構建模型：

主要的邏輯實現在model.py中，通過TensorFlow自帶 embedding_rnn_seq2seq函數實現

構建完成后開始訓練

通過參數modelTag指定model，test指定交互方式

decoder ouptut 輸出單句最大詞數*1*數據集單詞數的3維向量，每個數值表示所對應單詞的概率，取最大的作為答案，即可得到若干個單詞作為答案

null

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【筆試】QA QA是什么 QA的工作職責是什么？ SAP QM——QA01、QA02、QA03屏幕增強 /deep/和>>>和::v-deep （讀論文）推薦系統之ctr預估-Wide＆Deep模型解析《DEEP LEARNING》 QA CodeDiff做什么？什么時間做？關於 QA 和自動化測試基於索引的QA問答對匹配流程梳理