deep QA 基于生成的chatbot系统

本文转载自查看原文 2017-08-25 16:00 1757

数据集默认存储在项目中的data文件夹中，

clone项目的的时候，Cornell Movie Dialog 是一起下载

其他的数据集： OpenSubtitles， Supreme Court Conversation Data， Ubuntu Dialogue Corpus 需要额外下载，使用时通过参数-- corpus **指定

自定义的数据集，可根据既定的模式使用 https://github.com/Conchylicultor/DeepQA/tree/master/data/lightweight ，使用时通过参数 --corpus lightweight --datasetTag <name>指定

将 tokens = nltk.word_tokenize(sentencesToken[i]) 换成 tokens = list (jieba.cut(sentencesToken[i]))

直接运行main函数

读取数据： textdata.py将文本按照出现的次序转换成数字编码，同时生成字典

处理好的数据存储在self.trainingSample中，

字典：

构建模型：

主要的逻辑实现在model.py中，通过TensorFlow自带 embedding_rnn_seq2seq函数实现

构建完成后开始训练

通过参数modelTag指定model，test指定交互方式

decoder ouptut 输出单句最大词数*1*数据集单词数的3维向量，每个数值表示所对应单词的概率，取最大的作为答案，即可得到若干个单词作为答案

null

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 QA系统Match-LSTM代码研读 Surface Pro 4 系统优化全教程及QA 问答系统总结(Question Answering System, QA) 聊天机器人（chatbot）终极指南：自然语言处理（NLP）和深度机器学习（Deep Machine Learning）从QC到QA 【笔试】QA QA是什么 SpringBoot系统列 2 - 配置文件，多环境配置（dev，qa，online）推荐系统系列（五）：Deep Crossing理论与实践基于KG的智能QA方案