問答系統


對話系統包括閑聊、問答、任務型對話三大部分。
問答系統特指那些一問一答形式的聊天。
任務型對話指用戶希望通過聊天的方式達成某種目的。
閑聊中,對話系統的輸出不一定是肯定句,也可以是問句。

開放域問答系統雖然開放,但它能夠解決的問題類型是有限的:
按照問題類型,又可作如下划分:

  • 事實型問題:WH 問題,例如 when / who / where 等;
  • 是非型問題:Is Beijing the capital of China?
  • 對比型問題:Which city is larger, Shanghai or Beijing?
  • 觀點型問題:What is Chinese opinion about Donald Trump?
  • 原因/結果型問題:how / why / what 等。

特定領域的問答系統的構建通常使用知識圖譜的方式。知識圖譜的基本組成就是三元組,知識圖譜的工具體系包括:知識圖譜編輯工具、知識圖譜查詢工具。
知識圖譜問答最大的缺點是它需要構建知識圖譜,問答系統不具備可遷移性,不同領域需要整理不同的知識,這是工作量最大的部分。並且,知識圖譜的整理需要專家知識,這項工作無論交給程序員來做還是交給業務方來做都是一項艱難的工作。知識圖譜問答的優點在於它簡單直接、可解釋性強、可以執行高階邏輯查詢。

基於閱讀理解的問答系統一定程度上可以認為是專門為了解決知識圖譜問答存在的問題。知識圖譜中存儲的知識是高度結構化的,這和實際生活並不符合。許多文章很難提煉出知識結構來。基於閱讀理解的問答系統知識的存儲形式就是非結構化的文本片段。基於閱讀理解的問答系統有兩類:抽取式和檢索式。

參考資料:https://yq.aliyun.com/articles/609928

要構建一個自動問答系統,應從哪些方面入手?(來自知乎)

  • 機器學習里的分類算法。
  • 自然語言處理里的信息檢索、信息抽取以及一些基礎技術包括句法分析、命名實體識別等等。
  • 如果想做的更加智能,還可以應用人工智能的一些技術,比如知識推理等等。

大型QA系統大多數是基於Web信息檢索的,各級NLP技術比如句法分析,NER,IR/IE等都會涉及。
還有一種是基於Knowledge Base的, 將自然問句形式化成Query,到知識庫里檢索答案。

如果想自己做一個簡單系統的話可以先選擇一個特定領域比如醫療QA,到網上抓取數據,用語義網RDF/OWL構建一個知識庫,然后用開源NLP包分析問句,轉換成查詢語句去搜答案,最后返回給用戶,在這個基礎上自己可以深入做推理等其他高級功能。

開源問答系統(不是智能問答系統)

像常用類型的網站(比如博客系統、問答系統、維基系統)都有開源庫。

  • OSQA基於django
  • zheye.org “者也”,模仿知乎,基於Ruby Rails
  • askbot基於django
  • Shapado shapado 是一個用 Ruby 開發的類似 stackoverflow 的問答網站軟件,基於 Mongodb 開發。
  • 仿百度知道PHP問答系統 Tipask,是PHP Laravel問答系統
  • PHP問答系統 Question2Answer
  • CNProg 是一個面向中國程序員的開源技術問答社區。 一個介於論壇、博客、維基和Digg之間的社區系統,基於Python和Django開發。 具有透明、開放、全民管理的運作模式,讓所有用戶能夠更加容易地尋求幫助,找到問題答案,解決實際的技術問題。
  • Anwsion 是一個類似知乎以問答為基礎的完全開源的社交網絡建站程序,基於 PHP+MYSQL 應用架構,它集合了問答,digg,wiki 等多個程序的優點,幫助用戶輕松搭建專業的知識 庫和在線問答社區。
  • LampCMS 是一款類似 Stack Overflow 的服務於開發人員的問答系統(Q&A program), 深度整合了Facebook,Twitter等的APIs
  • QuestionAnsweringSystem 基於Java的人機問答系統
  • Stacked 是一個用 ASP.NET 實現類似 StackOverFlow 網站功能的開源軟件。
  • LampCMS 的后台數據庫使用的是一款非常有名的開源的 NoSQL 數據庫 MongoDB
  • OpenEphyra 是一個使用 Java 開發的模塊化、可擴展的問答系統、安裝簡單。
  • VIF (virtual discussion forum) 是一個用 Java 開發的論壇軟件,主要適合問答型的社區。VIF 提供一個發布的工作流和發帖Review機制以確保發帖人的內容質量。
  • Coordino 可讓你創建一個問答系統,使用 PHP 開發。
  • Qwench:PHP開發,類似stackoverflow
  • WeCenter 是一個類似知乎以問答為基礎的完全開源的社交網絡建站程序,基於 PHP + MYSQL 應用架構,它集合了問答,digg,wiki 等多個程序的優點,幫助用戶輕松搭建專業的知識 庫和在線問答社區
  • NGQA 基於Java Web的問答系統。
  • tipask:Tipask是一款開放源碼的PHP問答系統,基於Laravel框架開發,容易擴展,具有強大的負載能力和穩定性。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM