目標:
打造一個基於大數據的 IT 問答機器人服務,通過運用人工和AI 技術,極大提高問答產品的用戶滿意度。
適合高校《軟件工程》,《人工智能》課程作為結對編程或者團隊項目。
項目代號:小猿
人員:
高校學生,助教
用戶的痛點 (NEED)
- 新用戶在學習一門技術 (編程語言)有很多問題,但是在一般的完整提問后沒有任何保證能得到及時回應
- 新手不知道如何提高質量的問題,別人也不知道如何回答
- 即使很想知道答案(是急需解決的問題),也可以付錢,但是也沒有途徑請到高手來回答
- 我這個問題肯定以前有人回答過,但是我找不到
- 【答辯】是否對問答領域有限制?
- 計划領域為多個主流編程語言的相關問題。
- 【答辯】后期是否考慮接入問答社區?
- 后台存在一個問答社區,用戶也可以直接在社區中搜索。
- 【要求】定義有限目標,一個范圍,確保工作量可控也確保服務質量可控。
- 【改進】Alpha階段范圍只限於一種編程語言
解決方案(APPROACH)
-
研發回答機器人,功能如下:
-
當用戶提問的時候,馬上回答用戶,並請用戶進一步說明問題 (解決痛點 #1, #2)
-
當用戶提問並沒有得到完美解答的時候, 機器人可以提示標注有
問題特征
的專家,讓他們來回答。 (解決痛點 #3) -
N 天沒有進展的問題, 機器人可以
@更多的人
來回答,或者提示作者提高獎勵幅度 (解決痛點 #3) -
回答滿意度反饋
- 滿意:記錄下回答過程,作為較好的答案保存
- 不滿意:問題有新回答時,通知用戶;找更多的人來回答,並提高回答該問題的獎勵
-
-
在AI 成熟之前,可以用人工的回答來代替 AI
-
建立AI 回答機器人(小猿)
-
前期人工回答
-
從人工回答過渡到AI
- 將明顯的回答交給AI
- 逐步提高AI的回答幾率
-
-
交互方面:引入問答機器人。不論是人工回答還是AI回答,用戶都只和問答機器人進行交互。
- 【問題】目前是否考慮過整體的技術棧?
- 【要求】如果涉及到模型的話,建議后端采用Python類框架比如Django,或者模型部分單獨封裝並對上層業務系統提供API。
- 【答辯】基於已有模型和算法,如何根據用戶的提問找到用戶真正需要的信息?
- 前期需要人工介入,將用戶提出的新問題補充入數據集,相當於一個訓練模型的過程。
- 【要求】將這件事在技術和業務流程層面上進行確認,確保可行性。
收益(Benefit)
- 能夠讓用戶在提出問題后更及時地被回應
- 幫助新手在提問題時進一步說明問題,完善問題。
- 提高提問者急需回答的問題的解決效率
- 幫助提問者找到曾經有人回答過的類似問題
成本(Cost & Competition)
開發成本:
- UI設計:用戶與機器人對話界面,類似淘寶客服。
- 機器人交互:技術難點,現有框架可供參考。
- 數據更新:知識庫數據,搜索問答知識的更新。
- 用戶獎勵機制:優秀回答可以獲得虛擬貨幣的獎勵。
- 成功的回答轉化為相關搜索結果
用戶成本:
幾乎沒有,可能有的時候想要得到滿意的回答需要一點時間。
競爭:
類似同類產品,如知乎,小猿搜題等等。
-
【答辯】基於什么樣的原理?如何保證效果一定比現有搜索引擎好?和搜索引擎有何區別?
-
原理部分是一個技術難點,可能是基於關鍵詞抽取與匹配。通過語義匹配來搜索相似問題,根據用戶畫像建模來邀請定向用戶回答。
-
效果方面,我們的回答能夠盡力做到與
用戶類型
匹配。對於新手友好”的角度來說(這個問題在D部分也有提到),因為搜索引擎並不能保證這一點。
-
-
【答辯】和搜索引擎有何區別:
- 搜索式(搜索功能)和交互式(問答功能),增強用戶體驗。
- 可針對提問用戶類型選出合適的回答。(與前面說的“新手友好”類似)
- 搜索引擎可以理解為一個開放域上的信息檢索,好處是搜索的范圍很廣,但有時因為搜索時間的權衡無法應用一些先進的技術;AI Bot更像是垂直領域的,你們可以專門針對某個領域進行相應的優化,做到小而美
交付與數據(Delivery & Data)
交付方面:
- 功能入口點:問答服務
- 功能入口點:搜索不滿意的時候, 可以提示用戶 “請試一下我們的問答機器人”
- 用戶可以邀請其他用戶來回答, 如果邀請的用戶提供了最好的答案,那么發起邀請的用戶也會得到回報。
數據方面:
- 建立知識圖譜(難點)
- 引入現有知識庫
軟件發布與用戶量估計
我們希望通過網站的形式發布軟件。用戶可以在網頁端對知識搜索和提問。
預估發布一周后,網頁端用戶量約有200-400人。
- 【答辯】如果一個搜索內容在中文互聯網上不存在該如何應對?
- 這也就是要處理用戶問了“超出知識范圍的問題”的情況,需要前面所說的,人工介入。
- 【答辯】如果產品目標用戶主要是初學者,則需要考慮給出一個簡明的答案,是否會針對這種情況進行優化?
- 可以對一些回答進行標記:“適合初學者”、“適合進階”等。前期通過人工回答和用戶反饋情況進行標記,后期可再結合AI進行標記。