1.家庭AI系統的任務
在智能家居中應用人工智能技術,需要構建承載人工智能算法的家庭AI系統。家庭AI系統用以實現兩類家庭任務:
(1)家庭設備的控制任務。
這類任務需要系統通過分析用戶使用數據,按照用戶習慣自動控制家庭內部設備、或調整家庭內環境狀態。例如Nest溫控器,按照用戶習慣控制房間溫度,並且兼顧節能。
(2)家庭狀態的監測任務。
這類任務需要系統通過分析家庭數據、推理家庭事件,並自動做出評估、匹配相關的家庭外部服務。例如分析空巢老人的健康數據,判斷老人的健康狀態等。
家庭AI系統為人們提供更為舒適的家庭環境和良好的城市服務。但是,如何分配人和系統的功能是個有趣的問題。目前,智能家居的控制可以分為:人工控制和監督控制。人工控制是通過人在控制終端上操作完成的,例如在平板上操作空調,通過牆上的觸摸開關控制背景音樂的播放等。監督控制是智能家居系統自動完成某項操作,並把該部分告知他的主人。
| 【例6-1】 某智能家居系統的監督控制。早上定時打開電動窗簾,布防之后有人闖入短信報警等。 |
監督控制又可分為設定條件控制和自動學習控制。設定條件控制動作的觸發是事先設定好的。自動學習控制是控制器利用人工智能技術根據主人的習慣或者喜好,自動學習設備的運行模式,並在適當的條件下自動發出控制指令。
| 【例6-2】 某智能家居系統的監督控制自動學習控制。知道主人晚上七點准時收看新聞聯播,則在主人在的時候准時打開電視。檢測到主人每天早上7點起床,這一習慣很規律,如果哪天7點沒有起床,則向相關人員發送信息等。 |
那么在智能家居系統設計中,人工控制和監督控制如何分配,即自動化程度需要多高?目前人工智能的倫理正在建立,還沒有形成體系,但按照人因工程的理論,分配可參照以下策略:
(3)強制分配。
有些控制必須是人要參與的,例如取消安防設備報警、利用可視對講為樓下的訪客開門等。這些動作的執行必須由使用者發出。另外強制分配還應考慮系統設計者和使用者之間的法律層面的問題。有些操作從法律層面,動作的發出者必須是人,例如自動撥打報警電話等。
(4)價值平衡。
在家庭中有些任務人完成更有優勢,有些機器完成更具有優勢。那么任務的分配就發揮各自的優勢。例如,做飯,當前階段肯定是人的水平要高於設備,那么就由人來完成;洗衣服,洗衣機的工作大部分能夠令人滿意,因此由洗衣機來完成。
(5)情感和認知支持分配。
這一條准則意識到了人類的獨特需求。情感支持指人們的情感需要,例如,在某些情況下,人們時常能感覺到做家務的樂趣,這也是人們家庭生活的組成。認知支持指人員對信息的需要,以便為行動做好准備或做出可能的決策。例如,在檢測到燃氣泄漏時,不僅應該立即關閉閥門,而且應該及時告知主人,並由主人檢查處理。
以上分配不是絕對的,隨着家庭AI系統知識庫越來越豐富,實現某些功能的成本和效果比人更好,人工控制則有可能轉換為監督控制。
2 相關算法
1)深度學習
深度學習最早由Hinton等人於2006年提出,深度學習的本質就是人工神經網絡,指多層神經網絡上運用各種機器學習算法解決圖像、文本等各種問題的算法集合。深度學習的核心是特征學習,旨在通過分層網絡獲取分層次的特征信息,從而解決以往需要人工設計特征的重要難題。深度學習是一個框架,包含多個重要算法:
l Convolutional Neural Networks(CNN)卷積神經網絡
l AutoEncoder自動編碼器
l Sparse Coding稀疏編碼
l Restricted Boltzmann Machine(RBM)限制波爾茲曼機
l Deep Belief Networks(DBN)深信度網絡
l Recurrent neural Network(RNN)多層反饋循環神經網絡
對於不同問題(圖像、語音、文本),需要選用不同網絡模型才能達到最好效果。此外,最近幾年增強學習(Reinforcement Learning)與深度學習的結合也創造了許多了不起的成果,AlphaGo就是其中之一。深度學習從概念提出到現在,也已經有14年了,已經應用於諸多領域。
(1)人臉識別。
圖像識別是深度學習領域最受青睞的應用方向,無論是深度學習,還是其他機器學習方法(如VM即向量機),都非常喜歡用圖像識別來進行研究。正是因為如此,ImageNet大賽應運而生,ImageNet通過建立強大的圖片庫,來邀請各大人工智能研究者前來檢驗其算法的效果,促進了這一領域的蓬勃發展,也導致今天人工智能領域,人臉識別幾乎是最為成熟的應用。
(2)語音識別。
從2009年深度學習被引入語音識別領域,短短幾年時間內,其在TIMIT數據集上基於傳統的混合高斯模型(GMM)的錯誤率就從21.7%下降到17.9%,引起業界的廣泛關注。谷歌的GoogleNow、蘋果的Siri、微軟的Skype Translator、科大訊飛等都是基於深度學習的算法。語音識別目前發展得很好,在國內有些方言都可以非常精准的識別了,屬於成熟應用。
(3)自然語言處理。
自然語言處理(NLP)是通過構建計算算法自動分析、表征人類自然語言的一個學科領域。自然語言處理有五大主要任務,分別是分類、匹配、翻譯、結構預測和序貫決策過程。自然語言處理中的大多數問題都可以形式化地歸到這五個任務中。在這些任務中,單詞、短語、句子、段落甚至文檔通常被視為一系列標記(字符串)進行處理,盡管它們的復雜性不盡相同。但是實際上,句子是使用最廣泛的處理單元。最近研究表明,深度學習可以提高前四項任務的性能,並成為了解決這些任務的最先進技術。如今,基於NLP的系統已經實現廣泛應用,例如Google強大的搜索引擎、亞馬遜的語音助手Alexa。此外,NLP還可以幫助機器執行和復雜的自然語言有關的任務,例如機器翻譯和對話生成。
2) 智能空間
智能空間(Smart Space)理論用來計算家庭內部用戶需求,用以匹配家庭外部服務。智能空間是嵌入了計算、信息設備和多模態的傳感裝置的工作或生活空間,具有自然便捷的交互接口,以幫助人們方便地獲得計算機系統(或智能家居系統)的服務。NIST(美國國家技術標准研究院)給出的智能空間具備的功能和為用戶提供的服務包括:
(1)能識別和感知用戶以及他們的動作和目的,理解和預測用戶在完成任務過程中的需求;
(2)用戶能方便地與各種信息源(包括設備和數據)進行交互;
(3)用戶攜帶的移動設備可以無縫地與智能空間的基礎設施進行交互;
(4)提供豐富的信息顯示;
(5)提供對發生在智能空間中的經歷的記錄,以便在以后檢索回放;
(6)支持空間中多人的協同工作以及與遠程用戶的沉浸式的協同工作。
智能空間的發展經歷了以下幾個階段:
首先,處於計算環境中的計算設備不再像在桌面計算模式下一樣,要求用戶端坐在計算機前或者處於某個固定位置才能完成計算任務。大量的計算設備、多模態交互技術模塊、情景感知(context awareness)模塊被嵌入並隱藏在實際的物理環境中,這些模塊需要能互相協作並能主動為用戶提供服務,使得智能空間能擁有立體、連續的交互通道。例如,一個智能書房能檢測到用戶在其內閱讀書籍,它可能會打開窗簾來為用戶提供足夠的照明;隨着時間的推移,夜幕降臨,智能書房還可能根據當前的光照條件,逐漸加強房間中的燈光照明。
其次,智能空間的一個重要特性稱為游牧服務(cyber foraging)。它是指用戶攜帶入空間的無線手持設備可以充分利用其周圍基礎設施中的相對較強的設備的能力,同時其上運行的模塊也可以與空間中的其他模塊進行交互和協作,以共同為用戶提供增強的服務。這也是信息空間與物理空間融合的一個體現。這種融合使得空間距離對計算的含義與傳統分布式計算中正好相反。傳統的分布式計算是試圖用網絡消滅空間距離,而智能空間是強調找到離用戶最近的各種資源和服務。反過來,基礎設施也應該能夠利用用戶所攜帶的移動設備的功能,為用戶提供個性化或者增強的服務。例如,當用戶甲在一個智能會議室開會時,系統檢查到乙給甲發了一個重要的E-mail,並希望甲馬上能閱讀其內容。智能會議室則應該根據當前的情景(在開會)以及甲所攜帶的移動設備(手機或者PDA)做出判斷,將此E-mail轉發到手機上,並通過震動提醒甲,而不是通過會議室的大屏幕顯示出來。而如果只是甲單獨待在智能會議室,該E-mail則可經由聲音提示,顯示在大屏幕上。
3 家庭智能化模型
3.1 Agent技術
Agent和多Agent技術起源於分布式人工智能研究,自20 世紀70年代出現以來得到迅速發展,目前已經成為一種進行復雜系統分析與模擬的思想方法與工具。Agent是指駐留在某一環境下,能持續自主地發揮作用,具備駐留性、反應性、社會性、主動性等特征的計算實體。
多Agent系統是一種全新的分布式計算技術,由在一個環境中交互的多個Agent組成。多Agent系統也能被用在解決分離的Agent以及單層系統難以解決的問題上。智能可以由一些方法、函數、過程、搜索算法或加強學習來實現。多主體系統的研究課題可以提供一個合適的視角去觀察網絡貿易,災害應對以及社會結構建模。多Agent具有下列基本特性:
(1)自治性(Autonomy):Agent能根據外界環境的變化,自動地對自己的行為和狀態進行調整,而不是僅僅被動地接受外界的刺激,具有自我管理自我調節的能力。
(2)反應性(Reactive):能對外界的刺激做出反應的能力。
(3)主動性(Proactive):對於外界環境的改變,Agent能主動采取行動的能力。
(4)社會性(Social):Agent具有與其他Agent或人進行合作的能力,不同的Agent可根據各自的意圖與其他Agent進行交互,以達到解決問題的目的。
(5)進化性:Agent能積累經驗或學習知識,並修改自己的行為以適應新環境。
