http://blog.sina.com.cn/s/blog_6b218a3b0100mdye.html
一、 數據融合。所謂數據融合,就是將多份數據或信息進行處理,組合出更有效、更符合用戶需求的結果的過程。在無線傳感器網絡的研究中,數據融合起着十分重要的作用,主要表現在以下三個方面:
1.節省能量
在部署無線傳感器網絡時,需要使傳感器節點達到一定的密度以增強整個網絡的魯棒性和監測信息的准確性,有時甚至需要使多個節點的監測范圍互相交疊。這種監測區域的相互重疊導致了鄰近節點報告的信息存在一定程度的冗余。數據融合就是要針對這種情況對冗余數據進行網內處理,即中間節點在轉發傳感器數據之前,首先對數據進行綜合,去掉冗余信息,在滿足應用需求的前提下將需要傳輸的數據量最小化。
2.獲得更准確的信息
由於無線傳感器網絡由大量低廉的傳感器節點組成,部署在各種各樣復雜的環境中,因而從傳感器節點獲得的信息存在較高的不可靠性。由此可見,僅收集少數幾個分散的傳感器節點的數據較難確保得到信息的正確性,需要通過對監測同一對象的多個傳感器所采集的數據進行綜合,來有效地提高所獲得信息的精度和可信度。
3.提高數據的收集效率
在網內進行數據融合,可以在一定程度上提高網絡收集數據的整體效率。數據融合減少了需要傳輸的數據量,可以減輕網絡的傳輸擁塞,降低數據的傳輸延遲;即使有效數據量並未減少,但通過對多個數據分組進行合並減少了數據分組的個數,可以減少傳輸中的沖突碰撞現象,所以也能夠提高無線信道的利用率。
二、無線傳感器網絡應用層數據融合
數據融合技術可以在傳感器網絡協議棧的多個層次中實現,既可以在MAC協議中實現,也可以在路由協議或應用層協議中實現。傳感器網絡中的數據融合技術可以從不同的角度進行分類,介紹三種分類方法:依據融合前后數據的信息含量分類;依據數據融合與應用數據語義的關系分類;依據融合操作的級別進行分類。
1、根據數據進行融合操作前后的信息含量,可以將數據融合分為無損失融合和有損失融合兩類。
(1)無損失融合
無損失融合中,所有的細節信息均被保留。此類融合的常見做法是去除信息中的冗余部分。根據信息理論,在無損失融合中,信息整體縮減的大小受到其熵值的限制。將多個數據分組打包成一個數據分組,而不改變各個分組所攜帶的數據內容的方法屬於無損失融合。這種方法只是縮減了分組頭部的數據和為傳輸多個分組而需要的傳輸控制開銷,而保留了全部數據信息。
時間戳融合是無損失融合的另一個例子。在遠程監控應用中,傳感器節點匯報的內容可能在時間屬性上有一定的聯系,可以使用一種更有效的表示手段融合多次匯報。比如一個節點以一個短時間間隔進行了多次匯報,每次匯報中除時間戳不同外,其他內容均相同;收到這些匯報的中間節點可以只傳送時間戳最新的一次匯報,以表示在此時刻之前,被監測的事物都具有相同的屬性。
(2)有損失融合
有損失融合通常會省略一些細節信息或降低數據的質量,從而減少需要存儲或傳輸的數據量,以達到節省存儲資源或能量資源的目的。有損失融合中,信息損失的上限是要保留應用所需要的全部信息量。
很多有損失融合都是針對數據收集的需求而進行網內處理的必然結果。比如溫度監測應用中,需要查詢某一區域范圍內的平均溫度或最低,最高溫度時,網內處理將對各個傳感器節點所報告的數據進行運算,並只將結果數據報告給查詢者。從信息含量角度看,這份結果數據相對於傳感器節點所報告的原始數據來說,損失了絕大部分的信息,僅能滿足數據收集者的要求。
2、根據數據融合是否基於應用數據的語義,將數據融合技術分為三類:依賴於應用的數據融合(ADDA),獨立於應用的數據融合(AIDA),以及結合以上兩種技術的數據融合。
(1)依賴於應用的數據融合
通常數據融合都是對應用層數據進行的,即數據融合需要了解應用數據的語義。從實現角度看,數據融合如果在應用層實現,則與應用數據之間沒有語義間隔,可以直接對應用數據進行融合;如果在網絡層實現,則需要跨協議層理解應用層數據的含義。
ADDA技術可以根據應用需求獲得最大限度的數據壓縮,但可能導致結果數據中損失的信息過多。另外,融合帶來的跨層理解語義問題給協議棧的實現帶來困難。
(2)獨立於應用的數據融合
鑒於ADDA的語義相關性問題,有人提出獨立於應用的數據融合。這種融合技術不需要了解應用層數據的語義,直接對數據鏈路層的數據包進行融合。例如,將多個數據包拼接成一個數據包進行轉發。這種技術把數據融合作為獨立的層次實現,簡化了各層之間的關系。AIDA作為一個獨立的層次處於網絡層與MAC層之間。
AIDA保持了網絡協議層的獨立性,不對應用層數據進行處理,從而不會導致信息丟失,但是數據融合效率沒有ADDA高。
(3)結合以上兩種技術的數據融合
這種方式結合了上面兩種技術的優點,同時保留AIDA層次和其他協議層內的數據融合技術,因此可以綜合使用多種機制得到更符合應用需求的融合效果。
3、根據對傳感器數據的操作級別,可將數據融合技術也分為以下三類:
1)數據級融合
數據級融合是最底層的融合,操作對象是傳感器通過采集得到的數據,因此是面向數據的融合。這類融合大多數情況下僅依賴於傳感器類型,不依賴於用戶需求。在目標識別的應用中,數據級融合即為像素級融合,進行的操作包括對像素數據進行分類或組合,去除圖像中的冗余信息等。
2)特征級融合
特征級融合通過一些特征提取手段將數據表示為一系列的特征向量,以反映事物的屬性,是面向監測對象特征的融合。比如在溫度監測應用中,特征級融合可以對溫度傳感器數據進行綜合,表示成(地區范圍,最高溫度,最低溫度)的形式;在目標監測應用中,特征級融合可以將圖像的顏色特征表示為RGB值。
3)決策級融合
決策級融合根據應用需求進行較高級的決策,是最高級的融合。決策級融合的操作可以依據特征級融合提取的數據特征,對監測對象進行判別,分類,並通過簡單的邏輯運算,執行滿足應用需求的決策。因此,決策級融合是面向應用的融合。比如在災難監測應用中,決策級融合可能需要綜合多種類型的傳感器信息,包溫度,濕度或震動等,進而對是否發生了災難事故進行判斷;在目標監測應用中,決策級融合需要綜合監測目標的顏色特征和輪廓特征,對目標進行識別,最終只傳輸識別結果。
三、網絡層中的數據融合
無線傳感器網絡中的路由方式可以根據是否考慮數據融合分為兩類:
1.以地址為中心的路由(address-centric routing,AC路由):每個源節點沿着到匯聚節點最短的路徑發送數據,是不考慮數據融合的路由,如圖a所示。
2. 以數據為中心的路由(data-centric routing,DC路由):數據在轉發的過程中,中間節點根據數據的內容,對來自多個數據源的數據進行融合操作。如圖b所示,源節點並沒有各自尋找最短路徑,而是在中間節點B處對數據進行融合,然后再繼續轉發。
AC路由與DC路由對能量消耗的影響與數據的可融合度有關。如果原始信息存在冗余度,由於DC路由可以減少網絡中的轉發數據量,因此將表現出很好的節能效果。在所有原始數據完全相同的極端情況下,AC路由可以通過簡單修改達到DC.路由的效果甚至更節省能量。
DC路由中的數據融合:
1.基於DD路由的融合
定向擴散(Directed diffusion)路由中的數據融合包括路徑建立階段的任務融合和數據發送階段的數據融合,這兩種融合都是通過緩存機制實現的。定向擴散路由中的任務融合得益於它基於屬性的命名方式,類型相同、監測區域完全覆蓋的任務在某些情況下就可以融合成一個任務。定向擴散路由的數據融合采用的是“抑制副本”的方法,即對轉發過的數據進行緩存,發現重復的數據將不予轉發。這種方法不僅簡單,與路由技術相結合還能夠有效地減少網絡中的數據量。
2.基於層次路由的融合
LEACH與TEEN都是基於層次的路由,它們的核心思想是使用分簇的方法使得數據融合的地位突顯出來。它包括周期性的循環過程,LEACH的操作分成“輪”來進行,每一輪具有兩個運行階段,包括簇建立階段和數據通訊階段。為了減少協議的開銷,穩定運行階段的持續時間要長於簇建立階段。在簇建立階段,相鄰節點動態的自動形成簇,隨機產生簇首,隨機性確保簇頭與匯聚節點之間數據傳輸的高能耗成本均勻地分攤到所有的傳感器節點,具體產生機制是:一個傳感器節點生成0,l之間的隨機數,如果大於閾值T,就選擇這個節點為簇頭。T的計算方法如下:
其中P為節點中成為簇頭的百分數,,是當前的輪數。一旦簇頭節點被選定,它們便主動向所有節點廣播這個消息。根據接收信號的強度,節點選擇它所要加入的簇,並告知相應的簇頭節點。
在數據通信階段,簇內節點把數據發給簇首,簇首進行數據融合並把結果發送給匯聚節點。由於簇首承擔了很多耗能的工作,如數據融合、與匯聚節點通信等,各節點需要等概率地輪流擔任簇首,來達到網絡能量消耗的平衡。LEACH協議的特點是分簇和數據融合,分簇有利於網絡的擴展性,數據融合可以節約功耗。LEACH協議對於節點分布較密的情況有較高的效率,因為節點密度大會導致在小范圍內冗余數據較多,LEACH協議可以有效地消除數據的冗余性。然而LEACH算法僅僅強調了數據融合的重要性,並沒有給出具體的融合方法。TEEN是LEACH的一種改進,應用於事件驅動的傳感器網絡。TEEN與定向擴散路由一樣通過緩存機制抑制不需要轉發的數據,但是它利用閾值的設置使抑制操作更加靈活,對於前一次監測結果差值較小的數據也進行了抑制。
3.基於鏈的融合
PEGASIS及其高階算法是對LEACH融合方式的改進。它基於兩個假設:一是所有節點距離匯聚節點都很遠;二是每個節點都能將接收到的數據分組與自己的數據融合成一個大小不變的分組。PEGASIS算法是在收集數據前,首先利用貪心算法將網絡中的所有節點連接成一條單鏈,然后隨機選取一個節點作為首領。首領向鏈的兩端發出收集數據的請求,數據從單鏈的兩個端點向首領流動。中間節點在傳遞數據前要執行融合操作,最終由首領節點將結果傳送給匯聚節點。
PEGASIS算法的優點在於單鏈的結構使得每個節點發送數據的距離幾乎都是最短的,而且最終只有一個節點進行遠距離的數據傳輸,因此這個算法比LEACH算法更節省能量。
單鏈結構的PEGASIS算法主要有以下兩個缺點:
1)平均延遲比較大:數據需要沿着單鏈結構順序傳送,收集數據的延遲取決於首領節點與單鏈端節點的距離,因此平均延遲與節點數成正比。
2)魯棒性較差:由於傳感器節點容易失效,如果不采取適當的修復策略,單鏈結構的傳輸路徑容易增大數據收集請求的失敗率。
4.基於安全模式的融合
ESPDA(Energy-efficient and Secure Pattern-based Data Aggregation)也是一種基於分簇的路由協議。不同的是每個節點收集到數據后,並不是直接將數據包發送給簇頭,而是將反映數據特征的模式編碼(Pattern Code)發給簇頭節點,簇頭節點根據模式編碼判斷是否對該節點的數據感興趣或該節點數據是否冗余。這樣簇頭節點就不用收集簇內所有節點的數據,可以根據需要有選擇的收集。ESPDA既減少了簇內節點和簇頭的通信量,也增加了無線傳感器網絡的安全性。因為模式編碼是經過安全加密和壓縮的,而且大小也小於數據包的大小。