一個社交網絡通常被描述為一個有向圖G=(V,E),其中V是節點的集合,E∈V×V是有向邊的集合。每一個節點v∈V代表社交網絡中的一個人,每一條邊(u,v)∈E代表節點u到節點v的影響力關系。
邊是有向的,(u,v)∈E表明節點u對節點v有影響力,反之不一定。對於(u,v)∈E,它叫做節點u的出邊,節點v的入邊,節點u叫做節點v的入鄰居,節點v叫做節點u的出鄰居。一個節點v的所有出鄰居用N+(v)表示,所有入鄰居用N-(v)表示。
通常情況下,每個節點有兩個狀態:不活躍和活躍。不活躍表示該節點未收到對應實體,活躍表示該節點已收到對應實體。節點從不活躍狀態轉變為活躍狀態稱之為被激活。
獨立級聯模型
如圖1所示,每一條邊(u,v)都有一個對應的概率p(u,v)∈[0,1],表示節點v能被節點u獨立激活的概率。
獨立級聯模型下的動態傳播過程在離散時間點的形式如下:
- t=0時刻,事先選好的初始集合S0(seed set種子節點結合)首先被激活,其他節點都為不活躍狀態;
- t≥1時刻,任一在上一時刻被激活的節點u∈St-1\St-2,節點u會對他的所有尚未被激活的出鄰居v∈N+(u)\St-1嘗試一次激活,如果嘗試激活成功,則v∈St\St-1;否則節點v仍未未激活狀態,即v∈V\St;
- 當在某一時刻不再有新節點被激活,傳播過程結束。
注:每一個節點只有一次嘗試激活其出鄰居節點的機會,且發生在該節點被激活后的下一時刻。
在影響力傳播中經常關系的是傳播結束后被激活節點個數的期望值,即E[|S∞|],用σ(S0)表示,並稱之為最終的影響力延展度。

圖 1 獨立級聯模型示意圖
獨立級聯模型抽象概括了社交網絡中人與人之間獨立交互影響的行為。它通過邊上的概率來描述人與人之間發生影響的可能性和強度。很多簡單實體(如新消息在在線網絡的傳播或新病毒在人際間的傳播)很符合獨立傳播的特性。獨立級聯模型也在基於實際數據的影響力學習中被初步驗證是有效的。所以獨立級聯模型是目前研究最廣泛、最深入的模型。
線性閾值模型
線性閾值模型中,每條有向邊(u,v)∈E上都有一個權重值w(u,v)∈[0,1]。w(u,v)反應節點u在節點v的所有入鄰居中影響力重要性占比,要求∑u∈N-(v)w(u,v)≤1。每個節點都有一個被影響的閾值θv∈[0,1]。
線性閾值模型下的動態傳播過程在離散時間點的形式如下:
- t=0時刻,事先選好的初始集合S0(seed set種子節點結合)首先被激活,其他節點都為不活躍狀態;
- t≥1時刻,每個不活躍的節點v∈V\St-1都需要根據它所有已經激活的入鄰居到它的線性加權和是否達到它的被影響值來判斷是否被激活,即是否滿足∑u∈N-(v)∩St-1w(u,v)≤θv。如果滿足則節點v被激活,否則仍保持未激活狀態。
- 當在某一時刻不再有新節點被激活,傳播過程結束。
線性閾值模型中節點v的閾值θv表達了節點對一個新的實體的接受傾向:閾值越高,節點v越不容易被影響;反之閾值越低越容易被影響。
節點v的入鄰居對節點帶的影響是聯合發生的,可能任何一個入鄰居都不能單獨激活節點v,但幾個入鄰居聯合起來就可能使對節點v的影響力權重超過節點v的閾值,從而激活幾點v,這對應了人類的從眾行為,也是和獨立級聯模型的主要不同之處。
線性閾值模型的隨機性完全是由節點的被影響閾值決定,一旦閾值確定,后面的傳播過程就是完全確定的。這是線性閾值模型不如獨立級聯模型應用廣泛的一個原因。
參考文獻:陳衛,微軟亞洲研究院 .社交網絡影響力傳播研究 . doi: 10.11959/j.issn.2096-0271.2015031
