左右互搏:GAN在愛奇藝短視頻推薦冷啟動中的實踐 https://mp.weixin.qq.com/s/Thdf6hAwktCfd7LJc_9Tmw
左右互搏:GAN在愛奇藝短視頻推薦冷啟動中的實踐
導語:由於推薦系統冷啟動問題的存在,在視頻推薦中為用戶推薦新視頻是一個極具挑戰的問題,新視頻推薦的效果直接影響推薦系統“新陳代謝”的穩定性和內容生態的健康發展。為了解決該問題,本文主要介紹了愛奇藝隨刻推薦團隊在短視頻推薦業務上基於對抗神經網絡(GAN)的新視頻冷啟動的落地實踐方案。
01
背景
推薦系統的冷啟動問題是指當新物品或新用戶進入推薦系統后,由於沒有該用戶或該物品的歷史信息,推薦很難取得較好的效果的問題,這一問題很容易影響新用戶的使用體驗和用戶留存,是短視頻個性化推薦領域一個重要的問題。
要解決這個問題,我們首先要了解下,推薦系統的冷啟動由哪些部分組成。
推薦系統的冷啟動主要可以分為用戶冷啟動、物品冷啟動和系統冷啟動三類。
以用戶-物品評分矩陣為例,如下圖所示,在用戶-物品評分二維矩陣中,用戶和物品分別有冷熱之分,進而形成四象限,第一象限即為物品冷啟動問題。
新視頻推薦在視頻推薦系統中是一種典型的物品冷啟動問題,對於愛奇藝在線視頻服務平台,每時每刻會有大量新視頻生產和上線,尤其是以UGC、PUGC為代表的短視頻,同時短視頻又具有快速消費和一次性消費的特征,使得新視頻如何快速地准確地高效地分發給感興趣的用戶成為一個持續的研究問題。
從新視頻的內容屬性看,新視頻相較於老視頻,視頻歷史信息缺失,沒有用戶視頻交互行為數據,同時視頻meta屬性可能有缺失或者不准確,如何准確地描述和表達新視頻是第一性問題。
從新視頻分發路徑和周期看,新視頻分發會經歷少量試探性或驗證性分發,通過系統驗證后進入大量的自由分發階段,如何優化新視頻分發路徑、如何使新視頻高效觸達目標靶用戶是視頻和用戶如何建立連接的問題。
從視頻推薦系統整體看,新視頻推薦是推薦系統物料正常的“新陳代謝”,由於短視頻具有快速消費的特征,視頻推薦系統整體的物料更新速度較快,如何穩定地進行“推陳出新”是推薦系統的“開源問題”;同時新視頻meta屬性缺失或者不准確、推薦分發試探和驗證會給推薦系統整體帶來一定的開銷和引入一些噪聲,如何准確高效進行新視頻推薦是推薦系統的效率問題。
從新視頻生產供給側看,新視頻推薦分發的效果,會對視頻生產創作進行前期直接的反饋,對視頻生產創作者的研判決策有一定的影響,對於內容生態的健康發展具有引導和指標性作用。
因此,新視頻推薦對推薦系統至關重要,如何有效地構建新視頻推薦,根據第一性原則分析,需要解決兩個基本問題,第一是如何表示新視頻,第二是如何對新視頻和用戶建立連接。
首先,如何表達新視頻成為解決問題的出發點。傳統的解決方案,多數是基於新視頻屬性的內容表達,如新視頻的類別、標簽、創作者等;內容表達直觀,但是表達的特征離散和稀疏,同時受噪聲影響波動較大。第二,如何使新視頻直接與用戶建立連接成為解決問題的關鍵。傳統的基於屬性內容的表達,通過視頻屬性與用戶畫像屬性,進一步利用相似性或相關性計算建立新視頻和用戶之間的聯系。以上基於分離的兩部框架,結構簡單表達能力不足,且分離框架信息傳遞會有熵減,存在信息損失和誤差疊加的問題。
因此,我們設計了基於對抗神經網絡的新視頻推薦的解決方案,基於對抗神經網絡生成器產生的embedding向量化的表達所蘊含的信息更加豐富,同時神經網絡擬合真實用戶特征,完成新視頻和用戶間復雜的映射關系;對抗神經網絡生成的新視頻特征不僅與給定的新視頻相關,而且和真實的用戶特征相似,從而完成了新視頻表達、新視頻和用戶建立映射關系二者的聯合統一。
02
模型框架結構設計
在視頻推薦中為用戶推薦新視頻是一個極具挑戰的問題,為了解決該問題,本文提出了基於對抗神經網絡(GAN)的新視頻冷啟動方案,它通過獲取用戶和物品之間隱含的屬性級的交互信息,利用了視頻屬性的多個角度產生可能對該新視頻感興趣的用戶特征,並基於屬性級的相似度將新視頻推薦給目標用戶。
GAN模型的整體框架結構如下圖所示:
GAN模型的網絡結構由生成器和判別器兩部分組成,生成器可以根據輸入的視頻的屬性生成一個可能喜歡該物品的用戶特征向量;判別器可以根據輸入的用戶特征-視頻特征樣本對,判斷輸入的用戶特征是真實的還是生成的,篩選出與真實用戶相似且與視頻相關的生成的用戶特征。最后從用戶集中選出若干個與生成的用戶特征向量最相似的用戶,並將該視頻推薦給這些用戶,完成新視頻冷啟動召回。
GAN模型總的目標函數為min-max優化表達式,其期望生成器最小化目標函數,同時判別器最大化相同的目標函數,具體計算公式為:
其中D*表示判別器D, ϕ表示判別器的參數,Pture(u+|In)表示判別器D的函數;G*表示生成器G,θ表示生成器的參數,Pθ(uc|In)表示生成器G的函數,N 是訓練集中視頻的個數。
2.1 生成器
生成器采用了多個子生成器的結構,即生成器可以分為兩個部分:
第一部分 :對於視頻Item候選集I={I1,I2,I3,…,In},其中每個視頻Ii有k維屬性A={ai1,ai2,…,aik},視頻的k維屬性中每個屬性分別被送到特定的生成器中,然后生成潛在用戶的特征;
第二部分:
神經網絡G合並所有的生成的用戶特征向量,通過多層全連接神經網絡,輸出一個最終的用戶特征向量,該過程可以表示為:
生成器通過最小化目標函數訓練得到最優的生成器,當在訓練生成器的時候判別器的參數是固定的,只需要優化跟生成器相關的項,通過以下公式計算:
一般來說,生成器比判別器要完成的任務更難,因為生成器要進行概率密度的擬合,導致的影響GAN性能的一個問題就是模式坍塌,即生成高度相似的樣本。采用多個生成器單個判別器可以有效地緩解這個問題。
2.2 判別器
判別器采用單判別器的結構,對於判別器有兩種訓練樣本對:
一種是(uc,Ic),即給定的視頻和生成的用戶特征形成的樣本,其中uc是生成器G生成的用戶特征,Ic是視頻屬性的特征;另一種是(u+,Ic),即給定的視頻和真實用戶特征形成的樣本,其中u+是在真實行為數據中對給定視頻感興趣的用戶,對於真實用戶的特征由真實用戶畫像生成。
判別器的目的就是將(uc,Ic)和(u+,Ic)這兩種樣本區分開來,其中(u+,Ic)是正例,其標簽是1;(uc,Ic)是負例,標簽是0,通過以下公式計算:
判別器輸出的是用戶和視頻相關的概率,通過以下公式計算:
其中 ϕ是判別器的參數。
在判別器網絡訓練時通過最大化目標函數來得到最優的判別器,通過以下公式計算:
通過以上兩種樣本的進行訓練,可以使判別器篩選出生成器生成的用戶特征不僅與真實的用戶特征相似,而且和給定的視頻相關。
2.3推薦生成
生成器生成了可能喜歡當前物品的用戶特征之后,就可以把當前的新視頻推薦給與生成的用戶最相似的真實用戶了。本文用余弦相似度計算的生成的用戶和用戶集中用戶之間的相似度,采用ANN優化了相似解求解性能。
03
線上效果
該方案已於愛奇藝主APP短視頻推薦系統中上線,在新視頻的分發和消費方面都有顯著正向的結果,對高熱產生效率以及系統曝光新鮮度等方面都有極大提升:
1.新視頻分發效果方面,曝光占比明顯提升,視頻新鮮度相對提升12.4%。
2.新視頻消費效果方面,CTR相對提升11.9%,人均播放時長相對提升56.5%。
04
總結展望
以上是我們近期在愛奇藝短視頻推薦業務中新視頻推薦冷啟動召回的方案落地,實踐證明基於對抗神經網絡實現的新視頻冷啟動解決方案,對線上新視頻推薦的效果是有很大收益的。后續我們會從以下幾個方面持續優化:
1. 優化多個生成器生成的屬性特征融合,引入attention機制等方法,使得特征表達更加合理。
2. 采用多個判別器結構,進行不同粒度的boosting判別篩選,使得生成特征更加多樣性,避免模型病態和蛻化。
參考文獻
[1] Sun,Changfeng, et al. "LARA: Attribute-to-feature-adversarial learningfornew-item recommendation." Proceedings of the 13th International Conferenceon Web Search and Data Mining. 2020.[2] Goodfellow,Ian, et al. "Generative adversarial networks." Communications of theACM 63.11 (2020): 139-144.[3] Arjovsky,Martin, Soumith Chintala, and Léon Bottou. "Wasserstein generativeadversarial networks." International conference on machine learning. PMLR,2017.[4] Ebesu, Travis,and Yi Fang. "Neural semantic personalized ranking for item cold-startrecommendation." Information Retrieval Journal 20.2 (2017): 109-131.[5] Gantner,Zeno, et al. "Learning attribute-to-feature mappings for cold-startrecommendations." 2010 IEEE International Conference on Data Mining. IEEE,2010.