VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR
本篇算法也是隨筆1.的核心參考文獻
作者通過自編碼器,把圖像壓縮成latent representation (16x縮小),然后利用統計概率進行熵編碼。
作者利用下采樣縮小圖像規模、提取高維特征,然后利用量化器編碼。其中,作者利用GDN代替BN層,對於圖像的編碼更加精准。
熵編碼需要得知各個字符的概率,按照概率分布分配合適的碼字,從而盡可能減少整個圖像所占用的比特數。
作者從編碼器向解碼器傳輸輔助信息,調整熵模型的信號,降低它與熵模型的不匹配。因為傳遞的輔助信息是作為熵模型的先驗知識,而熵模型是圖像編碼解碼的先驗知識,因此將傳遞的輔助信息叫做Hyperprior(超先驗)
其中,把一個圖像壓縮成latent representation的算法見下一篇論文
Theoretical Foundations of Transform Coding