Google 超分辨率技術 RAISR


每天都有數以百萬計的圖片在網絡上被分享、儲存,用戶借此探索世界,研究感興趣的話題,或者與朋友家人分享假期照片。問題是,大量的圖片要嘛被照相設備的像素所限制,要嘛在手機、平板或網絡限制下被人為壓縮,降低了畫質。

  如今高分辨率顯示屏幕正在家庭和移動設備上普及,因此,把低分辨率圖片轉化為高清晰版本,並可在多種設備上查看和分享,正在成為一項巨大的需求。日前,Google 推出了一項新技術 RAISR,其全稱是“Rapid and Accurate Image Super-Resolution”,意為“快速、精確的超分辨率技術”。

  RAISR 這項技術能利用機器學習,把低分辨率圖片轉為高分辨率圖片。它的效果能達到甚至超過現在的超分辨率解決方案,同時速度提升大約 10 至 100 倍,且能夠在普通的移動設備上運行。而且,Google 的技術可以避免產生混疊效應(aliasing artifacts)。

  之前已經具有透過升采樣方式,把低分辨率圖片重建為尺寸更大、像素更多、更高畫質圖片的技術。最廣為人知的升采樣方式是線性方法,即透過把已知的像素值進行簡單、固定的組合,以添加新的像素值。因為使用固定的線性過濾器(一個恆定卷積核對整個圖片的無差別處理),該方法速度很快。但是它對於重建高清作品里生動的細節有些力不從心。正如下面這張圖片,升采樣的圖片看起來很模糊,很難稱得上畫質提升。

  

  ▲ 左為原始圖片;右為升采樣處理后圖片。

  對於 RAISR,Google 另辟蹊徑得采用機器學習,用一對低分辨率、高分辨率圖片訓練該程序,以找出能選擇性應用於低分辨率圖片中每個像素的過濾器,這樣能生成媲美原始圖片的細節。目前有兩種訓練 RAISR 的方法:

  • 第一種是“直接”方式,過濾器在成對高、低分辨率圖片中直接學習。
  • 第二種方法需要先對低分辨率圖片應用低功耗的的升采樣,然后在升采樣圖片和高分辨率圖片的組合中學習過濾器。
  • “直接”方式處理起來更快,但第二種方法照顧到了非整數范圍的因素,並且更好地利用硬件性能。

  無論是哪種方式,RAISR 的過濾器都是根據圖像的邊緣特征訓練的:亮度和色彩梯度、平實和紋理區域等。這又受到方向(direction,邊緣角度)、強度(strength,更銳利的邊緣強度更高)和黏性(coherence,一項量化邊緣方向性的指標)的影響。以下是一組 RAISR 過濾器,從一萬對高、低分辨率圖片中學習得到(低分辨率圖片經過升采樣)。該訓練過程耗費約 1 小時。

  

  注:3 倍超分辨率學習,獲得的 11×11 過濾器集合。過濾器可以從多種超分辨率因素中學習獲得,包括部分超分辨率。注意當圖中邊緣角度變化時,過濾器角度也跟着旋轉。相似的,當強度提高時,過濾器的銳利度也跟着提高;黏性提高時,過濾器的非均相性(anisotropy)也提高。

  從左至右,學習得到的過濾器與處理后的邊緣方向有選擇性的呼應。舉例來說,最底一行中間的過濾器最適合強水平邊緣(90 度梯度角),並具有高黏性(直線的而非彎曲的邊緣)。如果這個水平邊緣是低對比度的,那么如同圖中最上一行,另一個過濾器就被選擇。

  實際使用中,RAISR 會在已經學習到的過濾器列表中選擇最合適的過濾器, 應用於低分辨率圖片的每一個像素周圍。當這些過濾器被應用於更低畫質的圖像時,它們會重建出相當於原始分辨率的細節,這大幅優於線性、雙三(bicubic)、蘭索斯(Lancos)解析方式。

  

  ▲ RAISR 演算法運行圖式下:原始圖像(左),2 倍雙三解析(中),RAISR 效果(右)。

  一些運用 RAISR 進行圖片增強的范例:

  

  ▲ 上:原始圖片,下:RAISR 2 倍超分辨率效果。

  

  ▲ 左:原始圖片,右:RAISR 3 倍超分辨率效果。

  超分辨率技術更復雜的地方在於如何避免混疊效應,例如龜紋(Moire patterns)和高頻率內容在低分辨率下渲染產生的鋸齒(對圖像人為降級的情形)。這些混疊效應的產物會因對應部分的形狀不同而變化,並且很難消除。

  

  ▲ 左:正常圖像;右:右下角有龜紋(混疊效應)的圖像。

  線性方法很難恢復圖像結構,但是 RAISR 可以。下面是一個例子,左邊是低分辨率的原始圖片,左 3 和左 5 有很明顯的空間頻率混淆(aliased spatial frequencies),而右側的 RAISR 圖像恢復了其原始結構。RAISR 的過濾器學習方法還有一項重要的優點:用戶可以把消除噪音以及各類壓縮演算法的產物做為訓練的一部分。當 RAISR 被提供相應的范例后, 它可以在圖片銳化之外學會消除這些效果,並把這些功能加入過濾器。

  

  ▲ 左:有強混疊效應的原始圖片;右:RAISR 處理后效果。

  超分辨率技術利用不同的方法已經有了不少進展。如今,透過把機器學習與多年來不斷發展的成像技術相結合,圖像處理技術有了長足的進步,並帶來許多好處。舉例來說,除了放大手機上的圖片,用戶還可以在低分辨率和超高清下捕捉、儲存、傳輸圖像,使用更少的移動網絡數據和儲存空間,而且不會產生肉眼能觀察到的畫質降低。

  小結:自從喬布斯 2010 年在 iPhone 4s 上推出“視網膜屏幕”概念之后,數碼產品市場開啟了一場超高清顯示革命。如今,家用顯示器逐步走向 4K,各大手機廠商也競相推出 2K 旗艦機。但 2K、4K 內容的缺乏一直是困擾行業發展的痛點。之前的超分辨率技術受成本、硬件限制,主要應用於專業領域,未能大范圍普及。

  此次 Google RAISR 大幅降低了圖像增強的時間成本和硬件要求,有望實現超分辨率技術在消費領域的應用,把充斥網絡的低畫質圖片轉化為高清圖片,大幅提高視覺效果和用戶體驗。雷鋒網十分期待將來 RAISR 在移動設備的應用,例如把消費者手機拍攝的照片轉化為媲美單反畫質的高清美圖。

 

英文論文地址:

Google Research Blog:

 

 

谷歌產品博客今日發文介紹其圖像壓縮技術RAISR,RAISR於去年11月推出,利用機器學習生成高質量版本的低分辨率圖像,使加載每張高清大圖片使用的帶寬減少75%。

專業、技能高超、有獨特風格的許多攝影師們都早已在 Google+ 上建立博客,以支持社區及分享他們的作品。無論是玩具、旅行風景還是街頭藝術,每張照片都有一個獨特的故事,值得以最佳的分辨率來欣賞。

傳統上,以高分辨率欣賞照片意味着需要使用大量帶寬,導致加載速度變慢,數據成本升高。對許多人來說,尤其對數據價格高昂或互聯網接入速度慢的地區的人來說,這是一個值得關注的問題。

為了讓每個人都能觀看到攝影師分享到 Google+ 的高清照片,我們利用機器學習和名為 RAISR 的新技術試圖解決這個問題。RAISR 於11月推出,利用機器學習生成高質量版本的低分辨率圖像,以讓人們能夠欣賞到攝影師的美麗照片。通過使用 RAISR 來顯示 Google+ 上的大圖片,我們能使每張圖片使用的帶寬減少 75%。

雖然我們只在安卓設備子集流中出現高分辨率圖片是才推出此功能,但我們已經每周使用 RAISR 壓縮超過10億張圖片,為用戶降低了約三分之一的總帶寬。接下來幾周里,我們計划更廣泛地推廣這項技術,以進一步節省時間和數據成本。

 

看到這個技術,想了解一下,看看算法原理,主要參考代碼如下:https://github.com/MKFMIKU/RAISR

版本是基於python2.7的。

算法原理:

(1)先創建一個低分辨率的圖片,保存在hashtable中。

(2)在高低分辨率的成對圖片中學習,即先對低分辨率圖片應用低功耗的的升采樣,然后在升采樣圖片和高分辨率圖片的組合中學習過濾器。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM