原文:SSE圖像算法優化系列四:圖像轉置的SSE優化(支持8位、24位、32位),提速4-6倍

一 前言 轉置操作在很多算法上都有着廣泛的應用,在數學上矩陣轉置更有着特殊的意義。而在圖像處理上,如果說圖像數據本身的轉置,除了顯示外,本身並無特殊含義,但是在某些情況下,確能有效的提高算法效率,比如很多行列可分離的算法,在很多情況下,行和列方向的算法邏輯隨相同,但是由於多方面原因 比如Cache miss, 優化水平等 行列處理時間還是由很大的差異的,這個時候如果轉置的耗時和處理時間相比所占比例 ...

2017-05-02 20:47 9 6423 推薦指數:

查看詳情

SSE圖像算法優化系列九:靈活運用SIMD指令16提升Sobel邊緣檢測的速度(4000*3000的24位圖像時間由480ms降低到30ms)。

  這半年多時間,基本都在折騰一些基本的優化,有很多都是十幾年前的技術了,從隨大流的角度來考慮,研究這些東西在很多人看來是浪費時間了,即不能賺錢,也對工作能力提升無啥幫助。可我覺得人類所謂的幸福,可以分為物質檔次的享受,還有更為復雜的精神上的富有,哪怕這種富有只是存在於短暫的自我滿足中也是值得 ...

Sat Aug 05 02:23:00 CST 2017 8 4926
SSE圖像算法優化系列十二:多尺度的圖像細節提升。

  無意中瀏覽一篇文章,中間提到了基於多尺度的圖像的細節提升算法,嘗試了一下,還是有一定的效果的,結合最近一直研究的SSE優化,把算法的步驟和優化過程分享給大家。   論文的全名是DARK IMAGE ENHANCEMENT BASED ON PAIRWISE TARGET CONTRAST ...

Sun Nov 26 00:28:00 CST 2017 3 6723
SSE圖像算法優化系列十:簡單的一個膚色檢測算法SSE優化

  在很多場合需要高效率的膚色檢測代碼,本人常用的一個C++版本的代碼如下所示:   這段代碼效率的效率已經很高了,對於1080P含有人臉的一般圖像大概也就4.0ms就能處理完,效果嘛對於正常光照和膚色的檢測也還湊合,如下所示 ...

Wed Aug 16 02:22:00 CST 2017 0 3244
SSE圖像算法優化系列十七:多個圖像處理中常用函數的SSE實現。

  在做圖像處理的SSE優化時,也會經常遇到一些小的過程、數值優化等代碼,本文分享一些個人收藏或實現的代碼片段給大家。 一、快速求對數運算   對數運算在圖像處理中也是個經常會遇到的過程,特備是在一些數據壓縮和空間轉換時常常會用到,而且是個比較耗時的函數,標准的SSE庫里並沒有提供該函數的實現 ...

Sun Feb 25 21:34:00 CST 2018 2 2627
SSE圖像算法優化系列十八:三次卷積插值的進一步SSE優化

  本文是在學習https://blog.csdn.net/housisong/article/details/1452249一文的基礎上對算法的理解和重新整理,再次非常感謝原文作者的深入分析以及分享。   三次卷積插值的基礎原理也是對取樣點附近的領域像素按照某種權重分布計算加權的結果值 ...

Wed May 23 07:36:00 CST 2018 0 1676
SSE圖像算法優化系列六:OpenCv關於灰度積分圖的SSE代碼學習和改進。

  最近一直沉迷於SSE方面的優化,實在找不到想學習的參考資料了,就拿個筆記本放在腿上翻翻OpenCv的源代碼,無意中看到了OpenCv中關於積分圖的代碼,仔細研習了一番,覺得OpenCv對SSE的靈活運用真的做的很好,這里記錄下我對該段代碼的品味並將其思路擴展到其他通道數的圖像 ...

Mon May 29 21:30:00 CST 2017 1 3368
[VC兼容32和64] 檢查MMX和SSE系列指令集的支持級別

  以前我寫了一篇《[VC6] 檢查MMX和SSE系列指令集的支持級別(最高SSE4.2)》(http://www.cnblogs.com/zyl910/archive/2012/03/01/checksimd.html)。現在發現該方法存在兩點缺陷——1.不支持64,因為VC的64程序不支持 ...

Sat May 26 06:22:00 CST 2012 0 3475
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM