原文:SSE图像算法优化系列四:图像转置的SSE优化(支持8位、24位、32位),提速4-6倍

一 前言 转置操作在很多算法上都有着广泛的应用,在数学上矩阵转置更有着特殊的意义。而在图像处理上,如果说图像数据本身的转置,除了显示外,本身并无特殊含义,但是在某些情况下,确能有效的提高算法效率,比如很多行列可分离的算法,在很多情况下,行和列方向的算法逻辑随相同,但是由于多方面原因 比如Cache miss, 优化水平等 行列处理时间还是由很大的差异的,这个时候如果转置的耗时和处理时间相比所占比例 ...

2017-05-02 20:47 9 6423 推荐指数:

查看详情

SSE图像算法优化系列九:灵活运用SIMD指令16提升Sobel边缘检测的速度(4000*3000的24位图像时间由480ms降低到30ms)。

  这半年多时间,基本都在折腾一些基本的优化,有很多都是十几年前的技术了,从随大流的角度来考虑,研究这些东西在很多人看来是浪费时间了,即不能赚钱,也对工作能力提升无啥帮助。可我觉得人类所谓的幸福,可以分为物质档次的享受,还有更为复杂的精神上的富有,哪怕这种富有只是存在于短暂的自我满足中也是值得 ...

Sat Aug 05 02:23:00 CST 2017 8 4926
SSE图像算法优化系列十二:多尺度的图像细节提升。

  无意中浏览一篇文章,中间提到了基于多尺度的图像的细节提升算法,尝试了一下,还是有一定的效果的,结合最近一直研究的SSE优化,把算法的步骤和优化过程分享给大家。   论文的全名是DARK IMAGE ENHANCEMENT BASED ON PAIRWISE TARGET CONTRAST ...

Sun Nov 26 00:28:00 CST 2017 3 6723
SSE图像算法优化系列十:简单的一个肤色检测算法SSE优化

  在很多场合需要高效率的肤色检测代码,本人常用的一个C++版本的代码如下所示:   这段代码效率的效率已经很高了,对于1080P含有人脸的一般图像大概也就4.0ms就能处理完,效果嘛对于正常光照和肤色的检测也还凑合,如下所示 ...

Wed Aug 16 02:22:00 CST 2017 0 3244
SSE图像算法优化系列十七:多个图像处理中常用函数的SSE实现。

  在做图像处理的SSE优化时,也会经常遇到一些小的过程、数值优化等代码,本文分享一些个人收藏或实现的代码片段给大家。 一、快速求对数运算   对数运算在图像处理中也是个经常会遇到的过程,特备是在一些数据压缩和空间转换时常常会用到,而且是个比较耗时的函数,标准的SSE库里并没有提供该函数的实现 ...

Sun Feb 25 21:34:00 CST 2018 2 2627
SSE图像算法优化系列十八:三次卷积插值的进一步SSE优化

  本文是在学习https://blog.csdn.net/housisong/article/details/1452249一文的基础上对算法的理解和重新整理,再次非常感谢原文作者的深入分析以及分享。   三次卷积插值的基础原理也是对取样点附近的领域像素按照某种权重分布计算加权的结果值 ...

Wed May 23 07:36:00 CST 2018 0 1676
SSE图像算法优化系列六:OpenCv关于灰度积分图的SSE代码学习和改进。

  最近一直沉迷于SSE方面的优化,实在找不到想学习的参考资料了,就拿个笔记本放在腿上翻翻OpenCv的源代码,无意中看到了OpenCv中关于积分图的代码,仔细研习了一番,觉得OpenCv对SSE的灵活运用真的做的很好,这里记录下我对该段代码的品味并将其思路扩展到其他通道数的图像 ...

Mon May 29 21:30:00 CST 2017 1 3368
[VC兼容32和64] 检查MMX和SSE系列指令集的支持级别

  以前我写了一篇《[VC6] 检查MMX和SSE系列指令集的支持级别(最高SSE4.2)》(http://www.cnblogs.com/zyl910/archive/2012/03/01/checksimd.html)。现在发现该方法存在两点缺陷——1.不支持64,因为VC的64程序不支持 ...

Sat May 26 06:22:00 CST 2012 0 3475
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM