用途:可以用在智能手機上的名片掃描歸檔或文檔掃描保存。
設想:我們通過手機的攝像頭拍到一張圖片如下
我們的目的是自動獲取小票的位置,然后自動整理成正視效果然后整理存起來,需要的效果可能如下
為了全部自動化於是我們有下邊一些可能實現問題的想法和步驟:
1.首先讀入圖片灰度化。
2.為了尋找小票的位置我們可能想從邊緣這塊出發去尋找小票,為了避免噪音的影響,我們對圖片進行高斯模糊然后再進行canny算查找邊緣
可以看出,其實邊緣檢測效果不太好,具體教通用的參數自己可以去調,這里只做一個示例,當然邊緣效果越好,效果就越准確。
3.做完邊緣檢測之后,接下要找到小票的話,需要尋找小票輪廓,利用邊緣信息尋找輪廓於是有
可以看出,找到的輪廓多到嚇死你,一般像我們這種應用都有個假設,假設我們是用來掃書籍或名片之類的,理論上他們是圖片的焦點,相對來說輪廓都是比較大的。
4.得到原始眾多輪廓之后我們就要想辦法得到我們想要的輪廓了,我們對這些檢測出來的輪廓的面積進行排序取頭5-6個比較大的輪廓,然后計算這4-6個中每個輪廓近似的多邊形,得到各自的頂點,然后判斷哪些輪廓的頂點數量為4的就是我們想要的輪廓了,於是有下圖;
5.這樣子我們就得到小票的4個頂點的位置了,然后我們的目標是正視效果 ,於是新的對應頂點位置 是新圖片的四個頂點,這樣子通過這四個對應點對,我們就可以算出一個投影變換矩陣,然后對原圖進行變換就可能得到我們想要的結果
然后 其實這種方法要做到非常魯棒性,目前這些方法都無法達到要求的,其實可以產生四個頂點,允許用戶交互,對准小票或文檔相對於的四個頂點 然后進行第5步的變化相對於如下
好久沒寫博客了,先這樣了、