手繪幾何圖形具有的特點是,隨意、簡單、可以迅速的表達設計師對產品的設想,有利於捕捉生活中得到的一些靈感。繪圖工具中,需要在大量菜單,選項中選擇所繪的圖形,操作較為繁瑣,在對手繪幾何圖形識別的過程中,通過計算機圖形學,模式識別,人工智能,完成識別,重繪的過程,再完善人機交互的體驗。
一.手繪幾何圖形介紹
手繪圖識別分為聯機和脫機兩種
脫機:通過特定的采集設備如攝像機、掃描儀將圖形以圖像的形式,采集並輸入到計算機。
聯機:通過連接輸入設備,如手寫板,觸摸屏,鼠標將筆的運動軌跡識別發送到計算機。
識別方法不同:
脫機:通常脫機識別的數據是用f(xi,yi)來描述,其中(xi,yi)為坐標(i,j)處的灰度值,所以在識別過程中,我們要對數據進行降噪,二值化等預處理;
聯機:聯機識別中,獲得的是一組二維數據,用來存放筆跡點的坐標,還可以存放筆的移動速度,加速度,筆壓等信息,這些信息可以整合成多維的點的序列,比脫機識別更有優勢。
手繪幾何圖形識別和手寫文字識別比較
同屬於模式識別和計算機視覺研究領域的分支。
文字識別:將輸入數據識別轉化成詞句,並顯示出來。有固定的字符集合。對每個特定字符進行特征分析,在對整個字符集的整體特征進行分析,文字識別筆畫形態相對簡單,書寫需要有嚴格的規范,便於建立魯棒(Robust)的分類器。
手繪幾何圖形識別:沒有特定的字符集,筆畫隨意,特征不明顯,但是圖形具有很多幾何特征,方向、尺寸、連接、交叉,這些幾何特征可以在識別圖形中進行判定。
二.手繪圖識別的研究方法
手繪圖識別主要的幾類研究方法:
模糊類方法:
利用模糊邏輯,模糊知識,從筆跡的位置,方向,速度,加速度,來識別圖形。
幾何方法:
把圖形作為整體識別,進行平滑處理,提取圓弧段,識別結點,分解出直線段,根據相鄰3點的夾角角度作為圓弧和直線段的提取特征,找出實驗閾值,進行分類。
神經網類方法:
通過提取圖素幾何形狀的內角特征,用二進制突觸的權重算法BSW(含一個隱層的前饋網)進行識別的方法。該方法以整體方式識別三角形、橢圓和矩形三種圖素,但僅適用於繪圖包和掌上電腦的自動草繪輸入。
圖元分類:
圖元是組成圖形的最小單元,其無法再被分割成其他幾何線條。
我們把基本的圖元分為:直線,圓,圓弧,橢圓,橢圓弧。
預處理:
數據采集之后需要經過預處理操作,預處理是消除因輸入設備的差異,或者是個人輸入習慣 的不同產生的一些噪聲,如圖中,因為手的抖動,造成有很多毛刺,或者繪圖着畫的慢,造成有些點重復取樣。這些噪聲會影響后面識別的准確性。
降低噪聲的方法通常采用線性平滑算子或非線性平滑算子進行處理。可以通過每隔兩點計算其中心點,然后連接這些中心點作為后續處理筆划的
方法。也可以通過限定草圖的點間距的方法過濾掉多余的草繪點。但方法可能會丟失草繪時的一些動態特征,如速度、加速度等。
三.筆畫分割
筆畫分割的目的是將用戶畫出的復雜圖形分割成基本的圖元。分割的好壞會直接影響到后面識別的部分。
曲率:曲線上各點沿曲線方向的變化情況,借助曲率可以刻畫曲線的幾何特征。
曲率 | 幾何特征 |
連續零曲率 | 直線段 |
連續非零曲率 | 弧線段 |
局部最大曲率絕對值 | 角點 |
局部最大曲率正值 | 凸角點 |
局部最大曲率負值 | 凹角點 |
曲率過零點 | 特征點 |
1.曲率的計算公式:k=△φ/△S
其中:△φ表示切線傾角變化值,△S表示曲線的弧長。
2.繪制速度
用戶繪圖過程中,在拐角處繪制速度會變慢,所以繪圖時的繪制速度也是我們進行特征點判斷的重要依據。由於在繪圖的過程中是等時采樣,任意點的繪制速度,可以用相鄰兩點間的距離代替。
根據曲率及繪制速度來檢測筆划中的特征點進行分割。介紹兩種分割算法:均值濾波和尺度空間濾波法。
均值濾波發:
數據的極值可能是數據的噪聲產生的,所以我沒要消除噪聲所產生的極值,需要設置合適的閾值。如果是固定閾值,可能某種情況很好,某種情況又非常不好,均值濾波起到了一個很好的解決方案。先計算數據的平均值,然后乘以一個固定因子,獲得一個合適的閾值。可以把數據分成大於和小於閾值的兩個部分。
均值濾波需要運用在曲率和速度上,找出合適的特征點,具體步驟如下:
1)遍歷所有采樣點,計算出采樣點的切線與x軸夾角,計算出曲率和平均曲率Ave_Curvature;
2)特征點在全部點鍾占的比例較小,為了提高分割的准確性,所以對Ave_Curvature進行放大,作為曲率極值的判斷閾值。
3)遍歷所有曲率數據,比較找出大於閾值的電,加入到曲率特征點鏈表中。
4)同樣遍歷采樣點,計算出速度數據和Ave_Speed。
5)對速度進行縮小,作為速度極值判斷的閾值。
6)找出比閾值小的點,加入到速度特征點鏈表
7)比較2個鏈表,將重合或相近的電作為特征點輸出。
尺度空間法:
尺度空間思想最早由lijima於1962年提出,但當時並未引起計算機視覺領域研究者們的足夠注意,直到上世紀八十年代,Witkin等人的奠基性工作使得尺度空間方法逐漸得到關注和發展。此后,隨着非線性擴散方程、變分法和數學形態學等方法在計算機視覺領域中的廣泛應用,尺度空間方法進入了快速發展階段。
尺度空間方法的基本思想是:在視覺信息(圖像信息)處理模型中引入一個被視為尺度的參數,通過連續變化尺度參數獲得不同尺度下的視覺處理信息,然后綜合這些信息以深入地挖掘圖像的本質特征。尺度空間方法將傳統的單尺度視覺信息處理技術納入尺度不斷變化的動態分析框架中,因此更容易獲得圖像的本質特征。