AI 圖像識別的測試


隨着AI 的浪潮發展,AI 的應用場景越來越廣泛,其中計算機視覺更是運用到我們生活中的方方面面。
作為一個測試人員,需要緊跟上 AI 的步伐,快速從傳統業務測試,轉型到 AI 的測試上來。而人臉識別作為機器視覺應用場景里最普及常見的一環,因此這一篇結合AI 的架構和核心,以及人臉識別來講一講,AI 怎么測試,以及 AI 測試與傳統測試的區別和共同點。
人臉識別和 AI的關系
先了解 AI兩個基本概念。
a) 計算機視覺
也稱為機器視覺,是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖像處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
最好理解的場景,比如拍一個花的照片,通過機器學習自動告知用戶這是什么花。拍一個店鋪的照片,機器學習自動分析出店鋪的名字,以及店鋪的位置。
b) 生物識別
通過計算機,與光學、聲學、生物傳感器、統計學的概念手段結合,利用人體固有的生理特性和行為特征進行個人身份的鑒定。比如通過人的指紋,和數據庫錄入的指紋比較,判斷是否是同一個人。
機器視覺和生物識別都屬於AI 的應用領域,機器視覺和生物識別的本質,都在於對於圖像圖像的識別和比對。人臉識別,則是將機器視覺與生物識別結合,對人類的面部特征應用計算機視覺的一個典型場景。

怎么測試圖像識別

結合 AI 的架構和核心來分析。

 

1. 數據收集和處理
    既然是視覺,必然是人肉眼所能看到的內容,動態和靜態的景、人、建築、動植物、書本等等,歸根結底可以認為是圖片。數據收集的過程是,在安裝拍照攝像設備之后,從動態的場景與復雜的背景中判斷是否存在識別的對象,並分離出對象。采集到照片。因此測試需要從至少這兩方面來考慮。
a) 采集的素材
圖片的像素、大小、清晰度、色彩、復雜度、噪聲等,會直接影響到計算機識別的結果。
舉個例子來說,下方的三個圖,對於肉眼和計算機學習去區分的難度是明顯不一樣的。識別的難度A一定小於B和C。

 

 b) 采集的器材
圖片一般是用攝像頭拍攝獲得的,那么不同品牌和參數的攝像頭,拍攝出來的照片像素、清晰度、色彩,甚至是層次都會有差異。
2. 數據理解和特征提取
數據理解的目的在於,獲取到原始數據之后,分析數據的有效性,並且將數據里有用的, 並且將有典型特征的抽取出來。比如我們拍攝的各種照片,需要從中識別出是包含一朵花的,還是包含一個人的,是一輛自行車還是一輛小汽車。
這個唯一的解決方案是,讓機器拿到足夠多的樣本進行訓練,訓練的越多,模型將越准確。
測試模型的准確性,也要針對性的找足夠多足夠全的樣本。假設識別的對象是花,那么就盡可能的測試到各地、各類、各種顏色、各種角度的花,真實材質非真實材質等等。假設識別的對象是車,那么就盡可能的測試到各種類別、各種品牌、各種款式的車。
3. 模型構建、訓練和評估
計算機只會告訴我們比對的兩張圖片的相似程度,是80%或者是20%,但不會告訴我們這兩張圖里的內容是否是同一個東西。因此圖片比對一定會有一個閾值的概念。設置相似度大於x%的時候,視為比對通過,小於x%的時候,視為比對不通過。
設定閾值的過程就是模型評估。閾值設定過低,則比對通過率高,誤報率可能也會升高。閾值設定過高,則比對通過率低,誤報率可能也會降低也可能會增高。
測試時,需要不斷的嘗試不同的閾值,找一個通過率和誤報率的平衡點。要針對算法的優劣進行針對性的測試,因為有的算法過於嚴苛,有的算法不夠精准。
人臉識別和圖像識別的差異
人臉識別應用場景 VS 普通圖像識別應用場景
對於人臉來說,最大的問題在於面部特征部位多、可改變性強、面部表情豐富,並且具有動態變化的特性。
另外人臉識別主要用於銀行、機場、出入境的安防,因此相比一般的機器視覺來講,安全方面顯得更加重要。
AI 測試和傳統測試的異同點
綜合來說,AI 測試,需要結合 AI 的架構、算法和應用場景做針對性的測試。除此以外,一般性的功能、性能、兼容和傳統業務測試無異。
————————————————
版權聲明:本文為CSDN博主「alice_tl」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/alice_tl/article/details/80314398

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM