歡迎關注“
計算機視覺研究院
”
計算機視覺研究院專欄
計算機視覺研究院
專注CV領域公眾號
作者:Edison_G
長按二維碼關注
前言 計算機視覺可以學習美式手語,進而幫助聽力障礙群體嗎?數據科學家David Lee用一個項目給出了答案。
如果聽不到了,你會怎么辦?如果只能用手語交流呢?

如果通過機器學習應用可以精確地翻譯美式手語,即使從最基礎的字母表開始,我們也能向着為聽力障礙群體提供更多的便利和教育資源前進一步。
數據和項目介紹出於多種原因,David Lee決定創建一個原始圖像數據集。首先,基於移動設備或攝像頭設置想要的環境,需要的分辨率一般是720p或1080p。現有的幾個數據集分辨率較低,而且很多不包括字母「J」和「Z」,因為這兩個字母需要一些動作才能完成。





-
D 被預測為 F;
-
E 被預測為 T;
-
P 被預測為 Q;
-
R 被預測為 U。
視頻推斷測試



多實例


許多原始圖像是用手機拍攝的,手到攝像頭的距離比較近,這對遠距離推斷有一定負面影響。 新環境

這支視頻來自於志願者,未用於模型訓練。盡管模型看到過很多字母,但對此的預測置信度較低,還有一些錯誤分類。 背景推斷

該測試旨在驗證不同的背景會影響模型的性能。 結論這個項目表明:計算機視覺可用於幫助聽力障礙群體獲取更多便利和教育資源!該模型在僅使用小型數據集的情況下仍能取得不錯的性能。即使對於不同環境中的不同手部,模型也能實現良好的檢測結果。而且一些局限性是可以通過更多訓練數據得到解決的。經過調整和數據集的擴大,該模型或許可以擴展到美式手語字母表以外的場景。

原文鏈接:https://daviddaeshinlee.medium.com/using-computer-vision-in-helping-the-deaf-and-hard-of-hearing-communities-with-yolov5-7d764c2eb614
/End.
我們開創“ 計算機視覺協會 ”知識星球一年有余,也得到很多同學的認可,我們定時會推送實踐型內容與大家分享,在星球里的同學可以隨時提問,隨時提需求,我們都會及時給予回復及給出對應的答復。

計算機視覺研究院主要涉及深度學習領域,主要致力於人臉檢測、人臉識別,多目標檢測、目標跟蹤、圖像分割等研究方向。研究院接下來會不斷分享最新的論文算法新框架,我們這次改革不同點就是,我們要着重” 研究 “。之后我們會針對相應領域分享實踐過程,讓大家真正體會 擺脫理論 的真實場景,培養愛動手編程愛動腦思考的習慣!
