機器學習套路 —— 樣本集的拆分(正樣本、負樣本)


collect negative samples of adaboost algorithm for face detection
機器學習中的正負樣本

  • 所謂正樣本(positive samples)、負樣本(negative samples),對於某一環境下的人臉識別應用來說,比如教室中學生的人臉識別,則教室的牆壁,窗戶,身體,衣服等等便屬於負樣本的范疇。
  • 負樣本通過采集的方式獲取,也可通過生成的方式自動獲取:
    • 工作 20x20 大小的人臉檢測,為了獲取盡可能多的負樣本,拍攝一張 1000x1000 像素大小的車的圖像,將其拆分為 20x20 大小的片段,⇒ 50x50
      • 也可將 1000x1000 ⇒ 拆分為 10x10 大小,100x100 副負樣本圖像,為了保持大小的一致,還需進一步將其拉伸到 20x20 的大小;

1. 訓練集負樣本繼續抽樣

  • 保留全部正樣本,負樣本隨機抽取一定比例加入訓練集;

2. 數據平衡

  • cascade learning 以及重采樣的方法 ==> 實現數據平衡;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM