機器學習套路 —— 樣本集的拆分（正樣本、負樣本） - 碼上歡樂

相關內容簡體繁體

機器學習套路 —— 樣本集的拆分（正樣本、負樣本）

本文轉載自查看原文 2018-01-14 20:03 1619 機器學習實戰

collect negative samples of adaboost algorithm for face detection
機器學習中的正負樣本

所謂正樣本（positive samples）、負樣本（negative samples），對於某一環境下的人臉識別應用來說，比如教室中學生的人臉識別，則教室的牆壁，窗戶，身體，衣服等等便屬於負樣本的范疇。
負樣本通過采集的方式獲取，也可通過生成的方式自動獲取：
- 工作 20x20 大小的人臉檢測，為了獲取盡可能多的負樣本，拍攝一張 1000x1000 像素大小的車的圖像，將其拆分為 20x20 大小的片段，⇒ 50x50
  - 也可將 1000x1000 ⇒ 拆分為 10x10 大小，100x100 副負樣本圖像，為了保持大小的一致，還需進一步將其拉伸到 20x20 的大小；

1. 訓練集負樣本繼續抽樣

保留全部正樣本，負樣本隨機抽取一定比例加入訓練集；

2. 數據平衡

cascade learning 以及重采樣的方法 ==> 實現數據平衡；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習中的正/負樣本如何划分樣本集？圖片樣本集機器學習：樣本集、驗證集（開發集）、測試集不均衡樣本集問題不均衡樣本集的處理訓練樣本集的制作不均衡樣本集的重采樣正樣本、負樣本描述文件的形成方法機器學習樣本標記示意代碼

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM