collect negative samples of adaboost algorithm for face detection
機器學習中的正負樣本
- 所謂正樣本(positive samples)、負樣本(negative samples),對於某一環境下的人臉識別應用來說,比如教室中學生的人臉識別,則教室的牆壁,窗戶,身體,衣服等等便屬於負樣本的范疇。
- 負樣本通過采集的方式獲取,也可通過生成的方式自動獲取:
- 工作 20x20 大小的人臉檢測,為了獲取盡可能多的負樣本,拍攝一張 1000x1000 像素大小的車的圖像,將其拆分為 20x20 大小的片段,⇒ 50x50
- 也可將 1000x1000 ⇒ 拆分為 10x10 大小,100x100 副負樣本圖像,為了保持大小的一致,還需進一步將其拉伸到 20x20 的大小;
- 工作 20x20 大小的人臉檢測,為了獲取盡可能多的負樣本,拍攝一張 1000x1000 像素大小的車的圖像,將其拆分為 20x20 大小的片段,⇒ 50x50
1. 訓練集負樣本繼續抽樣
- 保留全部正樣本,負樣本隨機抽取一定比例加入訓練集;
2. 數據平衡
- cascade learning 以及重采樣的方法 ==> 實現數據平衡;