sklearn.model_selection.StratifiedShuffleSplit 分層抽樣(交叉驗證法的一種)


sklearn.model_selection.StratifiedShuffleSplit 主要用於數據不均勻的時候,比如在醫療數據當中得癌症的人比不得癌症的人少很多,此交叉驗證對象是StratifiedKFold和ShuffleSplit的合並,返回分層的隨機折疊。折疊是通過保留每個類別的樣品百分比來進行的

class sklearn.model_selection.StratifiedShuffleSplit(n_splits=10, *, test_size=None, train_size=None, random_state=None)

參數用法的K折交叉法基本一樣,都是通過構建StratifiedShuffleSplit對象,然后再通過for循環和split函數進行拆分,返回的是對應的索引

具體用法可以參考官網:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedShuffleSplit.html#sklearn.model_selection.StratifiedShuffleSplit.split

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM