sklearn.model_selection.StratifiedShuffleSplit 主要用於數據不均勻的時候,比如在醫療數據當中得癌症的人比不得癌症的人少很多,此交叉驗證對象是StratifiedKFold和ShuffleSplit的合並,返回分層的隨機折疊。折疊是通過保留每個類別的樣品百分比來進行的
class sklearn.model_selection.StratifiedShuffleSplit(n_splits=10, *, test_size=None, train_size=None, random_state=None)
參數用法的K折交叉法基本一樣,都是通過構建StratifiedShuffleSplit對象,然后再通過for循環和split函數進行拆分,返回的是對應的索引