python中shuffleSplit()函數


參數:

 

n : int

數據集中的元素總數。

n_iter : int (default 10)

重新洗牌和分裂迭代次數。

test_size : float (default 0.1), int, or None

如果是float類型的數據, 這個數應該介於0-1.0之間,代表test集所占比例. 如果是int類型, 代表test集的數量. 如果為None, 值將自動設置為train集大小的補集

train_size : float, int, or None (default is None)

如果是float類型的數據 應該介於0和1之間,並表示數據集在train集分割中所占的比例 如果是int類型, 代表train集的樣本數量. 如果為None, 值將自動設置為test集大小的補集

random_state : int or RandomState

用於隨機抽樣的偽隨機數發生器狀態。

 

[python]  view plain  copy
 
  1. >>> from sklearn import cross_validation  
  2. >>> rs = cross_validation.ShuffleSplit(4, n_iter=3,  
  3. ...     test_size=.25, random_state=0)  
  4. >>> len(rs)  
  5. 3  
  6. >>> print(rs)  
  7. ...   
  8. ShuffleSplit(4, n_iter=3, test_size=0.25, ...)  
  9. >>> for train_index, test_index in rs:  
  10. ...    print("TRAIN:", train_index, "TEST:", test_index)  
  11. ...  
  12. TRAIN: [0] TEST: [2]  
  13. TRAIN: [3] TEST: [0]  
  14. TRAIN: [1] TEST: [3]  
 

[python]  view plain  copy
 
  1. >>> rs = cross_validation.ShuffleSplit(4, n_iter=3,  
  2. ...     train_size=0.5, test_size=.25, random_state=0)  
  3. >>> for train_index, test_index in rs:  
  4. ...    print("TRAIN:", train_index, "TEST:", test_index)  
  5. ...  
  6. TRAIN: [1] TEST: [2]  
  7. TRAIN: [1] TEST: [0]  
  8. TRAIN: [2] TEST: [3]  
  9. .. automethod:: __init__  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM