【scikit-learn】06：make_blobs聚類數據生成器

本文轉載自查看原文 2019-08-26 15:39 404 AI(人工智能)

本文鏈接： https://blog.csdn.net/kevinelstri/article/details/52622960

make_blobs聚類數據生成器簡介

scikit中的make_blobs方法常被用來生成聚類算法的測試數據，直觀地說，make_blobs會根據用戶指定的特征數量、中心點數量、范圍等來生成幾類數據，這些數據可用於測試聚類算法的效果。

make_blobs方法:

sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)[source]

其中：

n_samples是待生成的樣本的總數。
n_features是每個樣本的特征數。
centers表示類別數。
cluster_std表示每個類別的方差，例如我們希望生成2類數據，其中一類比另一類具有更大的方差，可以將cluster_std設置為[1.0,3.0]。

例：生成3類數據用於聚類（100個樣本，每個樣本有2個特征）

from sklearn.datasets import make_blobs from matplotlib import pyplot data,target=make_blobs(n_samples=100,n_features=2,centers=3) # 在2D圖中繪制樣本，每個樣本顏色不同 pyplot.scatter(data[:,0],data[:,1],c=target); pyplot.show()

這里寫圖片描述

為每個類別設置不同的方差，只需要在上述代碼中加入cluster_std參數即可：

from sklearn.datasets import make_blobs from matplotlib import pyplot data,target=make_blobs(n_samples=100,n_features=2,centers=3,cluster_std=[1.0,3.0,2.0]) #在2D圖中繪制樣本，每個樣本顏色不同 pyplot.scatter(data[:,0],data[:,1],c=target); pyplot.show()

這里寫圖片描述

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 聚類算法數據生成器make_blobs 機器學習筆記：sklearn.datasets樣本生成器——make_classification、make_blobs、make_regression scikit-leanr 庫中的 make_blobs() 函數 Scikit-learn的kmeans聚類 make_blobs scikit-learn 不同聚類算法的比較用scikit-learn學習BIRCH聚類用scikit-learn學習DBSCAN聚類用scikit-learn學習BIRCH聚類用scikit-learn學習譜聚類