用sklearn.cluster对列表数据聚类

本文转载自查看原文 2020-05-09 19:12 942 Python

一、按聚类数进行聚类

def list_cluster(data, n_cluster):
    new_data = [[i, 1] for i in data]
    new_data = np.array(new_data)
    cluster_rst = AgglomerativeClustering(n_clusters=n_cluster, affinity='euclidean', linkage='ward').fit_predict(new_data)

    return_data = []
    for i in range(n_cluster):
        subData = new_data[cluster_rst == i]
        return_data.append(list(subData[:, 0]))

    return return_data

print(list_cluster([1,2,3,53,1,23], 2))

输出：

[[1, 2, 3, 1, 23], [53]]

print(list_cluster([1,2,3,53,1,23], 3))

输出：

[[1, 2, 3, 1], [53], [23]]

二、按差值聚类：

def list_cluster_gap(data, maxgap):
    data.sort()
    groups = [[data[0]]]
    for x in data[1:]:
        if abs(x - groups[-1][-1]) <= maxgap:
            groups[-1].append(x)
        else:
            groups.append([x])
    return groups

print(list_cluster_gap([1,2,3,53,1,23], 20))

输出：

[[1, 1, 2, 3, 23], [53]]

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 机器学习sklearn（63）：算法实例（二十）聚类（三）KMeans （二） sklearn.cluster.KMeans 聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用 Sklearn之聚类分析 sklearn之基于凝聚层次算法的聚类 sklearn之聚类K均值算法 sklearn之聚类的均值漂移算法 python用sklearn进行聚类实践 Kmeans聚类算法的Sklearn实现 sklearn 中的聚类方法的使用 Python中sklearn中的谱聚类代码