spark 稠密向量和稀疏向量


Spark mlib的本地向量有兩種:

DenseVctor   :稠密向量   其創建方式   Vector.dense(數據)

SparseVector :稀疏向量   其創建方式有兩種:

  方法一:Vector.sparse(向量長度,索引數組,與索引數組所對應的數值數組)

  方法二:Vector.sparse(向量長度,(索引,數值),(索引,數值),(索引,數值),...(索引,數值))

示例:

比如向量(1,0,3,4)的創建有三種方法:

稠密向量:直接Vectors.dense(1,0,3,4)

稀疏向量:

方法一:Vector.sparse(4,(0,2,3),(1,3,4))  (0,2,3)

    表示該向量的第0個,第2個,第3個位置,(1,3,4) 表示(0,2,3)位置對應的數值分別為1,3,4

方法二:Vector.sparse(4,(0,1),(2,3),(3,4))

    (0,1)就是(索引,數值)的形式。位置0的數值為1, 位置2的數值為3,位置3的數值為4。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM