在大数据处理,尤其是图像处理和自然语言处理中,有时候矩阵占的内存会非常的大,给计算的速度带来了麻烦,通过稀疏矩阵的方法,可以大大降低内存占用,优化计算资源。
我们先用R语言生成一个矩阵m1, m1为一个100×100的矩阵
代码为:
>m1=matrix(rep(0,100),100,100)
查看m1占用内存情况:
> object.size(m1)
80200 bytes
接下来生成一个矩阵m2, m2为m1的稀疏矩阵
代码为:
>m2=Matrix::Matrix(rep(0,100),100,100,sparse=TRUE)
查看m2占用内存情况:
> object.size(m1)
2032 bytes
我们发现内存占用缩小了近40倍!!!