張量==容器
張量是現代機器學習的基礎,他的核心是一個容器,多數情況下,它包含數字,因此可以將它看成一個數字的水桶。
張量有很多中形式,首先讓我們來看最基本的形式。從0維到5維的形式
0維張量/標量:裝在水桶中的每個數字稱為“標量”。標量就是一個數字。
1維張量/標量:數組,一維張量,也被視為“向量",可以把向量視為一個單列或者單行的數字。
2維張量:矩陣。典型的例子就是郵件列表,比如我們有10000個人,每個人都有7個特征(名字,性別,城市等等),張量具有形狀,形狀是一個水桶,既裝着我們數據也定義了張量的最大尺寸。
我們就可以將數據放進二維張量,它是(10000,7),其中行列可以進行調整。
3維張量:這個時候張量才變的有用。我們需要將一系列二維張量存放在水桶中,就形成了3維張量
一個三維張量有三個坐標軸,可以看到:x.ndim 輸出為3,我們再看郵件列表,現在我們有10個郵件列表,我們將存儲2維張量在另一個水桶中創建一個3維張量,
(number_of_mailings_lists,number_of_people,number_of_charactistics_per_person)(10,10000,7)
因此,3維張量就是一個數字構成 的立方體。
存儲在張量數據中的公式,在這里有一些存儲在各種張量 的公用數據集類型:
3維=時間序列
4維=圖像
5維=視頻
幾乎所有的張量的共同之處是樣本量,樣本量是集合中元素的數量。它可以是一些圖像,一些視頻,一些文件或者一些推特。
通常,真實的數據至少是一個數據量。
把形狀里不同維度看成字段,我們找到一個字段的最小值來描述數據。