統計學當中關於變量的分類

本文轉載自查看原文 2017-12-06 21:49 35947 機器學習知識

統計學中的變量指的是研究對象的特征，我們有時也稱為屬性，例如人的身高、性別等。

每個變量都有變量的值和變量的類型。我們按照變量的類型對變量進行划分。

統計學中的變量（variables）大致可以分為數值變量（numrical）和分類變量（categorical）。

數值型變量是值可以取一些列的數，這些值對於加法、減法、求平均值等操作是有意義的。而分類變量對於上述的操作是沒有意義的。

數值變量又可以分為下面兩類：

離散型變量（discrete）：值只能用自然數或整數單位計算，其數值是間斷的，相鄰兩個數值之間不再有其他數值，這種變量的取值一般使用計數方法取得。

連續型變量（continuous）：在一定區間內可以任意取值，其數值是連續不斷的，相鄰兩個數值可作無限分割，即可取無限個數值。如身高、繩子的長度等。
和離散型變量相比，連續型變量有“真零點”的概念，所以可以進行乘除操作。

分類變量又可以分為下面兩類：

有序分類變量（ordinal）：描述事物等級或順序，變量值可以是數值型或字符型，可以進而比較優劣，如喜歡的程度：很喜歡、一般、不喜歡。
無序分類變量（nominal）：取值之間沒有順序差別，僅做分類，又可分為二分類變量和多分類變量二分類變量是指將全部數據分成兩個類別，如男、女，對、錯，陰、陽等，二分類變量是一種特殊的分類變量，有其特有的分析方法。多分類變量是指兩個以上類別，如血型分為A、B、AB、O。

有序分類變量和無需分類變量的區別是：前者對於“比較”操作是有意義的，而后者對於“比較”操作是沒有意義的。

這四種數據的等級從低到高依次為：無序分類變量(nominal) <有序分類變量(ordinal)< 離散型數值變量(discrete)< 連續型數值變量(continuous)。

下面的一張圖描述了它們之間的關系：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 《漫畫統計學》統計學認識 Bootstrap 方法。（統計學）統計學的矩（moment）用R理解統計學統計學知識大梳理【統計學】1.導論統計學總體、總體單位、指標、標志、變異、變量、統計指標體系的區別【統計學】第九章分類數據分析統計學基礎——統計圖