R語言實戰之創建數據集



數據結構

向量:

向量是用於存儲數值型、字符型或邏輯型數據的一維數組。

可通過函數c()可用來創建向量

實例操作:

矩陣

矩陣是一個二位數組,只是每個元素都擁有相同的模式(數值型、字符型或邏輯型)

可通過函數matrix()創建矩陣

實例操作:

數組

數組(array)與矩陣類似,但是維度可以大於2

數組可通過array函數創建

實例操作:

數據框

由於不同的列可以包含不同模式(數值型、字符型等)的數據,數據框的概念較矩陣來說更為一般。數據框是R中最常處理的數據結構

數據框可通過函數data.frame()創建

實例操作:

因子

類別(名義型)變量和有序類別(有序型)在R中稱為因子。因子在R中非常重要,因為它決定了數據的分析方式以及如何進行視覺呈現。名義型變量是沒有順序之分的類別變量。有序型變量表示一種順序關系,而非數量關系。連續型變量可以呈現為某個范圍內的任意值。

函數factor()以一個整數向量的形式存儲類別值,整數的取值范圍是[1...k],同時一個由字符串(原始值)組成的內部向量將映射到這些整數上。

實例操作:

列表

列表就是一些對象的有序集合,某個列表中可能是若干向量、矩陣、數據框,甚至其他列表的組合。

可以使用函數list()創建列表:

數據的輸入

R可以從鍵盤、文本文件、excel、數據庫以及其他各種軟件中導入數據,在這里只是用excel的導入作為例子,來了解一下大致的操作。

導入Excel數據

因為使用到了xlsx包,所以要先安裝一下。導入的excel是格力電器的財報數據。這里可以看到excel的數據被轉換成了R中的數據框。

一些簡單操作

可以查看格力電器的收入和凈利潤,或者進一步看最近七年的這兩項數據。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM