R語言數據集的字段含義
作者:馬文敏
選擇一種數據結構來儲存數據
將數據輸入或導入到這個數據結構中
數據集的概念
數據集通常是有數據結構的一個矩形數組,行表示規則,列表示變量。
不同的行業對數據集的行和列的叫法不同
統計學家稱他們為觀測和變量
數據庫分析為記錄和字段
示例分析者叫他們示例
R語言可以處理的數據類型有很多種包括數據型,字符型,邏輯性,原生性。
2.數據結構
R語擁有很多用於儲存數據的對象類型,包括標量,向量,矩陣,數組,數據框和列表。
向量
向量數據必須要有相同的類型和模式的數據,通過給定的元素數值可以訪問向量中的元素,用函數c()可創建向量。
myymatrix<-
Matrix(vector.nrow=number
其中vector包含了矩陣的元素,nrow和ncol用於指定的行和列的維數,dimnames包含了可選的,以字符型的向量表示行名和列名,選型byrows則表明矩陣應當按行填充。
矩陣
矩陣是一個二維數組,他通過函數matrix()創建,每一個元素都擁有相同的模式(數值型,字符型,邏輯型)
提取矩陣中的元素時用[.],其中逗號前后分辨率是,行數和列數。
兩行的矩陣。
X #查看矩陣內容
數組
數組和矩陣比較類似,但是維度可以大於2。但是他是一個數值型向量,可通過函數ayyay來創建,形式為myarry<-array(vector,dimensions,dimnames0000)其中vector包含了數組中的數據,dimensions是一個數值型向量,給出了各個維度下標的最大值,而dimnames是可選的,各維度名稱標簽的列表。
數據框
數據框是在R語中比較常見的數據結構。他的作用是當數據有多種模式而無法將這些數據放在一個矩陣中時,這時候就可以選擇數據框,同一行列的數據模式必須相同,可通過data,frame()來創建。
使用¥來提取數據庫中的特定元素,但是每次輸入數據框名,有點麻煩。
列表
列表是R的數據類型中最為復雜的一種,列表就是一些對象的有序集合。列表允許整合若干的對象到單個對象名下。例如,某個列表中可能是若干向量,矩陣,數據框,甚至其他列表組合。可以使用函數list()創建列表。
列表是R中重要的數據結構
列表允許以一種簡單的方式組織和重新調用不相干的信息
許多R函數的運行結果都是以列表的形式返回的。
3.數據輸入
數據輸入可以使用read.table()文本文件中導入數據。
算數表達式。他是直接輸入的,輸入完成之后按下回車鍵顯示結果,如果想保存輸入結果,直接將其命名一個變量即可。
樣本數據輸入。最常使用的是c()函數,括號內的內容可以是數字或文本,也可以是儲存結果的變量,內容間用逗號分隔,如果既有文本也有數字,那么數字將會被強制轉換為文本。
數據導入。當數據量較大時,使用c函數和scan函數就會不太方便,雖然scan函數也可以進行文件導輸但是主要針對一維數據,當遇到復雜一些數據時,需要使用其他的函數。
參考文獻:
百度---E書聯盟
火狐---科普中國百科科學詞條
火狐---CSDN博客