R語言中提供了許多用來整合和重塑數據的強大方法。 整合 aggregate 重塑 reshape 在整合數據時,往往將多組觀測值替換為根據這些觀測計算的描述統計量。 在重塑數據時,則會通過修改數據的結構(行與列)來決定數據的組織方式。 樣例數據:mtcars ...
R語言中reshape 函數族 前言 前幾天放出來的那個R的展示中,有說到其實學R的過程更多的就是熟悉各種函數的過程 學習統計模型不在此列...我個人還是傾向於不要借助軟件來學習理論知識,雖然可以直接看codes...筆和紙上的推導還是不可或缺的基本功 ,然后各種基礎函數熟悉了之后很多被打包好的函數就是縮短代碼長度的利器了。 excel里面有神奇的 數據透視表 pivot table ,其實很多時 ...
2016-05-26 16:14 0 4045 推薦指數:
R語言中提供了許多用來整合和重塑數據的強大方法。 整合 aggregate 重塑 reshape 在整合數據時,往往將多組觀測值替換為根據這些觀測計算的描述統計量。 在重塑數據時,則會通過修改數據的結構(行與列)來決定數據的組織方式。 樣例數據:mtcars ...
R語言中plyr包 前言 apply族函數是R語言中很有特色的一類函數,包括了apply、sapply、lapply、tapply、aggregate等等。這一類函數本質上是將數據進行分割、計算和整合。它們在數據分析的各個階段都有很好的用處。例如在數據准備階段,我們可以按某個標准將數據分組 ...
R語言dplyr包 前言 2014年剛到, 就在 Feedly 訂閱里看到 RStudio Blog 介紹 dplyr 包已發布 (Introducing dplyr), 此包將原本 plyr 包中的 ddply() 等函數進一步分離強化, 專注接受dataframe對象, 大幅提高了速度 ...
數據重塑通常使用reshape2包,reshape2包用於實現對寬數據及長數據之間的相互轉換,由於reshape2包不在R的默認安裝包列表中,在第一次使用之前,需要安裝和引用: 重塑數據,首先把寬數據融合(melt),以使每一行都只表示一個變量,然后把數據重塑(cast)為想要 ...
前面一篇講了cast,想必已經見識到了reshape2的強大,當然在使用cast時配合上melt這種強大的揉數據能力才能表現的淋漓盡致。 下面我們來看下,melt這個函數以及它的特點。 melt(data, ..., na.rm = FALSE, value.name = "value ...
我們在做數據分析的時候,對數據進行操作也是一項極其重要的內容,這里我們同樣介紹強大包reshape2,其中的幾個函數,對數據進行操作cast和melt兩個函數絕對少不了。 首先是cast,把長型數據轉換成你想要的任何寬型數據, dcast(data, formula ...
R語言中的apply函數族 前言 最初學習R的時候,當成“又一門編程語言”來學習,但是怎么學都覺得別扭。現在我的看法傾向於,R不是一種通用型的編程語言,而是一種統計領域的軟件工具。因此,不能用通用型編程的思維來設計R代碼。R是一種面向數組(array-oriented)的語法,它更像數學 ...
R語言中aggregate函數 前言 這個函數的功能比較強大,它首先將數據進行分組(按行),然后對每一組數據進行函數統計,最后把結果組合成一個比較nice的表格返回。根據數據對象不同它有三種用法,分別應用於數據框(data.frame)、公式(formula)和時間序列(ts ...