原文:R語言:數據的分割-計算-整合(split-apply-aggregate)

當獲取到原始數據時,我們通常的做法是對該數據進行分割成小片段,然后對各小片段進行計算統計,最后整合成最終的數據。這是統計學里數據處理的一般規律。 R語言為我們提供了相應的函數來分別處理這三個階段任務。 分割:split 和subset 函數。 計算:apply ,lapply ,tapply ,sapply 整合:aggregate 注意幾點: .向量,矩陣,數組的長度就是它元素的個數,用leng ...

2018-09-11 09:19 0 3575 推薦指數:

查看詳情

R語言-數據整形之aggregate函數

R語言aggregate函數 前言   這個函數的功能比較強大,它首先將數據進行分組(按行),然后對每一組數據進行函數統計,最后把結果組合成一個比較nice的表格返回。根據數據對象不同它有三種用法,分別應用於數據框(data.frame)、公式(formula)和時間序列(ts ...

Thu May 26 06:57:00 CST 2016 0 46734
R語言-數據整形之apply函數族

R語言中的apply函數族 前言   最初學習R的時候,當成“又一門編程語言”來學習,但是怎么學都覺得別扭。現在我的看法傾向於,R不是一種通用型的編程語言,而是一種統計領域的軟件工具。因此,不能用通用型編程的思維來設計R代碼。R是一種面向數組(array-oriented)的語法,它更像數學 ...

Wed May 25 00:19:00 CST 2016 0 4558
R語言aggregate函數

前言 這個函數的功能比較強大,它首先將數據進行分組(按行),然后對每一組數據進行函數統計,最后把結果組合成一個比較nice的表格返回。根據數據對象不同它有三種用法,分別應用於數據框(data.frame)、公式(formula)和時間序列(ts): x=data.frame(name=c ...

Thu Oct 31 20:51:00 CST 2019 0 2178
split分割文件與數據

split主要用途:在之前計算機發展的時候,我們必須分割文件,才能將大量數據放入多張軟盤中,而今我們分割文件有了其他的目的,比如提高可讀性,生成日志以及發送有大小限制的E-mail附件。 工作原理:split命令接收文件名作為參數,然后創建出一系列體積更小的文件,其中依據字母序 ...

Sun Nov 03 05:30:00 CST 2019 1 317
R語言數據分割

好在R和Python中有現成的數據分割函數,避免手動寫函數導致划分比例不合理、訓練集與測試集的樣本的結構與總體不均衡的問題。 R語言中caTools包中的sample.split函數可以用來自動將原始數據分割成訓練集和測試集。 方法一 caTools中的sample.split函數 ...

Wed Apr 15 18:36:00 CST 2020 0 1519
R語言caret包的學習(三)--數據分割

本文將就caret包中的數據分割部分進行介紹學習。主要包括以下函數:createDataPartition(),maxDissim(),createTimeSlices(),createFolds(),createResample(),groupKFold()等 基於輸出結果的簡單分割 ...

Tue Jan 16 21:16:00 CST 2018 1 4108
R語言apply函數

R語言apply函數,可以實現批量對矩陣、數據框的行或者列進行各種處理。 apply的第一個參數指定操作對象, 第二個參數指定對行還是列進行操作, 第三個參數指定操作類型 1、示例1 2、示例2 ...

Mon Nov 01 18:54:00 CST 2021 0 1135
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM