R語言 概述
- R語言是用於統計分析,圖形表示和報告的編程語言和軟件環境。 R語言由Ross Ihaka和Robert Gentleman在新西蘭奧克蘭大學創建,目前由R語言開發核心團隊開發。
- R語言的核心是解釋計算機語言,其允許分支和循環以及使用函數的模塊化編程。 R語言允許與以C,C ++,.Net,Python或FORTRAN語言編寫的過程集成以提高效率。
- R語言在GNU通用公共許可證下免費提供,並為各種操作系統(如Linux,Windows和Mac)提供預編譯的二進制版本。
- R是一個在GNU風格的副本左側的自由軟件,GNU項目的官方部分叫做GNU S.
R的演變
R語言最初是由新西蘭奧克蘭奧克蘭大學統計系的Ross Ihaka和Robert Gentleman寫的。 R語言於1993年首次亮相
- 一大群人通過發送代碼和錯誤報告對R做出了貢獻
- 自1997年年中以來,已經有一個核心組(“R核心團隊”)可以修改R源代碼歸檔
R的特點
如前所述,R語言是用於統計分析,圖形表示和報告的編程語言和軟件環境。 以下是R語言的重要特點:
- R語言是一種開發良好,簡單有效的編程語言,包括條件,循環,用戶定義的遞歸函數以及輸入和輸出設施
- R語言具有有效的數據處理和存儲設施
- R語言提供了一套用於數組,列表,向量和矩陣計算的運算符
- R語言為數據分析提供了大型,一致和集成的工具集合
- R語言提供直接在計算機上或在紙張上打印的圖形設施用於數據分析和顯示
作為結論,R語言是世界上最廣泛使用的統計編程語言。 它是數據科學家的第一選擇,並由一個充滿活力和有才華的貢獻者社區支持
R的環境
注釋 --> #
賦值 --> <- / =
運行 --> 回車鍵
R環境配置
包
是R函數、數據、預編譯代碼以一種定義完善的格式組成的集合
# 安裝包 install.packages(‘包名’) # 更新包 update.packages(‘包名’) # 查看包的描述 installed.packages()
庫
庫(library):存儲包的目錄
# 顯示庫所在位置 .libPaths() # 顯示庫中的包 library() # 載入包 library(‘包名’) # 查詢包的使用 help(package=’包名’)
help
# 打開幫助文檔 help.start() # 安裝vcd包 --> 數據可視化 install.packages('vcd') # 列出包所用函數及相應數據集 help.packages('vcd') # 載入包並讀取數據集 library(vcd) # 列出數據集內容 help(Arthritis) print(Arthritis) example(Arthritis)

創建數據集
數據集:由數據構成的一個矩形數組
- 行 --> 觀測、記錄
- 列 --> 變量、字段
# 查看R中所有內置的數據集 data(package = .packages(all.available = TRUE)) # 查看指定包中的數據集 data(package = ‘包名’) # 查看某個數據集的信息 help(數據集) ?數據集
