R 語言賦值運算符：`<-` , `=`, `<<-`

本文轉載自查看原文 2015-02-26 15:13 10219 R/ 賦值運算符

`<-` 與 `=` 間的區別

<- 與 = 在大部分情況下是應該可以通用的。並且，相對於 <<- 運算符，它們的賦值行為均在它們自身的環境層（environment hierarchy）中進行。

R語言中，<- 與 = 這兩個賦值運算符最主要的區別在於兩者的作用域不同。大家可以從下面的例子感受一下。

好多好多人喜歡用的 `=`

貌似許多早期學習R的童鞋都比較喜歡使用 = 進行賦值。畢竟，簡簡單單的a = 5用起來比較符合大多數現有語言的習慣。

> rm(x)       ## 如果變量 x 存在的話，刪除此變量
> mean(x = 1:10)
[1] 5.5
> x
Error: object 'x' not found

在以上范例里，變量 x 是在函數的作用域里進行聲明的，所以它只存在於此函數中，一旦運算完成便“消失”。

而對於 `<-`

使用 <- 的運算結果則如下：

> mean(x <- 1:10)
[1] 5.5
> x
[1]  1  2  3  4  5  6  7  8  9 10

這一次， Global Environment 里出現了 x 變量

在什么情況下， `<-` 賦值會成立？

在以上代碼里，你可能會認為計算機對上述語句進行的處理是“將 1:10 賦值給 x , 然后計算 x 的均值。”在某些語言里，計算機的確是如此處理的，比如說 C 。但是在R語言中，卻不是這樣的。見下例。

> a <- 1
> f <- function(a) return(TRUE)
> f <- f(a <- a + 1); a
[1] TRUE
[1] 1

請注意，以上范例里， a 的值並沒有改變！！在 R 中，在參數中進行賦值的變量只有在需要進行評估時才會改變其值。（也許，大家可以類比一下邏輯短路？1 < 0 && 2 == 1）這會導致程序里出現一些不可預期的結果並且降低代碼可讀性，所以並不推薦在函數參數里使用這一種賦值方式（事實上，函數參數弄那么復雜也是太無聊了了吧）

> a <- 1
> f <- function(a) {
+         if(runif(1)>0.5) TRUE 
+         else a
+ }

> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] 2
> f(a <- a+1);a
[1] TRUE
[1] 2
> f(a <- a+1);a
[1] 3

上述代碼中，向函數 f() 傳遞傳遞參數 a <- a + 1 后，只有在隨機數 runif(1) 小於0.5的時候，a 的值才會改變，即執行+1操作。否則傳遞TRUE值。因此，因為隨機數 runif(1) 的隨機性，每次調用函數 f()后 a 的值是不確定的。

BUT！

並不是說 <-看起來復雜所以就索性不用它了。事實上，正如上文所說，如果不是有人會這么無聊在R 語言里進行數據分析時用 <- 弄個這么坑爹的函數參數，這個賦值號的意義本身是很清晰的。

<- 長得像箭頭，實質上也是個箭頭，如果覺得從右向左賦值讓你覺得不爽的話，用 -> 甚至都是可以的。而那個傳統的 = 號，在 R 里實質上是退化了的，其在規范的 R 語言代碼里其實一般是作為為子集賦“name”的存在。

一個較為規范的賦值號使用方式應該是醬紫的。

> a <- list(hello = 1, world = 2 ) ##如果 <- 換成 = 得多混亂……
> a
$hello
[1] 1

$world
[1] 2

> a$hello
[1] 1
> a[["world"]]  ## '$' 與 '[["..."]]'是兩種不同的引用name的方式~~
[1] 2

`<<—` 運算符，向上一環境層寫入變量

在 R 語言中，處在某一個環境層的代碼都擁有讀入上一環境層的變量的權限，但相反地，若只通過標准的賦值運算符 <- ，是無法向上一環境層寫入變量的。若想在上一環境層進行賦值行為，即向上一層次寫入變量，則需要用到 <<- （superassignment）運算符啦~

對非局部變量進行寫入操作

看，灰機！

> plusx <- function(x){
+         a <<- 1 + x
+         b <- 2 + x
+         x <- x * 2        
+ }

> a
Error: object 'a' not found
> b
Error: object 'b' not found
> x <- 1

> plusx(x)
> a
[1] 2
> b
Error: object 'b' not found
> x
[1] 1

分析一下函數two() 中的三個變量 x, a, b

x：作為plusx()的實際參數，調用時其值1復制到形參 x ，但形參仍為局部變量，故作為全局變量的 x 值不變
a：在調用函數plusx() 之前，變量 a 和 b 是根本就不存在的。直到調用了plusx()后，a 才在出現。並且，由於plusx()的上一環境層即為頂層環境（Global Environment）, 可直接在變量框內看見 a。
b：為局部變量，正如上文所說， <- 進行的賦值僅在當前環境層進行。

此例表明，通過 <<- 賦值符，plusx()函數在頂層環境寫入了變量 a .

一些注意事項

一般說來， <<- 多用於在頂層環境中寫入變量。然而需要注意的是，以 <<- 執行賦值時，會一直向上直至頂層進行變量查找。若在查找過程中尋找到該名稱的變量，就會進行賦值操作。否則，將在頂層環境中創建變量並賦值。

> glob <- function(){
+         d <- 5
+         nxt1 <- function(){d <<- e + 1}
+         e <- 2
+         nxt1()
+         d        
+ }

> glob()
[1] 3
> d
Error: object 'd' not found

此處，對 d 運用了 <<- 進行賦值時，由於nxt1()的上一環境層中出現了變量 d ，故賦值在glob()環境層進行，而非頂層（Global Environment）

對比以下代碼：

> glob <- function(){
> 
+         ##區別在這里，少了一行' d <- 5' 
+          
+         nxt1 <- function(){d <<- e + 1}
+         e <- 2
+         nxt1()
+         d        
+ }

> glob()
[1] 3
> d
[1] 3

此處，由於glob()環境中沒有 d 變量的存在，在 nxt1() 中使用 <<- 賦值時變量 d 成為頂層變量。

參考資料

[1]某論壇中貼出的關於的 <- 與 = 區別的英文例子http://www.itongji.cn/tag/Ryuyan_2417_1.html
[2]<<- 賦值號部分主要參考於The Art of R Programming（《R語言編程藝術》）7.8 Writing Upstair

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C語言基礎丨運算符之賦值運算符（五） matlab賦值運算符等號 C#賦值運算符 java 賦值運算符 C語言中11種賦值運算符的具體含義 python中增強型賦值運算符擴展賦值運算符基本用法及注意事項 Java復合賦值運算符(Compound Assignment Operators) R語言運算符 PHP中的運算符---算術運算符、邏輯運算符、賦值運算符、比較運算符