R 語言賦值運算符:`<-` , `=`, `<<-`


<-= 間的區別

<-= 在大部分情況下是應該可以通用的。並且,相對於 <<- 運算符,它們的賦值行為均在它們自身的環境層(environment hierarchy)中進行。

R語言中,<-= 這兩個賦值運算符最主要的區別在於兩者的作用域不同。大家可以從下面的例子感受一下。

好多好多人喜歡用的 =

貌似許多早期學習R的童鞋都比較喜歡使用 = 進行賦值。畢竟,簡簡單單的a = 5用起來比較符合大多數現有語言的習慣。

> rm(x)       ## 如果變量 x 存在的話,刪除此變量
> mean(x = 1:10)
[1] 5.5
> x
Error: object 'x' not found

在以上范例里,變量 x 是在函數的作用域里進行聲明的,所以它只存在於此函數中,一旦運算完成便“消失”。

而對於 <-

使用 <- 的運算結果則如下:

> mean(x <- 1:10)
[1] 5.5
> x
[1]  1  2  3  4  5  6  7  8  9 10

這一次, Global Environment 里出現了 x 變量

在什么情況下, <- 賦值會成立?

在以上代碼里,你可能會認為計算機對上述語句進行的處理是“將 1:10 賦值給 x , 然后計算 x 的均值。”在某些語言里,計算機的確是如此處理的,比如說 C 。但是在R語言中,卻不是這樣的。見下例。

> a <- 1
> f <- function(a) return(TRUE)
> f <- f(a <- a + 1); a
[1] TRUE
[1] 1

請注意,以上范例里, a 的值並沒有改變!!在 R 中,在參數中進行賦值的變量只有在需要進行評估時才會改變其值。(也許,大家可以類比一下邏輯短路?1 < 0 && 2 == 1)這會導致程序里出現一些不可預期的結果並且降低代碼可讀性,所以並不推薦在函數參數里使用這一種賦值方式(事實上,函數參數弄那么復雜也是太無聊了了吧)

> a <- 1
> f <- function(a) {
+         if(runif(1)>0.5) TRUE 
+         else a
+ }

> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] 2
> f(a <- a+1);a
[1] TRUE
[1] 2
> f(a <- a+1);a
[1] 3

上述代碼中,向函數 f() 傳遞傳遞參數 a <- a + 1 后,只有在隨機數 runif(1) 小於0.5的時候,a 的值才會改變,即執行+1操作。否則傳遞TRUE值。因此,因為隨機數 runif(1) 的隨機性,每次調用函數 f()后 a 的值是不確定的。

BUT!

並不是說 <-看起來復雜所以就索性不用它了。事實上,正如上文所說,如果不是有人會這么無聊在R 語言里進行數據分析時用 <- 弄個這么坑爹的函數參數,這個賦值號的意義本身是很清晰的。

<- 長得像箭頭,實質上也是個箭頭,如果覺得從右向左賦值讓你覺得不爽的話,用 -> 甚至都是可以的。而那個傳統的 = 號,在 R 里實質上是退化了的,其在規范的 R 語言代碼里其實一般是作為為子集賦“name”的存在。

一個較為規范的賦值號使用方式應該是醬紫的。

> a <- list(hello = 1, world = 2 ) ##如果 <- 換成 = 得多混亂……
> a
$hello
[1] 1

$world
[1] 2

> a$hello
[1] 1
> a[["world"]]  ## '$' 與 '[["..."]]'是兩種不同的引用name的方式~~
[1] 2



<<— 運算符,向上一環境層寫入變量

在 R 語言中,處在某一個環境層的代碼都擁有讀入上一環境層的變量的權限,但相反地,若只通過標准的賦值運算符 <- ,是無法向上一環境層寫入變量的。若想在上一環境層進行賦值行為,即向上一層次寫入變量,則需要用到 <<- (superassignment)運算符啦~

對非局部變量進行寫入操作

看,灰機!

> plusx <- function(x){
+         a <<- 1 + x
+         b <- 2 + x
+         x <- x * 2        
+ }

> a
Error: object 'a' not found
> b
Error: object 'b' not found
> x <- 1

> plusx(x)
> a
[1] 2
> b
Error: object 'b' not found
> x
[1] 1

分析一下函數two() 中的三個變量 x, a, b

  • x:作為plusx()的實際參數,調用時其值1復制到形參 x ,但形參仍為局部變量,故作為全局變量的 x 值不變
  • a:在調用函數plusx() 之前, 變量 a 和 b 是根本就不存在的。直到調用了plusx()后,a 才在出現。並且,由於plusx()的上一環境層即為頂層環境(Global Environment), 可直接在變量框內看見 a。
  • b:為局部變量,正如上文所說, <- 進行的賦值僅在當前環境層進行。

此例表明, 通過 <<- 賦值符,plusx()函數在頂層環境寫入了變量 a .

一些注意事項

一般說來, <<- 多用於在頂層環境中寫入變量。然而需要注意的是,以 <<- 執行賦值時,會一直向上直至頂層進行變量查找。若在查找過程中尋找到該名稱的變量,就會進行賦值操作。否則,將在頂層環境中創建變量並賦值。

> glob <- function(){
+         d <- 5
+         nxt1 <- function(){d <<- e + 1}
+         e <- 2
+         nxt1()
+         d        
+ }

> glob()
[1] 3
> d
Error: object 'd' not found

此處,對 d 運用了 <<- 進行賦值時,由於nxt1()的上一環境層中出現了變量 d ,故賦值在glob()環境層進行,而非頂層(Global Environment)

對比以下代碼:

> glob <- function(){
> 
+         ##區別在這里,少了一行' d <- 5' 
+          
+         nxt1 <- function(){d <<- e + 1}
+         e <- 2
+         nxt1()
+         d        
+ }

> glob()
[1] 3
> d
[1] 3

此處,由於glob()環境中沒有 d 變量的存在,在 nxt1() 中使用 <<- 賦值時變量 d 成為頂層變量。




參考資料

[1]某論壇中貼出的關於的 <-= 區別的英文例子http://www.itongji.cn/tag/Ryuyan_2417_1.html
[2]<<- 賦值號部分主要參考於The Art of R Programming(《R語言編程藝術》)7.8 Writing Upstair


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM