<-
與 =
間的區別
<-
與 =
在大部分情況下是應該可以通用的。並且,相對於 <<-
運算符,它們的賦值行為均在它們自身的環境層(environment hierarchy)中進行。
R語言中,<-
與 =
這兩個賦值運算符最主要的區別在於兩者的作用域不同。大家可以從下面的例子感受一下。
好多好多人喜歡用的 =
貌似許多早期學習R的童鞋都比較喜歡使用 =
進行賦值。畢竟,簡簡單單的a = 5
用起來比較符合大多數現有語言的習慣。
> rm(x) ## 如果變量 x 存在的話,刪除此變量
> mean(x = 1:10)
[1] 5.5
> x
Error: object 'x' not found
在以上范例里,變量 x 是在函數的作用域里進行聲明的,所以它只存在於此函數中,一旦運算完成便“消失”。
而對於 <-
使用 <-
的運算結果則如下:
> mean(x <- 1:10)
[1] 5.5
> x
[1] 1 2 3 4 5 6 7 8 9 10
這一次, Global Environment 里出現了 x 變量
在什么情況下, <-
賦值會成立?
在以上代碼里,你可能會認為計算機對上述語句進行的處理是“將 1:10 賦值給 x , 然后計算 x 的均值。”在某些語言里,計算機的確是如此處理的,比如說 C 。但是在R語言中,卻不是這樣的。見下例。
> a <- 1
> f <- function(a) return(TRUE)
> f <- f(a <- a + 1); a
[1] TRUE
[1] 1
請注意,以上范例里, a 的值並沒有改變!!在 R 中,在參數中進行賦值的變量只有在需要進行評估時才會改變其值。(也許,大家可以類比一下邏輯短路?1 < 0 && 2 == 1
)這會導致程序里出現一些不可預期的結果並且降低代碼可讀性,所以並不推薦在函數參數里使用這一種賦值方式(事實上,函數參數弄那么復雜也是太無聊了了吧)
> a <- 1
> f <- function(a) {
+ if(runif(1)>0.5) TRUE
+ else a
+ }
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] TRUE
[1] 1
> f(a <- a+1);a
[1] 2
> f(a <- a+1);a
[1] TRUE
[1] 2
> f(a <- a+1);a
[1] 3
上述代碼中,向函數 f() 傳遞傳遞參數 a <- a + 1 后,只有在隨機數 runif(1) 小於0.5的時候,a 的值才會改變,即執行+1操作。否則傳遞TRUE值。因此,因為隨機數 runif(1) 的隨機性,每次調用函數 f()后 a 的值是不確定的。
BUT!
並不是說 <-
看起來復雜所以就索性不用它了。事實上,正如上文所說,如果不是有人會這么無聊在R 語言里進行數據分析時用 <-
弄個這么坑爹的函數參數,這個賦值號的意義本身是很清晰的。
<-
長得像箭頭,實質上也是個箭頭,如果覺得從右向左賦值讓你覺得不爽的話,用 ->
甚至都是可以的。而那個傳統的 =
號,在 R 里實質上是退化了的,其在規范的 R 語言代碼里其實一般是作為為子集賦“name”的存在。
一個較為規范的賦值號使用方式應該是醬紫的。
> a <- list(hello = 1, world = 2 ) ##如果 <- 換成 = 得多混亂……
> a
$hello
[1] 1
$world
[1] 2
> a$hello
[1] 1
> a[["world"]] ## '$' 與 '[["..."]]'是兩種不同的引用name的方式~~
[1] 2
<<—
運算符,向上一環境層寫入變量
在 R 語言中,處在某一個環境層的代碼都擁有讀入上一環境層的變量的權限,但相反地,若只通過標准的賦值運算符 <-
,是無法向上一環境層寫入變量的。若想在上一環境層進行賦值行為,即向上一層次寫入變量,則需要用到 <<-
(superassignment)運算符啦~
對非局部變量進行寫入操作
看,灰機!
> plusx <- function(x){
+ a <<- 1 + x
+ b <- 2 + x
+ x <- x * 2
+ }
> a
Error: object 'a' not found
> b
Error: object 'b' not found
> x <- 1
> plusx(x)
> a
[1] 2
> b
Error: object 'b' not found
> x
[1] 1
分析一下函數two() 中的三個變量 x, a, b
- x:作為plusx()的實際參數,調用時其值1復制到形參 x ,但形參仍為局部變量,故作為全局變量的 x 值不變
- a:在調用函數plusx() 之前, 變量 a 和 b 是根本就不存在的。直到調用了plusx()后,a 才在出現。並且,由於plusx()的上一環境層即為頂層環境(Global Environment), 可直接在變量框內看見 a。
- b:為局部變量,正如上文所說,
<-
進行的賦值僅在當前環境層進行。
此例表明, 通過 <<-
賦值符,plusx()函數在頂層環境寫入了變量 a .
一些注意事項
一般說來, <<-
多用於在頂層環境中寫入變量。然而需要注意的是,以 <<-
執行賦值時,會一直向上直至頂層進行變量查找。若在查找過程中尋找到該名稱的變量,就會進行賦值操作。否則,將在頂層環境中創建變量並賦值。
> glob <- function(){
+ d <- 5
+ nxt1 <- function(){d <<- e + 1}
+ e <- 2
+ nxt1()
+ d
+ }
> glob()
[1] 3
> d
Error: object 'd' not found
此處,對 d 運用了 <<-
進行賦值時,由於nxt1()的上一環境層中出現了變量 d ,故賦值在glob()環境層進行,而非頂層(Global Environment)
對比以下代碼:
> glob <- function(){
>
+ ##區別在這里,少了一行' d <- 5'
+
+ nxt1 <- function(){d <<- e + 1}
+ e <- 2
+ nxt1()
+ d
+ }
> glob()
[1] 3
> d
[1] 3
此處,由於glob()環境中沒有 d 變量的存在,在 nxt1() 中使用 <<-
賦值時變量 d 成為頂層變量。
參考資料
[1]某論壇中貼出的關於的
<-
與=
區別的英文例子http://www.itongji.cn/tag/Ryuyan_2417_1.html
[2]<<-
賦值號部分主要參考於The Art of R Programming(《R語言編程藝術》)7.8 Writing Upstair