摘要: JS函數式編程入門。
- 原文:學會使用函數式編程的程序員(第1部分)
- 作者:前端小智
Fundebug經授權轉載,版權歸原作者所有。
在這篇由多部分組成的文章中,接下來將介紹函數式編程的一些概念,這些概念對你學習函數式編程有所幫助。如果你已經懂了什么是函數式編程,這可以加深你的理解。
請不要着急。從這一點開始,花點時間閱讀並理解代碼示例。你甚至可能想在每節課結束后停止閱讀,以便讓你的觀點深入理解,然后再回來完成。
最重要的是你要理解。
純函數(Purity)
所謂純函數,就是指這樣一個函數,對於相同的輸入,永遠得到相同的輸出,它不依賴外部環境,也不會改變外部環境。如果不滿足以上幾個條件那就是非純函數。
下面是Javascript中的一個純函數示例:
var z = 10;
function add(x, y) {
return x + y;
}
注意,add
函數不涉及z
變量。它不從z
讀取,也不從z
寫入,它只讀取x
和y
,然后返回它們相加的結果。這是一個純函數。如果 add 函數確實訪問了變量z,那么它就不再是純函數了。
請思考一下下面這個函數:
function justTen() {
return 10;
}
如果函數justTen
是純的,那么它只能返回一個常量, 為什么?
因為我們沒有給它任何參數。 而且,既然是純函數的,除了自己的輸入之外它不能訪問任何東西,它唯一可以返回的就是常量。
由於不帶參數的純函數不起作用,所以它們不是很有用。所以justTen
被定義為一個常數會更好。
大多數有用的純函數必須至少帶一個參數。
考慮一下這個函數:
function addNoReturn(x, y) {
var z = x + y
}
注意這個函數是不返回任何值。它只是把變量x
和y
相加賦給變量z
,但並沒有返回。
這個也是一個純函數,因為它只處理輸入。它確實對輸入的變量進行操作,但是由於它不返回結果,所以它是無用的。
所有有用的純函數都必須返回一些我們期望的結果。
讓我們再次考慮第一個add函數:
注意 add(1, 2) 的返回結果總是 3。這不是奇怪的事情,只是因為 add 函數是純的。如果 add 函數使用了一些外部值,那么你永遠無法預測它的行為。
在給定相同輸入的情況下,純函數總是返回相同的結果。
由於純函數不能改變任何外部變量,所以下面的函數都不是純函數:
writeFile(fileName);
updateDatabaseTable(sqlCmd);
sendAjaxRequest(ajaxRequest);
openSocket(ipAddress);
所有這些功能都有副作用。當你調用它們時,它們會更改文件和數據庫表、將數據發送到服務器或調用操作系統以獲取套接字。它們不僅對輸入操作同時也對輸出進行操作,因此,你永遠無法預測這些函數將返回什么。
純函數沒有副作用。
在Javascript、Java 和 c# 等命令式編程語言中,副作用無處不在。這使得調試非常困難,因為變量可以在程序的任何地方更改。所以,當你有一個錯誤,因為一個變量在錯誤的時間被更改為錯誤的值,這不是很好。
此時,你可能會想,“我怎么可能只使用純函數呢?”
函數式編程不能消除副作用,只能限制副作用。由於程序必須與真實環境相連接,所以每個程序的某些部分肯定是不純的。函數式編程的目標是盡量寫更多的純函數,並將其與程序的其他部分隔離開來。
不可變性 (Immutability)
你還記得你第一次看到下面的代碼是什么時候嗎?
var x = 1;
x = x + 1;
教你初中數學的老師看到以上代碼,可能會問你,你忘記我給你教的數學了嗎? 因為在數學中,x 永遠不能等於x + 1。
但在命令式編程中,它的意思是,取x
的當前值加1,然后把結果放回x
中。
在函數式編程中,x = x + 1是非法的。所以這里你可以用數學的邏輯還記得在數式編程中這樣寫是不對的!
函數式編程中沒有變量。
由於歷史原因,存儲值的變量仍然被稱為變量,但它們是常量,也就是說,一旦x
取值,這個常量就是x
返回的值。別擔心,x
通常是一個局部變量,所以它的生命周期通常很短。但只要它還沒被銷毀,它的值就永遠不會改變。
下面是Elm
中的常量變量示例,Elm
是一種用於Web開發的純函數式編程語言:
addOneToSum y z =
let
x = 1
in
x + y + z
如果你不熟悉ml風格的語法,讓我解釋一下。addOneToSum
是一個函數,有兩個參數分別為y
和z
。
在let
塊中,x
被綁定到1
的值上,也就是說,它在函數的生命周期內都等於1。當函數退出時,它的生命周期結束,或者更准確地說,當let
塊被求值時,它的生命周期就結束了。
在in
塊中,計算可以包含在let
塊中定義的值,即 x,返回計算結果 x + y + z,或者更准確地說,返回 1 + y + z,因為 x = 1。
你可能又會想 :“我怎么能在沒有變量的情況下做任何事情呢?”
我們想一下什么時候需要修改變量。通常會想到兩種情況:多值更改(例如修改或記錄對象中的單個值)和單值更改(例如循環計數器)。
函數式編程使用參數保存狀態,最好的例子就是遞歸。是的,是沒有循環。“什么沒有變量,現在又沒有循環? ”我討厭你! ! !”
哈哈,這並不是說我們不能做循環,只是沒有特定的循環結構,比如for, while, do, repeat等等。
函數式編程使用遞歸進行循環。
這里有兩種方法可以在Javascript中執行循環:
注意,遞歸是一種函數式方法,它通過使用一個結束條件 start (start + 1) 和調用自己 accumulator (acc + start) 來實現與 for 循環相同的功能。它不會修改舊的值。相反,它使用從舊值計算的新值。
不幸的是,這在 Javascript中 很難想懂,需要你花點時間研究它,原因有二。第一,Javascript的語法相對其它高級語言比較亂,其次,你可能還不習慣遞歸思維。
在Elm,它更容易閱讀,如下:
sumRange start end acc =
if start > end then
acc
else
sumRange (start + 1) end (acc + start)
它是這樣運行的:
你可能認為 for 循環更容易理解。雖然這是有爭議的,而且更可能是一個熟悉的問題,但非遞歸循環需要可變性,這是不好的。
在這里,我還沒有完全解釋不變性的好處,但是請查看全局可變狀態部分,即為什么程序員需要限制來了解更多。
我還沒有完全解釋不可變性(Immutability)在這里的好處,但請查看 為什么程序員需要限制的全局可變狀態部分 以了解更多信息。
不可變性的好處是,你讀取訪問程序中的某個值,但只有讀權限的,這意味着不用害怕其他人更改該值使自己讀取到的值是錯誤。
不可變性的還有一個好處是,如果你的程序是多線程的,那么就沒有其他線程可以更改你線程中的值,因為該值是不可變,所以另一個線程想要更改它,它只能從舊線程創建一個新值。
不變性可以創建更簡單、更安全的代碼。
重構
讓我們考慮一下重構,下面是一些Javascript代碼:
我們以前可能都寫過這樣的代碼,隨着時間的推移,開始意識到這兩個函數實際上是相同的,函數名稱,打印結果不太一樣而已。
我們不應該復制 validateSsn 來創建 validatePhone,而是應該創建一個函數(共同的部分),通過參數形式實現我們想要的結果。
重構后的代碼如下:
舊代碼參數中 ssn 和 phone 現在用 value 表示,正則表達式 /^\d{3}-\d{2}-\d{4}$/ and /^(\d{3})\d{3}-\d{4}$/ 由變量 regex. 表示。最后,消息“SSN”和 “電話號碼” 由變量 type 表示。
這個有類似的函數都可以使用這個函數來實現,這樣可以保持代碼的整潔和可維護性。
高階函數
許多語言不支持將函數作為參數傳遞,有些會支持但並不容易。
在函數式編程中,函數是一級公民。換句話說,函數通常是另一個函數的值。
由於函數只是值,我們可以將它們作為參數傳遞。即使Javascript不是純函數語言,也可以使用它進行一些功能性的操作。 所以這里將上面的兩個函數重構為單個函數,方法是將驗證合法性的函數作為函數 parseFunc 的參數:
function validateValueWithFunc(value, parseFunc, type) {
if (parseFunc(value))
console.log('Invalid ' + type);
else
console.log('Valid ' + type);
}
像函數 parseFunc 接收一個或多個函數作為輸入的函數,稱為 高階函數。
高階函數要么接受函數作為參數,要么返回函數,要么兩者兼而有之。
現在可以調用高階函數(這在Javascript中有效,因為Regex.exec在找到匹配時返回一個truthy值):
validateValueWithFunc('123-45-6789', /^\d{3}-\d{2}-\d{4}$/.exec, 'SSN');
validateValueWithFunc('(123)456-7890', /^\(\d{3}\)\d{3}-\d{4}$/.exec, 'Phone');
validateValueWithFunc('123 Main St.', parseAddress, 'Address');
validateValueWithFunc('Joe Mama', parseName, 'Name');
這比有四個幾乎相同的函數要好得多。
但是請注意正則表達式,這里有點冗長了。簡化一下:
var parseSsn = /^\d{3}-\d{2}-\d{4}$/.exec;
var parsePhone = /^\(\d{3}\)\d{3}-\d{4}$/.exec;
validateValueWithFunc('123-45-6789', parseSsn, 'SSN');
validateValueWithFunc('(123)456-7890', parsePhone, 'Phone');
validateValueWithFunc('123 Main St.', parseAddress, 'Address');
validateValueWithFunc('Joe Mama', parseName, 'Name');
現在看起來好多了。現在,當要驗證一個電話號碼時,不需要復制和粘貼正則表達式了。
但是假設我們有更多的正則表達式需要解析,而不僅僅是 parseSsn 和 parsePhone。每次創建正則表達式解析器時,我們都必須記住在末尾添加 .exec,這很容易被忘記。
可以通過創建一個返回exec 的高階函數來防止這種情況:
function makeRegexParser(regex) {
return regex.exec;
}
var parseSsn = makeRegexParser(/^\d{3}-\d{2}-\d{4}$/);
var parsePhone = makeRegexParser(/^\(\d{3}\)\d{3}-\d{4}$/);
validateValueWithFunc('123-45-6789', parseSsn, 'SSN');
validateValueWithFunc('(123)456-7890', parsePhone, 'Phone');
validateValueWithFunc('123 Main St.', parseAddress, 'Address');
validateValueWithFunc('Joe Mama', parseName, 'Name');
這里,makeRegexParser采用正則表達式並返回exec函數,該函數接受一個字符串。validateValueWithFunc 將字符串 value 傳遞給 parse 函數,即exec。
parseSsn 和 parsePhone 實際上與以前一樣,是正則表達式的 exec 函數。
當然,這是一個微小的改進,但是這里給出了一個返回函數的高階函數示例。但是,如果makeRegexParser 要復雜得多,這種更改的好處是很大的。
下面是另一個返回函數的高階函數示例:
function makeAdder(constantValue) {
return function adder(value) {
return constantValue + value;
};
}
函數 makeAdder,接受參數 constantValue 並返回函數 adder,這個函數返回 constantValue 與它傳入參數相加結果。
下面是它的用法:
var add10 = makeAdder(10);
console.log(add10(20)); // 打印 30
console.log(add10(30)); // 打印 40
console.log(add10(40)); // 打印 50
我們通過將常量10傳遞給 makeAdder 來創建一個函數 add10, makeAdder 返回一個函數,該函數將向返回的結果都加 10。
注意,即使在 makeAddr 返回之后,函數 adder 也可以訪問變量 constantValue。 這里能訪問到 constantValue 是因為存在閉包。
閉包機制非常重要,因為如果沒有它 ,返回函數的函數就不會有很大作用。所以必須了解它們是如何工作。
閉包
下面是一個使用閉包的函數的示例:
function grandParent(g1, g2) {
var g3 = 3;
return function parent(p1, p2) {
var p3 = 33;
return function child(c1, c2) {
var c3 = 333;
return g1 + g2 + g3 + p1 + p2 + p3 + c1 + c2 + c3;
};
};
}
在這個例子中,child 函數可以訪問它自身的變量,函數 parent 函數可以訪問它的自身變量和函數 grandParent 的變量。而函數 grandParent 只能訪問自身的變量。
下面是它的一個使用例子:
var parentFunc = grandParent(1, 2); // returns parent()
var childFunc = parentFunc(11, 22); // returns child()
console.log(childFunc(111, 222)); // prints 738
// 1 + 2 + 3 + 11 + 22 + 33 + 111 + 222 + 333 == 738
在這里,parentFunc 保留了 parent 的作用域,因為 grandParent 返回 parent。
類似地,childFunc 保留了 child 的作用域,因為 parentFunc 保留了 parent 的作用域,而 parent 的作用域 保留了child 的作用域。
當一個函數被創建時,它在創建時作用域中的所有變量在函數的生命周期內都是可訪問的。一個函數只要還有對它的引用就存在。例如,只要childFunc 還引用 child 的作用域,child 的作用域就存在。
閉包具體還看看之前整理的一篇文章:我從來不理解JavaScript閉包,直到有人這樣向我解釋它...
原文:
1、https://medium.com/@cscalfani...
2、https://medium.com/@cscalfani...
編輯中可能存在的bug沒法實時知道,事后為了解決這些bug,花了大量的時間進行log 調試,這邊順便給大家推薦一個好用的BUG監控工具Fundebug。
你的點贊是我持續分享好東西的動力,歡迎點贊!
一個笨笨的碼農,我的世界只能終身學習!
更多內容請關注公眾號《大遷世界》!
關於Fundebug
Fundebug專注於JavaScript、微信小程序、微信小游戲、支付寶小程序、React Native、Node.js和Java實時BUG監控。 自從2016年雙十一正式上線,Fundebug累計處理了9億+錯誤事件,得到了Google、360、金山軟件、百姓網等眾多知名用戶的認可。歡迎免費試用!
版權聲明
轉載時請注明作者Fundebug以及本文地址:
https://blog.fundebug.com/2018/12/27/to-be-a-functional-programmer-part-1/