Scala函數式編程（四）函數式的數據結構上

本文轉載自查看原文 2019-12-04 18:03 349 java/ scala/ 函數式/ java/scala

這次來說說函數式的數據結構是什么樣子的，本章會先用一個list來舉例子說明，最后給出一個Tree數據結構的練習，放在公眾號里面，練習里面給出了基本的結構，但代碼是空缺的需要補上，此外還有預留的testcase可以驗證。

關注公眾號：哈爾的數據城堡，回復“函數式數據結構”可以獲得。（寫文章不容易，大哥大姐關注下吧[哭笑]）

然后是這系列的索引：

Scala函數式編程指南（一）函數式思想介紹

scala函數式編程（二） scala基礎語法介紹

Scala函數式編程（三） scala集合和函數

1.什么是函數式的數據結構

還記得前面說過，函數式編程最大的特點是什么嗎？就是沒有副作用。那么函數式的數據結構自然也是如此。

無副作用的關鍵是：

一個函數無論調用多少次，只要輸入參數相同，則結果也必然相同。
且這個函數執行過程中不會改變程序的任何外部狀態，如全局變量，對象的屬性等。
函數的結果也不依賴外部狀態。

在java中，最經典的數據結構ArrayList，是通過一個全局的size變量，來控制ArrayList的大小的，這就說明ArrayList並非無副作用。

在scala中，集合（List，Map等）默認是不可變的，以鏈表List為例，是無法通過push等操作，往一個鏈表里面添加內容的。只能通過兩個鏈表相加的方式，生成一個新鏈表（Map也是一樣，通過兩個Map相加，Key相同的會覆蓋，以達到更新的目的）。這點倒是和String有點像。

不過其實這樣有一個問題，那就是很耗費內存。但這個問題可以用懶加載來解決，限於篇幅，后面再介紹吧。

總結一下，函數式的數據結構，最大的特點，就是沒有副作用。那么如何實現無副作用的數據結構呢，我們下面用鏈表的例子來展示。

不過在這之前，需要先回顧下一些語法知識。

2.scala知識回顧

我的一個觀點是，語言的語法知識如果只是看，背，而沒有實際用到，那是比較難記住的。這里就把這次會用到的語法知識做個簡單介紹，如果有需要，可以查閱前面寫的前兩章。

我這里也有演示如果運用前面介紹的語法知識實現一個函數式的List()。

PS：如果不想看語法知識可以直接跳到第三節。

前面的語法索引：

scala函數式編程（二） scala基礎語法介紹

Scala函數式編程（三） scala集合和函數

2.1 scala的模式匹配

模式匹配類似於swtch語法，不過它能匹配的不止是值，還有數據類型。同時，它是一個匿名函數，在scala里，函數不用return，能直接返回值。

val times = 1

//使用模式匹配來匹配值
times match {
  case 1 => "one"
  case 2 => "two"
  case _ => "some other number"
}

//使用模式匹配，匹配類型，再判斷值

times match {
  case i:Int if i == 1 => "one"
  case i:Int if i == 2 => "two"
  case _ => "some other number"
}

如果有小伙伴想了解更多，可以看看我這篇，scala模式匹配詳細解析。

2.2 object和apply

前面介紹到，object是一個類的伴生對象，而且相當於static類，內存里只能有一個對象。apply方法則是說，可以在使用object對象的時候，直接默認使用。別說了，看代碼：

scala> class Foo {}
defined class Foo

//有一個apply方法
scala> object FooMaker {
     |   def apply() = new Foo
     | }
defined module FooMaker

//新建object，自動得就調用了apply
scala> val newFoo = FooMaker() //賦值的對象是Foo，因為調用了FooMaker()的apply 
newFoo: Foo = Foo@5b83f762

上面的代碼，FooMaker相當於一個工廠。

2.3 scala的泛型

scala中的泛型，叫做型變或變性，英文叫variance。主要有三種情況：

假設Dog是Animal的子類。那么有如下關系：

協變(covariant)：List[Dog]是List[Animal]的子類，形態用一個+號表示，即List[+A]（這里的A是泛指，類似java中的泛型，可以隨便指定一個字母）。
逆變(contravariant)：與協變相反，List[Animal]是List[Dog]的子類，形態用一個-號表示，即List[-A]。
不變(invariant)：List[Dog]是List[Animal]的無關，不用任何表示，List[A]。

協變是比較符合正常邏輯思考的，一群狗確實也可以說是一群動物。逆變就比較反直覺了，不過這里先不討論這點，后面有機會再討論。

3.構建函數式的List

OK，有了上面的基礎，就能夠來構建一個函數式的數據結構了，不過在此之前，先讓我們回顧下傳統的List數據結構。

3.1 傳統的List

還記得以前數據結構是怎樣設計的嗎？
傳統的List

最普通的鏈表，通常都是由一個又一個的Node組成，一個Node中存儲數據和下一個鏈表的變量。最后通過一個空值結尾，通常是Null。

在Java中，它的鏈表Linklist，是通過一個全局變量size來控制鏈表的。

通過for循環實現基礎的增刪查改等操作。而是，也是傳統List的常見寫法，但在函數式的List中可不能這樣。還記得嗎，函數式最大的特點就是無副作用。像java這里用一個全局的size來控制，那可真是萬萬不可啊，在多線程的情況下還不得崩潰。

關於為什么要寫無副作用的代碼，這里就不做探討，詳細內容可以看看這個系列的第一章。Scala函數式編程指南（一）函數式思想介紹。

3.2 scala實現函數式的List

我們要做的是寫出無副作用的集合，那要怎么做呢？給5秒鍾閉上眼睛好好想一想有沒有什么思路。。。

可能有的同學會想得到，這個答案就是遞歸。通過遞歸，能夠避免副作用的產生。如常用的增刪查改，如果使用遞歸，就可以避免使用一個全局變量，當然遞歸通常都沒有直接使用for循環那么直觀，所以充滿遞歸的代碼初次看會比較晦澀。但如果用多了，你會發現其實函數式的代碼，也是非常好懂的。

下面，我們來看看如果使用遞歸實現一個List。

3.1 定義基本的類型

首先，我們要定義每個節點Node的類型，以及結尾Nil。由於使用到了遞歸，我們需要讓Node和Nil都有同樣的父類，因為遞歸函數的返回都是一樣的。

如果還是不明白為什么要讓Node和Nil為啥要有同樣的父類，那不妨先放一放，繼續看下去吧。

//定義自己的特質（相當於java的接口），泛型使用協變
sealed trait List[+A]

//定義一個case類，作為每一個List的結尾
case object Nil extends List[Nothing] 

//定義List子類，也可以說是List中的每個Node，每個List都是由一個又一個的Cons組成，以Nil結尾
case class Cons[+A](head: A, tail: List[A]) extends List[A]

注意第一行定義了List[+A]的特質，和scala集合中的List是區分開來的，只是名字叫一樣而已。這個是我們自己的List！！

而后定義了Nil和Cons，分別作為List的結尾和Node節點，注意case class也是scala的語法糖，可以理解為java bean。

之所以先定義了一個List的特質（接口），再分別用Nil和Cons繼承它，是因為在遞歸的情況下，要讓節點和結尾保持同一類型，而這個就是通過多態實現的。

3.2 實現List工廠

前面說到，通常是用object來作為工廠，這里也是一樣的，我們可以定義List工廠。

定義工廠方法如下：

object List {
  //使用可變長度，如果傳進來的參數是空，就返回Nil，否則使用遞歸返回Cons，注意，這里的apply方法就是使用了遞歸
  def apply[A](as: A*): List[A] = // Variadic function syntax
    if (as.isEmpty) Nil
    else Cons(as.head, apply(as.tail: _*))

}

這里的apply[A](as: A)，括號里面的A的意思，是多個參數的意思，就是說可以有很多個參數，是scala的一個語法糖。

在最后

else Cons(as.head, apply(as.tail: _*))

看到最后面的 _*了嗎，這個的意思，是除了第一個參數以外的其他參數，也是語法糖。

在這一個小小的地方就用到了遞歸，不斷調用apply方法去解析后面的參數，最終生成一個List。初次看可能會比較迷，可能放在編譯器里面運行一下，方便理解。而這種操作在scala函數式編程中，是非常普遍的做法。

至此，我們就建立了一個List的數據結構，先來看看我們的成果

//一個遞歸的List
scala> List(1,2,3)
res0: List[Int] = Cons(1,Cons(2,Cons(3,Nil)))

現在的List數據結構只是初具雛形，我們還得往里面加方法。

3.3 用函數式的方式實現List更多方法

通常來說，數據結構比較重要的是增刪查改等操作，但因為是不可變的，同時函數式中通常是不改變對象信息的，所以這些基本操作反而不是首要的。

我們先來看一個簡單些的例子吧，讓一個List[Int]中的數據累加。

object List {
  ......
  //傳入參數是一個Int類型的List，使用模式匹配
  def sum(ints: List[Int]): Int = ints match {
    case Nil => 0
    //使用遞歸累加
    case Cons(x,xs) => x + sum(xs)
  }
  ......
}

這里主要傳入的參數是一個Int類型的List，然后使用模式匹配，如果是結尾，則返回0，如果是中間節點，則使用遞歸累加。

上面那個例子比較簡單，明白后可以來看看如何為List構建更加通用的方法。通常比較常用的是前面介紹過的諸如map，filter等操作，下面先用一個map來說明一下吧。

object List {
  ......
  //Map操作，使用模式匹配
  def map[A,B](list: List[A],f: A => B): List[B] =list match {
    case Nil              ⇒ Nil
    //使用遞歸
    case Cons(head, tail) ⇒ Cons(f(head), map(tail,f))
  }
  ......
}

map函數，需要傳進入一個待處理的list，以及一個函數作為參數，用以對List中每個元素做處理。

比如說想讓List中每個元素+1，那就可以傳入

val addOne = (num:Int) => num+1

還記得之前說，在scala中，函數也能當作變量嘛。將addOne這個函數作為參數，這樣就會讓List中每個元素都+1，然后返回一個新的List，當然，這個也是用遞歸實現的。

實現代碼看起來很簡潔，也是用模式匹配，匹配每個元素的類型，就是是Node還是結尾。如果是結尾，直接返回，如果是Node，那么處理完當前數據，遞歸去處理后面的數據，並返回新的處理后的Node。

熟悉以后，會發現這樣的處理方式看着很舒服，代碼寫得也很少，非常簡潔。

在我看來，這就是遞歸的魅力所在。

除了map之外，還有其他操作處理，包括filter，foldLeft，reduce等操作。我把代碼放在我的公眾號中，限於篇幅這里就不講太多。關注公眾號：哈爾的數據城堡，回復“函數式數據結”可以獲得。

代碼中使用了隱式轉換來擴充List的操作，並演示了如何使用隱式轉換，以及如何使用復用來組合功能以實現新的功能。有同學可能不明白為什么簡單的List要搞這么復雜，看了代碼可能會更加理解。

4.函數式的二叉搜索樹

這部分我是作為練習的，連同List代碼放在一塊，里面有基本的結構，但一些缺失的內容需要你來補充。相信我，做了一遍，肯定能夠對函數式的數據結構有更深的理解。

對了，二叉搜索樹的練習還有幾個test case，做完跑一遍了，如果全過那基本上你寫的代碼就不會有太大的問題，good luck~

再說一遍我把練習的代碼放在了我的公眾號中，關注公眾號：哈爾的數據城堡，回復“函數式數據結構”就能免費獲得啦。

下一篇會再針對List和Tree的代碼來講一講，有不明白的地方到時候也可以看看。

以上~~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Scala函數式編程（四）函數式的數據結構下 scala函數式編程 Scala函數與函數式編程 Scala編程--函數式對象什么是函數式編程什么是函數式編程函數式編程 Scala函數式編程（三） scala集合和函數 scala函數式編程（二） scala基礎語法介紹 Scala函數式編程（五）函數式的錯誤處理

Scala函數式編程（四）函數式的數據結構 上