Scala函數式編程(四)函數式的數據結構 上


這次來說說函數式的數據結構是什么樣子的,本章會先用一個list來舉例子說明,最后給出一個Tree數據結構的練習,放在公眾號里面,練習里面給出了基本的結構,但代碼是空缺的需要補上,此外還有預留的testcase可以驗證。

關注公眾號:哈爾的數據城堡,回復“函數式數據結構”可以獲得。(寫文章不容易,大哥大姐關注下吧[哭笑])

然后是這系列的索引:

Scala函數式編程指南(一) 函數式思想介紹

scala函數式編程(二) scala基礎語法介紹

Scala函數式編程(三) scala集合和函數

1.什么是函數式的數據結構

還記得前面說過,函數式編程最大的特點是什么嗎?就是沒有副作用。那么函數式的數據結構自然也是如此。

無副作用的關鍵是:

  1. 一個函數無論調用多少次,只要輸入參數相同,則結果也必然相同。
  2. 且這個函數執行過程中不會改變程序的任何外部狀態,如全局變量,對象的屬性等。
  3. 函數的結果也不依賴外部狀態。

在java中,最經典的數據結構ArrayList,是通過一個全局的size變量,來控制ArrayList的大小的,這就說明ArrayList並非無副作用。

在scala中,集合(List,Map等)默認是不可變的,以鏈表List為例,是無法通過push等操作,往一個鏈表里面添加內容的。只能通過兩個鏈表相加的方式,生成一個新鏈表(Map也是一樣,通過兩個Map相加,Key相同的會覆蓋,以達到更新的目的)。這點倒是和String有點像。

不過其實這樣有一個問題,那就是很耗費內存。但這個問題可以用懶加載來解決,限於篇幅,后面再介紹吧。

總結一下,函數式的數據結構,最大的特點,就是沒有副作用。那么如何實現無副作用的數據結構呢,我們下面用鏈表的例子來展示。

不過在這之前,需要先回顧下一些語法知識。

2.scala知識回顧

我的一個觀點是,語言的語法知識如果只是看,背,而沒有實際用到,那是比較難記住的。這里就把這次會用到的語法知識做個簡單介紹,如果有需要,可以查閱前面寫的前兩章。

我這里也有演示如果運用前面介紹的語法知識實現一個函數式的List()。

PS:如果不想看語法知識可以直接跳到第三節。

前面的語法索引:

scala函數式編程(二) scala基礎語法介紹

Scala函數式編程(三) scala集合和函數

2.1 scala的模式匹配

模式匹配類似於swtch語法,不過它能匹配的不止是值,還有數據類型。同時,它是一個匿名函數,在scala里,函數不用return,能直接返回值。

val times = 1

//使用模式匹配來匹配值
times match {
  case 1 => "one"
  case 2 => "two"
  case _ => "some other number"
}

//使用模式匹配,匹配類型,再判斷值

times match {
  case i:Int if i == 1 => "one"
  case i:Int if i == 2 => "two"
  case _ => "some other number"
}

如果有小伙伴想了解更多,可以看看我這篇,scala模式匹配詳細解析

2.2 object和apply

前面介紹到,object是一個類的伴生對象,而且相當於static類,內存里只能有一個對象。apply方法則是說,可以在使用object對象的時候,直接默認使用。別說了,看代碼:

scala> class Foo {}
defined class Foo

//有一個apply方法
scala> object FooMaker {
     |   def apply() = new Foo
     | }
defined module FooMaker

//新建object,自動得就調用了apply
scala> val newFoo = FooMaker() //賦值的對象是Foo,因為調用了FooMaker()的apply 
newFoo: Foo = Foo@5b83f762  

上面的代碼,FooMaker相當於一個工廠。

2.3 scala的泛型

scala中的泛型,叫做型變或變性,英文叫variance。主要有三種情況:

假設Dog是Animal的子類。那么有如下關系:

  • 協變(covariant):List[Dog]是List[Animal]的子類,形態用一個+號表示,即List[+A](這里的A是泛指,類似java中的泛型,可以隨便指定一個字母)。
  • 逆變(contravariant):與協變相反,List[Animal]是List[Dog]的子類,形態用一個-號表示,即List[-A]。
  • 不變(invariant):List[Dog]是List[Animal]的無關,不用任何表示,List[A]。

協變是比較符合正常邏輯思考的,一群狗確實也可以說是一群動物。逆變就比較反直覺了,不過這里先不討論這點,后面有機會再討論。

3.構建函數式的List

OK,有了上面的基礎,就能夠來構建一個函數式的數據結構了,不過在此之前,先讓我們回顧下傳統的List數據結構。

3.1 傳統的List

還記得以前數據結構是怎樣設計的嗎?
傳統的List

最普通的鏈表,通常都是由一個又一個的Node組成,一個Node中存儲數據和下一個鏈表的變量。最后通過一個空值結尾,通常是Null。

在Java中,它的鏈表Linklist,是通過一個全局變量size來控制鏈表的。

通過for循環實現基礎的增刪查改等操作。而是,也是傳統List的常見寫法,但在函數式的List中可不能這樣。還記得嗎,函數式最大的特點就是無副作用。像java這里用一個全局的size來控制,那可真是萬萬不可啊,在多線程的情況下還不得崩潰。

關於為什么要寫無副作用的代碼,這里就不做探討,詳細內容可以看看這個系列的第一章。Scala函數式編程指南(一) 函數式思想介紹

3.2 scala實現函數式的List

我們要做的是寫出無副作用的集合,那要怎么做呢?給5秒鍾閉上眼睛好好想一想有沒有什么思路。。。

可能有的同學會想得到,這個答案就是遞歸。通過遞歸,能夠避免副作用的產生。如常用的增刪查改,如果使用遞歸,就可以避免使用一個全局變量,當然遞歸通常都沒有直接使用for循環那么直觀,所以充滿遞歸的代碼初次看會比較晦澀。但如果用多了,你會發現其實函數式的代碼,也是非常好懂的。

下面,我們來看看如果使用遞歸實現一個List。

3.1 定義基本的類型

首先,我們要定義每個節點Node的類型,以及結尾Nil。由於使用到了遞歸,我們需要讓Node和Nil都有同樣的父類,因為遞歸函數的返回都是一樣的。

如果還是不明白為什么要讓Node和Nil為啥要有同樣的父類,那不妨先放一放,繼續看下去吧。

//定義自己的特質(相當於java的接口),泛型使用協變
sealed trait List[+A]

//定義一個case類,作為每一個List的結尾
case object Nil extends List[Nothing] 

//定義List子類,也可以說是List中的每個Node,每個List都是由一個又一個的Cons組成,以Nil結尾
case class Cons[+A](head: A, tail: List[A]) extends List[A]

注意第一行定義了List[+A]的特質,和scala集合中的List是區分開來的,只是名字叫一樣而已。這個是我們自己的List!!

而后定義了Nil和Cons,分別作為List的結尾和Node節點,注意case class也是scala的語法糖,可以理解為java bean。

之所以先定義了一個List的特質(接口),再分別用Nil和Cons繼承它,是因為在遞歸的情況下,要讓節點和結尾保持同一類型,而這個就是通過多態實現的。

3.2 實現List工廠

前面說到,通常是用object來作為工廠,這里也是一樣的,我們可以定義List工廠。

定義工廠方法如下:

object List {
  //使用可變長度,如果傳進來的參數是空,就返回Nil,否則使用遞歸返回Cons,注意,這里的apply方法就是使用了遞歸
  def apply[A](as: A*): List[A] = // Variadic function syntax
    if (as.isEmpty) Nil
    else Cons(as.head, apply(as.tail: _*))

}

這里的apply[A](as: A),括號里面的A的意思,是多個參數的意思,就是說可以有很多個參數,是scala的一個語法糖。

在最后

else Cons(as.head, apply(as.tail: _*))

看到最后面的 _*了嗎,這個的意思,是除了第一個參數以外的其他參數,也是語法糖。

在這一個小小的地方就用到了遞歸,不斷調用apply方法去解析后面的參數,最終生成一個List。初次看可能會比較迷,可能放在編譯器里面運行一下,方便理解。而這種操作在scala函數式編程中,是非常普遍的做法。

至此,我們就建立了一個List的數據結構,先來看看我們的成果

//一個遞歸的List
scala> List(1,2,3)
res0: List[Int] = Cons(1,Cons(2,Cons(3,Nil)))

現在的List數據結構只是初具雛形,我們還得往里面加方法。

3.3 用函數式的方式實現List更多方法

通常來說,數據結構比較重要的是增刪查改等操作,但因為是不可變的,同時函數式中通常是不改變對象信息的,所以這些基本操作反而不是首要的。

我們先來看一個簡單些的例子吧,讓一個List[Int]中的數據累加。

object List {
  ......
  //傳入參數是一個Int類型的List,使用模式匹配
  def sum(ints: List[Int]): Int = ints match {
    case Nil => 0
    //使用遞歸累加
    case Cons(x,xs) => x + sum(xs)
  }
  ......
}

這里主要傳入的參數是一個Int類型的List,然后使用模式匹配,如果是結尾,則返回0,如果是中間節點,則使用遞歸累加。

上面那個例子比較簡單,明白后可以來看看如何為List構建更加通用的方法。通常比較常用的是前面介紹過的諸如map,filter等操作,下面先用一個map來說明一下吧。

object List {
  ......
  //Map操作,使用模式匹配
  def map[A,B](list: List[A],f: A => B): List[B] =list match {
    case Nil              ⇒ Nil
    //使用遞歸
    case Cons(head, tail) ⇒ Cons(f(head), map(tail,f))
  }
  ......
}

map函數,需要傳進入一個待處理的list,以及一個函數作為參數,用以對List中每個元素做處理。

比如說想讓List中每個元素+1,那就可以傳入

val addOne = (num:Int) => num+1

還記得之前說,在scala中,函數也能當作變量嘛。將addOne這個函數作為參數,這樣就會讓List中每個元素都+1,然后返回一個新的List,當然,這個也是用遞歸實現的。

實現代碼看起來很簡潔,也是用模式匹配,匹配每個元素的類型,就是是Node還是結尾。如果是結尾,直接返回,如果是Node,那么處理完當前數據,遞歸去處理后面的數據,並返回新的處理后的Node。

熟悉以后,會發現這樣的處理方式看着很舒服,代碼寫得也很少,非常簡潔。

在我看來,這就是遞歸的魅力所在。

除了map之外,還有其他操作處理,包括filter,foldLeft,reduce等操作。我把代碼放在我的公眾號中,限於篇幅這里就不講太多。關注公眾號:哈爾的數據城堡,回復“函數式數據結”可以獲得。

代碼中使用了隱式轉換來擴充List的操作,並演示了如何使用隱式轉換,以及如何使用復用來組合功能以實現新的功能。有同學可能不明白為什么簡單的List要搞這么復雜,看了代碼可能會更加理解。

4.函數式的二叉搜索樹

這部分我是作為練習的,連同List代碼放在一塊,里面有基本的結構,但一些缺失的內容需要你來補充。相信我,做了一遍,肯定能夠對函數式的數據結構有更深的理解。

對了,二叉搜索樹的練習還有幾個test case,做完跑一遍了,如果全過那基本上你寫的代碼就不會有太大的問題,good luck~

再說一遍我把練習的代碼放在了我的公眾號中,關注公眾號:哈爾的數據城堡,回復“函數式數據結構”就能免費獲得啦。

下一篇會再針對List和Tree的代碼來講一講,有不明白的地方到時候也可以看看。

以上~~


推薦閱讀:
通俗得說線性回歸算法(一)線性回歸初步介紹
通俗得說線性回歸算法(二)線性回歸初步介紹
大數據存儲的進化史 --從 RAID 到 Hadoop Hdfs
C,java,Python,這些名字背后的江湖!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM