Scala函數式編程(四)函數式的數據結構 下


前情提要

Scala函數式編程指南(一) 函數式思想介紹

scala函數式編程(二) scala基礎語法介紹

Scala函數式編程(三) scala集合和函數

Scala函數式編程(四)函數式的數據結構 上

1.List代碼解析

今天介紹的內容,主要是對上一篇介紹的scala函數式數據結構補充,主要講代碼。可以先看看上一節,主要講的是函數式的list,Scala函數式編程(四)函數式的數據結構 上。這些代碼我都放在我的公眾號里面,包括函數式的List以及一個函數式的二叉搜索樹,關注公眾號:哈爾的數據城堡,回復“scala樹數據結構”就能直接獲得(寫文章不容易,大哥大姐關注下吧 😃 )。

話說回來,上一篇中,主要介紹了List的一些基礎用法,包括定義基礎的結構,節點Cons和結尾的Nil。以及使用一個object List來定義基礎的List操作。

//定義List為特質,Nil和Cons為結尾和中間的Node
sealed trait List[+A]

case object Nil extends List[Nothing]

case class Cons[+A](head: A, tail: List[A]) extends List[A] {
  override def toString: String = s"$head :: ${tail.toString}"
}


//Listc操作的定義方法,object相當於java中的靜態類,里面的方法可以直接調用
object List {

  def sum(ints: List[Int]): Int = ints match {
    case Nil => 0
    case Cons(x,xs) => x + sum(xs)
  }

  def map[A,B](l: List[A],f: A => B): List[B] =l match {
    case Nil              => Nil
    case Cons(head, tail) =>Cons(f(head), map(tail,f))
  }
  def apply[A](a: A*): List[A] =
    if (a.isEmpty) Nil
    else Cons(a.head, apply(a.tail: _*))

  def empty[A]: List[A] = Nil


  object ops {
    //定義隱式轉換,這個是為了擴充List的操作而准備的,可以看看最下面是如果使用的
    implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list)
  }
}


關於節點Cons和Nil的定義和上一節一樣,只是Cons多了個重寫的toString方法。

簡單再說下,這里呢,在object List里面,在里面我們定義了apply方法,可以初始化生成一個List。以及上一節提到的sum和map方法。如果對這些看不明白可以看看上一節的內容。

但這樣的話當我們要調用sum方法的時候,只能通過object List來調用,類似下面這樣:

//使用object List里面的apply方法初始化,生成List
scala> val numList = List(1,2,3,4)
numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil

//使用object List里面的sum方法
scala> List.sum(numList)
res0: Int = 10

但是呢,我們日常使用的時候可不是這樣呀,我們更熟悉的應該是要這樣:

//使用object List里面的apply方法初始化,生成List
scala> val numList = List(1,2,3,4)
numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil

//直接使用numList內置的方法來處理
scala> numList.sum()
res0: Int = 10

更加通用的做法,應該是通過List本身,來調用方法,就像上面看到的那樣。通常的做法,是直接加在Cons里面,但由於Cons是繼承自trait List[+A],所以大家(包括)Nil里面都需要定義那一堆方法了,有沒有別的辦法呢?

有的,scala的又一個語法糖,隱式轉換,就是上面object List里面的ops。

  object ops {
    //定義隱式轉換,這個是為了擴充List的操作而准備的,可以看看最下面是如果使用的
    implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list)
  }

隱式轉換主要是通過implicit這個關鍵字定義的,當然隱式轉換還有其他用法,不管這里的用法算是最常見的用法了。

隱式轉換函數,看的主要是參數,以及返回,函數名字(這里名字是listOps)是不重要的,起什么都沒關系。

隱式轉換的作用這里不多解釋,可以百度看看,簡單說就是在需要的時候,將一個類型轉換成另一種類型。這里的作用,是在特定的情況下將我們定義的List轉成ListOps類型,而ListOps類,則在下面給出。

//擴充List的操作
private[list] final class ListOps[A](list: List[A]) {
//導入隱式轉換函數,因為下面的處理也是需要隱式轉換
  import List.ops._

  //使用遞歸實現,foldRight的實現就是調用了這個函數,這么做是為了復用
  //代碼復用是函數式中很重要的一個特性,看下面append方法就可以明白
  def foldRightAsPrimary[B](z: B)(f: (A, B) => B): B = list match {
    case Nil              => z
    case Cons(head, tail) => f(head, tail.foldRightAsPrimary(z)(f))
  }

  def foldRight[B](z: B)(f: (A, B) => B): B = foldRightViaFoldLeft(z)(f)

  def map[B](f: A=> B): List[B] = list match {
    case Nil              => Nil
    case Cons(head, tail) => Cons(f(head), tail.map(f))
  }

}

有了這段代碼后,當我們需要使用map的時候,就可以不用再借助object List代勞,而可以直接使用,就像這樣:

//使用object List里面的apply方法初始化,生成List
scala> val numList = List(1,2,3,4)
numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil

//直接使用numList內置的方法來處理,而不是List.map(numList,function)
scala> numList.map(function)


當代碼檢測到List調用map方法,但List內部並沒有map方法,就會觸發隱式轉換,轉換成ListOps類型,調用ListOps類型里面的map方法,然后返回一個List作為結果。雖然經過了諸多波折,但調用者是感受不到的,反而感覺就像是List里面本身的map方法一樣。在Spark里面就有很多這樣的操作。

如上面的代碼,現在我們可以直接使用numList.map(function)這樣的方式,就像List里面本身就有map函數一樣來使用了。

2.二叉搜索樹

在上一篇末尾,給出了一份還未完成的數據結構,二叉搜索樹當作練習。這一節就來講講這個。

其實如果把之前的List都看懂的話,其實二叉搜索樹並沒有什么難點。

二叉搜索樹,是樹,自然就有葉節點和葉子節點(就是末尾)。不過這次和List不一樣的是,沒有使用隱式轉換,所以我們定義的就不是特質了,而是先定義一個抽象類。然后讓葉節點和葉子節點繼承它。

  //定義一個二叉樹的抽象類
  sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] {

    def add[B >: A](kv: (Int, B)): TreeMap[B] = ???
    def deleteMin: ((Int, A), TreeMap[A]) = ???
    def delete(key: Int): TreeMap[A] = ???
    def get(key: Int): Option[A] = ???
    def +[A1 >: A](kv: (Int, A1)): TreeMap[A1] =  ???
    def -(k: Int): TreeMap[A] = ???
    override def toList: List[(Int, A)] = ???
    def iterator: Iterator[(Int, A)] =???
  }
  
  //葉子節點,也就是每個分支的末尾,繼承了上面的抽象類
  case class Leaf() extends TreeMap[Nothing]
  //葉節點,包含左右和內容,繼承了上面的抽象類
  case class Node[+A](key: Int, value: A,
                      left: TreeMap[A], right: TreeMap[A]) extends TreeMap[A]

二叉樹中有有基礎的增刪查操作,還重載了兩個符號,+和-分別代表增加和刪除。對了,這里的???,其實和python里面的pass是一樣的,就充當個占位符,告訴編譯器這里會有東西的,先別報錯。

然后主要就是要實現二叉樹里面空缺的代碼,其實熟悉樹結構的同學應該都知道,遞歸是樹天生的基因。所以這里自然都是要通過遞歸實現的。不過在編寫前,還是要提一下,一般函數式編程里面,不會使用可變變量(var),也不會使用可變的數據結構(ListBuff)。

實現過程也沒什么好解釋的,其實就是通過遞歸,以及scala的模式匹配,如果碰到葉子節點就掛掉,不是就遞歸去進行。直接看代碼。這里主要介紹add方法,其他的基本都是類似的:


  sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] {
	......
    //使用模式匹配,實現遞歸操作,主要是找到對應的位置,插入數據
    def add[B >: A](kv: (Int, B)): TreeMap[B] = {

      val (key, value) = kv
	  //this就是當前的類型,可能是葉節點,也可能是葉子節點
      this match {
        case Node(nodeKey, nodeValue, left, right) => {
		  //按照二叉搜索樹的規則,進行遞歸
          if(nodeKey > key)
            Node(nodeKey, nodeValue, left.add((key,value)), right)
          else if(nodeKey < key)
            Node(nodeKey, nodeValue, left, right.add((key,value)))
          else
            Node(nodeKey, value, left, right)
        }
		//如果是葉子節點,則新生成一個葉節點,返回
        case Leaf() => {
          Node(key, value, Leaf(), Leaf())
        }
      }

	  ......
    }
	

根據二叉搜索樹的規則,新鍵大於節點的鍵的時候,插入右邊,小於節點的鍵的時候,插入到左邊。然后約定好結束條件,也就是碰到葉子節點的時候返回。這樣一來就完成了插入的操作。后面無論是刪除,還是查找,都是同樣的思路。

而重載運算符方法,比如重載+方法,就是直接調用上面的add方法,即直接復用。然后看看object TreeMap。

  object TreeMap {

    def empty[A]: TreeMap[A] = Leaf()

    def apply[A](kvs: (Int, A)*): TreeMap[A] = {
      kvs.toSeq.foldLeft(empty[A])(_ + _)
    }
  }


這個object主要作用有兩個,一個是生成葉子節點,一個是初始化一棵樹(注意是apply方法)。和List一樣,這里也是用多參數的輸入方式,不同的是這里沒有用遞歸,而是直接把多個參數轉化成一個序列,然后用foldLeft,逐個累加。從而實現初始化樹。

OK,到這里就結束了,最后還是希望你能夠自己試着寫下tree的代碼,寫完再用test case測試下,編程功底就是這樣一步一步打下的。

3.小結

函數式的數據結構篇到此就結束,希望在這里,你能明白函數式的數據結構與我們最開始接觸到的數據結構的實現有哪些不同,又為何要大費周章用函數式的方式實現!!

很多scala的教程介紹到這里就一句話,scala的默認數據結構是不可變的,如果可變的要怎樣巴拉巴拉,這樣容易讓人陷入知其然不知其所以然的地步。

同時我也一直決定,學習語言的話,語法知識最表層的東西。真正深入學習一門語言,你需要逐漸知道這門語言在設計上的取舍,甚至是設計上的哲學,比如python的至簡哲學。

而在深入這些東西的過程中,語法自然而然就掌握了,比如較為晦澀的隱式轉換。在這里就會知道隱式轉換是這樣用的,原來spark里面一直都有這個東西參與!!!

接下來一篇將介紹scala中的錯誤處理方式,依舊是函數式的處理方式,像java中的try{}catch{}肯定是非函數式的,那么scala是怎么實現的呢,下一篇就來介紹:)

如果有什么疑問,也歡迎留言。

以上~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM