Java8中的Stream流式操作 - 入門篇


作者:湯圓

個人博客:javalover.cc

前言

之前總是朋友朋友的叫,感覺有套近乎的嫌疑,所以后面還是給大家改個稱呼吧

因為大家是來看東西的,所以暫且叫做官人吧(靈感來自於民間流傳的四大名著之一)

官人們好啊,我是湯圓,今天給大家帶來的是《Java8中的Stream流式操作 - 入門篇》,希望有所幫助,謝謝

文章純屬原創,個人總結難免有差錯,如果有,麻煩在評論區回復或后台私信,謝啦

簡介

流式操作也叫做函數式操作,是Java8新出的功能

流式操作主要用來處理數據(比如集合),就像泛型也大多用在集合中一樣(看來集合這個小東西還是很關鍵的啊,哪哪都有它)

下面我們主要用例子來介紹下,流的基操(建議先看下lambda表達式篇,里面介紹的lambda表達式函數式接口方法引用等,下面會用到)

先來看下目錄

目錄

  1. 流是什么

  2. 老板,上栗子

  3. 流的操作步驟

  4. 流的特點

  5. 流式操作和集合操作的區別

正文

1. 流是什么

流是一種以聲明性的方式來處理數據的API

什么是聲明性的方式?

就是只聲明,不實現,類似抽象方法(多態性)

2. 老板,上栗子

下面我們舉個栗子,來看下什么是流式操作,然后針對這個栗子,引出后面的相關概念

需求篩選年齡大於1的貓(貓的1年≈人的5年),並按年齡遞增排序,最后提取名字單獨存放到列表中


public class BasicDemo {
    public static void main(String[] args) {
      // 以下貓的名字均為真名,非虛構
        List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
        // === 舊代碼 Java8之前 ===
        List<Cat> listTemp = new ArrayList<>();
        // 1. 篩選
        for(Cat cat: list){
            if(cat.getAge()>1){
                listTemp.add(cat);
            }
        }
        // 2. 排序
        listTemp.sort(new Comparator<Cat>() {
            @Override
            public int compare(Cat o1, Cat o2) {
                // 遞增排序
                return Integer.compare(o1.getAge(), o2.getAge());
            }
        });
        // 3. 提取名字
        List<String> listName = new ArrayList<>();
        for(Cat cat: listTemp){
            listName.add(cat.getName());
        }
        System.out.println(listName);
        
        // === 新代碼 Java8之后 ===
        List<String> listNameNew = list.stream()
          			// 函數式接口 Predicate的 boolean test(T t)抽象方法
                .filter(cat -> cat.getAge() > 1)
								// lambda表達式的方法引用
			          .sorted(Comparator.comparingInt(Cat::getAge))
          			// 函數式接口 Funtion的 R apply(T t)抽象方法
                .map(cat-> cat.getName())
             	  // 收集數據,把流轉為集合List
                .collect(Collectors.toList());
        System.out.println(listNameNew);
    }
}
class Cat{
    int age;
    String name;

    public Cat(int age, String name) {
        this.age = age;
        this.name = name;
    }
	// 省略getter/setter
}

可以看到,用了流式操作,代碼簡潔了很多(秒哇)

Q:有的官人可能會想,這跟前面lambda表達式的組合操作有點像啊。

A:你說對了,確實只是像,區別還是很大的。因為lambda表達式的組合操作其實還是屬於直接針對集合的操作;

文末會講到直接操作集合和流式操作的區別,這里先跳過

下面我們基於這個栗子,來分別介紹涉及到的知識點

3. 流的操作步驟

我們先忽略舊版的集合操作(后面介紹流和集合的區別時再說),先來介紹流的操作(畢竟流才是今天的主角嘛)

流的操作分三步走:創建流、中間操作、終端操作

流程如下圖:

流的操作流程

這里我們要關注一個很重要的點:

在終端操作開始之前,中間操作不會執行任何處理,它只是聲明執行什么操作;

你可以想象上面這個流程是一個流水線:我們這里做個簡化處理

  1. 目的:先告訴你,我們要加工瓶裝的水(先創建流,告訴你要處理哪些數據)
  2. 再針對這些瓶子和水,來搭建一個流水線:固定瓶子的夾具、裝水的水管、擰蓋子的爪子、裝箱的打包器(中間操作,聲明要執行的操作)
  3. 最后按下啟動按鈕,流水線開始工作(終端操作,開始根據中間操作來處理數據)

流水線

因為每一個中間操作都是返回一個流(Stream),這樣他們就可以一直組合下去(我好像吃到了什么東西?),但是他們的組合順序是不固定的,流會根據系統性能去選擇合適的組合順序

我們可以打印一些東西來看下:

List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List<String> listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  .collect(Collectors.toList());

輸出如下:

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}
filter: Cat{age=2}
map:Cat{age=2}

可以看到,中間操作的filter和map組合到一起交叉執行了,盡管他們是兩個獨立的操作(這個技術叫作循環合並

這個合並主要是由流式操作根據系統的性能來自行決定的

既然講到了循環合並,那下面捎帶說下短路技巧

短路這個詞大家應該比較熟悉(比如腦子短路什么的),指的是本來A->B->C是都要執行的,但是在B的地方短路了,所以就變成了A->C了

這里的短路指的是中間操作,由於某些原因(比如下面的limit),導致只執行了部分,沒有全部去執行

我們來修改下上面的例子(加了一個中間操作limit):

List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List<String> listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  // 只加了這一行
  .limit(1)
  .collect(Collectors.toList());

輸出如下:

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}

可以看到,因為limit(1)只需要一個元素,所以filter過濾時,只要找到一個滿足條件的,就會停止過濾操作(后面的元素就放棄了),這個技巧叫做短路技巧

這個就很大程度上體現了中間操作的組合順序帶來的優點:需要多少,處理多少,即按需處理

4. 流的特點

特點有三個:

  • 聲明性:簡潔,易讀,代碼行數大大減少(每天有代碼行數要求的公司除外)
  • 可復合:更靈活,各種組合都可以(只要你想,只要流有)
  • 可並行:性能更好(不用我們去寫多線程,多好)

5. 流式操作和集合操作的區別:

現在我們再來回顧下開頭例子中的集合操作:篩選->排序->提取

List<Cat> listTemp = new ArrayList<>();
// 1. 篩選
for(Cat cat: list){
  if(cat.getAge()>1){
    listTemp.add(cat);
  }
}
// 2. 排序
listTemp.sort(new Comparator<Cat>() {
  @Override
  public int compare(Cat o1, Cat o2) {
    // 遞增排序
    return Integer.compare(o1.getAge(), o2.getAge());
		/**
    * Q:為啥不用減法 return o1.getAge() - o2.getAge()?
    * A:因為減法會有數據溢出的風險
    * 	 如果o1.getAge()為20億,o2.getAge()為-2億,那么結果就會超過int的極限21億多
    **/ 
  }
});
// 3. 提取名字
List<String> listName = new ArrayList<>();
for(Cat cat: listTemp){
  listName.add(cat.getName());
}
System.out.println(listName);

可以看到跟流式操作不一樣的有兩點:

  1. 集合操作中有一個listTemp臨時變量(流式操作沒),
  2. 集合操作一直都在處理數據(而流式操作是直到最后一步的終端操作才會去處理數據),依次篩選->排序->提取名字,是順序執行的

下面我們用表格來列出區別,應該會直觀點

流式操作 集合操作
功能 處理數據為主 存儲數據為主
迭代方式 內部迭代(只迭代一次),只需聲明,不需要實現,流內部自己有實現) 外部迭代(可一直迭代)需要自己foreach
處理數據 直到終端操作,才會開始真正處理數據(按需處理) 一直都在處理數據(全部處理)

用生活中的例子來對比的話,可以用電影來比喻

流就好比在線觀看,集合就好本地觀看(下載到本地)

總結

  1. 流是什么:
    • 流是一種以聲明性的方式來處理數據的API
    • 流是從支持數據處理操作生成的元素序列
      • 源:數據的來源,比如集合,文件等(本節只介紹了集合的流式操作,因為用的比較多;后面有空再介紹其他的)
      • 數據處理操作:就是流的中間操作,比如filter, map
      • 元素序列:通過流的終端操作,返回的結果集
  2. 流的操作流程:
    • 創建流 -> 中間操作 -> 終端操作
    • 中間操作只是聲明,不真實處理數據,直到終端操作開始才會執行
  3. 循環合並:中間操作會自由組合(流根據系統自己來決定組合的順序)
  4. 短路技巧:如果中間操作處理的數據已經達到需求,則會立即停止處理數據(比如limit(1),則當處理完1個就會停止處理)
  5. 流式操作和集合操作的區別:
    • 按需處理,集合全處理
    • 流主攻數據處理,集合主攻數據存儲
    • 簡潔,集合
    • 內部迭代(只迭代一次,完后流會消失),集合外部迭代(可一直迭代)

后記

最后,感謝大家的觀看,謝謝

原創不易,期待官人們的三連喲


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM