Java8中的Stream流式操作 - 入門篇

本文轉載自查看原文 2021-04-18 14:02 455 流式操作/ Java8/ Stream

作者：湯圓

個人博客：javalover.cc

前言

之前總是朋友朋友的叫，感覺有套近乎的嫌疑，所以后面還是給大家改個稱呼吧

因為大家是來看東西的，所以暫且叫做官人吧（靈感來自於民間流傳的四大名著之一）

官人們好啊，我是湯圓，今天給大家帶來的是《Java8中的Stream流式操作 - 入門篇》，希望有所幫助，謝謝

文章純屬原創，個人總結難免有差錯，如果有，麻煩在評論區回復或后台私信，謝啦

簡介

流式操作也叫做函數式操作，是Java8新出的功能

流式操作主要用來處理數據（比如集合），就像泛型也大多用在集合中一樣（看來集合這個小東西還是很關鍵的啊，哪哪都有它）

下面我們主要用例子來介紹下，流的基操（建議先看下lambda表達式篇，里面介紹的lambda表達式、函數式接口、方法引用等，下面會用到）

先來看下目錄

正文

1. 流是什么

流是一種以聲明性的方式來處理數據的API

什么是聲明性的方式？

就是只聲明，不實現，類似抽象方法（多態性）

2. 老板，上栗子

下面我們舉個栗子，來看下什么是流式操作，然后針對這個栗子，引出后面的相關概念

需求：篩選年齡大於1的貓（貓的1年≈人的5年），並按年齡遞增排序，最后提取名字單獨存放到列表中


public class BasicDemo {
    public static void main(String[] args) {
      // 以下貓的名字均為真名，非虛構
        List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
        // === 舊代碼 Java8之前 ===
        List<Cat> listTemp = new ArrayList<>();
        // 1. 篩選
        for(Cat cat: list){
            if(cat.getAge()>1){
                listTemp.add(cat);
            }
        }
        // 2. 排序
        listTemp.sort(new Comparator<Cat>() {
            @Override
            public int compare(Cat o1, Cat o2) {
                // 遞增排序
                return Integer.compare(o1.getAge(), o2.getAge());
            }
        });
        // 3. 提取名字
        List<String> listName = new ArrayList<>();
        for(Cat cat: listTemp){
            listName.add(cat.getName());
        }
        System.out.println(listName);
        
        // === 新代碼 Java8之后 ===
        List<String> listNameNew = list.stream()
          			// 函數式接口 Predicate的 boolean test(T t)抽象方法
                .filter(cat -> cat.getAge() > 1)
								// lambda表達式的方法引用
			          .sorted(Comparator.comparingInt(Cat::getAge))
          			// 函數式接口 Funtion的 R apply(T t)抽象方法
                .map(cat-> cat.getName())
             	  // 收集數據，把流轉為集合List
                .collect(Collectors.toList());
        System.out.println(listNameNew);
    }
}
class Cat{
    int age;
    String name;

    public Cat(int age, String name) {
        this.age = age;
        this.name = name;
    }
	// 省略getter/setter
}

可以看到，用了流式操作，代碼簡潔了很多（秒哇）

Q：有的官人可能會想，這跟前面lambda表達式的組合操作有點像啊。

A：你說對了，確實只是像，區別還是很大的。因為lambda表達式的組合操作其實還是屬於直接針對集合的操作；

文末會講到直接操作集合和流式操作的區別，這里先跳過

下面我們基於這個栗子，來分別介紹涉及到的知識點

3. 流的操作步驟

我們先忽略舊版的集合操作（后面介紹流和集合的區別時再說），先來介紹流的操作（畢竟流才是今天的主角嘛）

流的操作分三步走：創建流、中間操作、終端操作

流程如下圖：

流的操作流程

這里我們要關注一個很重要的點：

在終端操作開始之前，中間操作不會執行任何處理，它只是聲明執行什么操作；

你可以想象上面這個流程是一個流水線：我們這里做個簡化處理

目的：先告訴你，我們要加工瓶裝的水（先創建流，告訴你要處理哪些數據）
再針對這些瓶子和水，來搭建一個流水線：固定瓶子的夾具、裝水的水管、擰蓋子的爪子、裝箱的打包器（中間操作，聲明要執行的操作）
最后按下啟動按鈕，流水線開始工作（終端操作，開始根據中間操作來處理數據）

流水線

因為每一個中間操作都是返回一個流（Stream），這樣他們就可以一直組合下去（我好像吃到了什么東西？），但是他們的組合順序是不固定的，流會根據系統性能去選擇合適的組合順序

我們可以打印一些東西來看下：

List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List<String> listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  .collect(Collectors.toList());

輸出如下：

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}
filter: Cat{age=2}
map:Cat{age=2}

可以看到，中間操作的filter和map組合到一起交叉執行了，盡管他們是兩個獨立的操作（這個技術叫作循環合並）

這個合並主要是由流式操作根據系統的性能來自行決定的

既然講到了循環合並，那下面捎帶說下短路技巧

短路這個詞大家應該比較熟悉（比如腦子短路什么的），指的是本來A->B->C是都要執行的，但是在B的地方短路了，所以就變成了A->C了

這里的短路指的是中間操作，由於某些原因（比如下面的limit），導致只執行了部分，沒有全部去執行

我們來修改下上面的例子（加了一個中間操作limit)：

List<Cat> list = Arrays.asList(new Cat(1, "tangyuan"), new Cat(3, "dangdang"), new Cat(2, "milu"));
List<String> listNameNew = list.stream()
  .filter(cat -> {
    System.out.println("filter: " + cat);
    return cat.getAge() > 1;
  })
  .map(cat-> {
    System.out.println("map:" + cat);
    return cat.getName();
  })
  // 只加了這一行
  .limit(1)
  .collect(Collectors.toList());

輸出如下：

filter: Cat{age=1}
filter: Cat{age=3}
map:Cat{age=3}

可以看到，因為limit(1)只需要一個元素，所以filter過濾時，只要找到一個滿足條件的，就會停止過濾操作（后面的元素就放棄了），這個技巧叫做短路技巧

這個就很大程度上體現了中間操作的組合順序帶來的優點：需要多少，處理多少，即按需處理

4. 流的特點

特點有三個：

聲明性：簡潔，易讀，代碼行數大大減少（每天有代碼行數要求的公司除外）
可復合：更靈活，各種組合都可以（只要你想，只要流有）
可並行：性能更好（不用我們去寫多線程，多好）

5. 流式操作和集合操作的區別：

現在我們再來回顧下開頭例子中的集合操作：篩選->排序->提取

List<Cat> listTemp = new ArrayList<>();
// 1. 篩選
for(Cat cat: list){
  if(cat.getAge()>1){
    listTemp.add(cat);
  }
}
// 2. 排序
listTemp.sort(new Comparator<Cat>() {
  @Override
  public int compare(Cat o1, Cat o2) {
    // 遞增排序
    return Integer.compare(o1.getAge(), o2.getAge());
		/**
    * Q：為啥不用減法 return o1.getAge() - o2.getAge()？
    * A：因為減法會有數據溢出的風險
    * 	 如果o1.getAge()為20億，o2.getAge()為-2億，那么結果就會超過int的極限21億多
    **/ 
  }
});
// 3. 提取名字
List<String> listName = new ArrayList<>();
for(Cat cat: listTemp){
  listName.add(cat.getName());
}
System.out.println(listName);

可以看到跟流式操作不一樣的有兩點：

集合操作中有一個listTemp臨時變量（流式操作沒），
集合操作一直都在處理數據（而流式操作是直到最后一步的終端操作才會去處理數據），依次篩選->排序->提取名字，是順序執行的

下面我們用表格來列出區別，應該會直觀點

	流式操作	集合操作
功能	處理數據為主	存儲數據為主
迭代方式	內部迭代（只迭代一次)，只需聲明，不需要實現，流內部自己有實現）	外部迭代（可一直迭代）需要自己foreach
處理數據	直到終端操作，才會開始真正處理數據（按需處理）	一直都在處理數據（全部處理）

用生活中的例子來對比的話，可以用電影來比喻

流就好比在線觀看，集合就好本地觀看（下載到本地）

總結

流是什么：
- 流是一種以聲明性的方式來處理數據的API
- 流是從支持數據處理操作的源生成的元素序列
  - 源：數據的來源，比如集合，文件等（本節只介紹了集合的流式操作，因為用的比較多；后面有空再介紹其他的）
  - 數據處理操作：就是流的中間操作，比如filter, map
  - 元素序列：通過流的終端操作，返回的結果集
流的操作流程：
- 創建流 -> 中間操作 -> 終端操作
- 中間操作只是聲明，不真實處理數據，直到終端操作開始才會執行
循環合並：中間操作會自由組合（流根據系統自己來決定組合的順序）
短路技巧：如果中間操作處理的數據已經達到需求，則會立即停止處理數據（比如limit(1)，則當處理完1個就會停止處理）
流式操作和集合操作的區別：
- 流按需處理，集合全處理
- 流主攻數據處理，集合主攻數據存儲
- 流簡潔，集合不
- 流內部迭代（只迭代一次，完后流會消失），集合外部迭代（可一直迭代）

后記

最后，感謝大家的觀看，謝謝

原創不易，期待官人們的三連喲

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java8——Stream流式操作的一點小總結 Java8 流式 API（`java.util.stream`）《Java從入門到放棄》JavaSE入門篇：文件操作 Java8 中的流式數據處理 Java8中Stream為什么要boxed java8中stream的用法【Java8新特性】面試官：談談Java8中的Stream API有哪些終止操作？ java8 新特性入門 stream/lambda Java8 使用stream實現各種list操作 java8 stream流的常用操作