理解RxJava線程模型


RxJava作為目前一款超火的框架,它便捷的線程切換一直被人們津津樂道,本文從源碼的角度,來對RxJava的線程模型做一次深入理解。(注:本文的多處代碼都並非原本的RxJava的源碼,而是用來說明邏輯的偽代碼)

入手體驗

RxJava 中切換線程非常簡單,例如最常見的異步線程處理,主線程回調的模型,可以很優雅的用如下代碼來做處理:

  1. Observable.just("magic")
  2. .map(str -> doExpensiveWork(str))
  3. .subscribeOn(Schedulers.io())
  4. .observeOn(AndroidSchedulers.mainThread())
  5. .subscribe(obj -> System.out.print(String.valueOf(obj)));

如上,subscribeOn(Schedulers.io())保證了doExpensiveWork 函數發生在io線程,observeOn(AndroidSchedulers.mainThread())保證了subscribe 回調發生在Android 的主線程。所以,這自然而然的引出了本文的關鍵點,subscribeOnobserveOn到底區別在哪里?

流程淺析

要想回答上面的問題,我們首先需要對RxJava的流程有大體了解,一個Observable從產生,到最終執行subscribe,中間可以經歷n個變換,每次變換會產生一個新的Observable,就像奧運開幕的傳遞火炬一樣,每次火炬都會傳遞到下一個人,最終點燃聖火的是最后一個火炬手,即最終執行subscribe操作的是最后一個Observable,所以,每個Observable之間必須有聯系,這種關系在代碼中的體現就是,每個變換后的Observable都會持有上一個Observable 中OnSubscribe對象的引用(Observable.create 函數所需的參數),最終 Observable的subscribe函數中的關鍵代碼是這一句:

  1. observable.onSubscribe.call(subscriber)

這個observable就是最后一個變換后的observable,那這個onSubscribe對象是誰呢?如何一個observable沒有經過任何變換,直接執行了subscribe,當然就是我們在create中傳入的onSubscribe, 但如果中間經過map、reduce等變換,這個onSubscribe顯然就應該是創建變換后的observable傳入的參數,大部分變換最終都交由lift函數:

  1. public final <R> Observable<R> lift(final Operator<? extends R, ? super T> operator) {
  2. return new Observable<R>(new OnSubscribeLift<T, R>(onSubscribe, operator));
  3. }

所以,上文所提到的onSubscribe對象應該是OnSubscribeLift的實例,而這個OnSubscribeLift所接收的兩個參數,一個是前文提到的,上一個Observable中的OnSubscribe對象,而operator則是每種變換的一個抽象接口。再來看這個OnSubscribeLift對象的call方法:

  1. public void call(Subscriber<? super R> o) {
  2. Subscriber<? super T> st = operator.call(o);
  3. parent.call(st);

operator與parent就是前文提到的兩個參數,可見,operator接口會擁有call方法,接收一個Subscriber, 並返回一個新的Subscriber對象,而接下來的parent.call(st)是回調上一層observable的onSubscribe的call方法,這樣如此繼續,一直到一個onSubscribe截止。這樣我們首先理清了一條線路,就是從最后一個observable的subscribe后,OnSubscribe調用的順序是從后向前的。

這就帶來了另外一個疑問,從上面的代碼可以看到,在執行parent.call(st)之前已經執行了operator.call(o)方法,如果call方法里就把變換的操作執行了的話,那似乎變換也會是從后向前傳遞的呀?所以這個operator.call方法絕對不是我們想象的那么簡單。這里以map操作符為例,看源碼:

  1. public Subscriber<? super T> call(final Subscriber<? super R> s) {
  2. MapSubscriber<T, R> parent = new MapSubscriber<T, R>(o, transformer);
  3. o.add(parent);
  4. return parent;
  5. }

這里果然沒有執行變換操作,而是生成一個MapSubscriber對象,這里需要注意MapSubscriber構造函數的兩個參數,transformer是真正要執行變換的Func1對象,這很好理解,那對於o這個Subscriber是哪一個呢?什么意思?舉個🌰:

o1 -> o2 -> subscribe(Subscriber s0);

o1 經過map操作變為o2, o2執行subscribe操作,如果你理解上文可以知道,這段流程的執行順序為s0會首先傳遞給o2, o2的lift操作會將s0轉換為s1傳遞給o1, 那么在生成o2 這個map操作的 call(final Subscriber<? super R> s)方法中,s值得是誰呢?是s0還是s1呢?答案應該是s0,也就是它的下一級Subscriber,原因很簡單,call方法中返回的MapSubscriber對象parent才是s1.

所以,我們來看一下MapSubscriber的onNext方法做了什么呢?

  1. public void onNext(T t) {
  2. R result;
  3. result = transformer.call(t);
  4. s.onNext(result);
  5. }

很明了,首先執行變換,然后回調下一級的onNext函數。

至此,一個observable從初始,到變換,再到subscribe,我們已經對整個流程有了大體了解。簡單來講一個o1經過map變為o2,可以理解為o2對o1做了一層hook,會經歷兩次流程,首先是onSubscribe對象的call流程會從o2流向o1,我們簡稱流程a,到達o1后,o1又會出發Subscriber的onNext系列流程,簡稱流程b,流程b才是真正執行變換的流程,其走向是從o1流向o2.理解了這個,我們就可以更近一步的理解RxJava中線程的模型了。

tip: 一定要深刻理解流程a與流程b的區別。這對下文理解線程切換至關重要。

切換方式

RxJava對線程模型的抽象是Scheduler,這是一個抽象類,包含一個抽象方法:

  1. public abstract Worker createWorker();

這個Worker是何方神聖呢?它其實是Scheduler的抽象內部類,主要 包含兩個抽象方法:

  1. 1) public abstract Subscription schedule(Action0 action);
  2. 2) public abstract Subscription schedule(final Action0 action, final long delayTime, final TimeUnit unit);

可見,Worker才是線程執行的主力,兩個方法一個用與立即執行任務,另一個用與執行延時任務。而Scheduler是Worker的工廠,用於對外提供Worker。

RxJava中共有兩種常見的方式來切換線程,分別是subscribeOn變換與observeOn變換,這兩者接收的參數都是Scheduler。接下來從源碼層面來對比這兩者的差別。

subscribeOn

首先看subscribeOn的部分

  1. public final Observable<T> subscribeOn(Scheduler scheduler) {
  2. return create(new OperatorSubscribeOn<T>(this, scheduler));
  3. }

create一個新的Observable,傳入的參數是OperatorSubscribeOn,很明顯這應該是OnSubscribe的一個實現,關注這個OperatorSubscribeOn的call實現方法:

  1. public void call(final Subscriber<? super T> subscriber) {
  2. final Worker inner = scheduler.createWorker();
  3. inner.schedule(new Action0() {
  4. @Override
  5. public void call() {
  6. final Thread t = Thread.currentThread();
  7. Subscriber<T> s = new Subscriber<T>(subscriber) {
  8. @Override
  9. public void onNext(T t) {
  10. subscriber.onNext(t);
  11. }
  12. ...
  13. };
  14. source.unsafeSubscribe(s);
  15. }
  16. });
  17. }

這里比較關鍵了,上文提到了流程a與流程b,首先明確一點,這個call方法的執行時機是流程a,也就是說這個call發生在流程b之前,call方法里首先通過外部傳入的scheduler創建Worker - inner對象,接着在inner中執行了一段代碼,神奇了,Action0中call方法這段代碼就在worker線程中執行了,也就是此刻程進行了切換。注意最后一句代碼source.unsafeSubscribe(s),source 代表創建OperatorSubscribeOn對象是傳進來的上一個Observable, 這句的源碼如下:

  1. public final Subscription unsafeSubscribe(Subscriber<? super T> subscriber) {
  2. return onSubscribe.call(subscriber);
  3. }

和上文提到的lift方法中OnSubscribeLift對象的call方法中parent.call(st)作用類似,就是將當前的Observable與上一個Observable通過onSubscribe關聯起來。

至此,我們可以大致了解了subscribeOn的原理,它會在流程a就進行了線程切換,但由於流程a上實際上都是Observable之間串聯關系的代碼,並且是從后面的Observable流向前面的Observable,這帶來的一個隱含意思就是,對於流程b而言,最早的subscribeOn會屏蔽其后面的subscribeOn! 比如:

  1. Observable.just("magic")
  2. .map(file -> doExpensiveWork(file))
  3. .subscribeOn(Schedulers.io())
  4. .subscribeOn(AndroidSchedulers.mainThread())
  5. .subscribe(obj -> doAction(obj)));

這段代碼中無論是doExpensiveWork函數還是doAction函數,都會在io線程出觸發。

observeOn

理解了subscribeOn,那理解observeOn就會更容易一下,observeOn函數最終會轉換到這個函數:

  1. public final Observable<T> observeOn(Scheduler scheduler, boolean delayError, int bufferSize) {
  2. return lift(new OperatorObserveOn<T>(scheduler, delayError, bufferSize));
  3. }

很明顯,這是做了一次lift操作,我們需要關注OperatorObserveOn這個Operator,查看其call方法:

  1. public Subscriber<? super T> call(Subscriber<? super T> child) {
  2. ObserveOnSubscriber<T> parent = new ObserveOnSubscriber<T>(scheduler, child, delayError, bufferSize);
  3. parent.init();
  4. return parent;
  5. }

這里返回的是一個ObserveOnSubscriber對象,我們關注這個Subscriber的onNext函數,

  1. public void onNext(final T t) {
  2. schedule();
  3. }

它只是簡單的執行了schedule函數,來看下這個schedule:

  1. protected void schedule() {
  2. recursiveScheduler.schedule(this);
  3. }

這里亂入的recursiveScheduler.schedule是什么鬼?它並不神奇,它就是ObserveOnSubscriber構造函數傳進來的scheduler創建的worker:

  1. this.recursiveScheduler = scheduler.createWorker();

所以,magic再次產生,observeOn在其onNext中進行了線程的切換,那這個onNext是在什么時候執行的呢?通過上文可知,是在流程b中。所以observeOn會影響其后面的流程,直到出現下一次observeOn或者結束。

周邊技巧

線程模型的選擇

RxJava為我們內置了幾種線程模型,主要區別如下:

  • computation

    內部是一個線程,線程池的大小cpu核數:Runtime.getRuntime().availableProcessors(),這種線程比較適合做純cpu運算,如求100億以內的斐波那契數列的和之類。

  • newThread

    每次createWorker都會生成一個新的線程。

  • io

    與newThread類似,但內部是一個沒有上線的線程池,一般來講,使用io會比newThread好一些,因為其內部的線程池可以重用線程。

  • immediate

    在當前線程立即執行

  • trampoline

    在當前線程執行,與immediate不同的是,它並不會立即執行,而是將其存入隊列,等待當前Scheduler中其它任務執行完畢后執行,這個在我們時常使用的並不多,它主要服務於repeat ,retry這類特殊的變換操作。

  • from

    接收一個Executor,允許我們自定義Scheduler。

Scheduler.Worker強勢搶鏡

其實RxJava中的Worker完全可以抽出來為我所用,如下面這種寫法,就是新開線程執行了一個action。

  1. Scheduler.Worker worker = Schedulers. newThread().createWorker();
  2. worker.schedule(new Action0() {
  3. @Override
  4. public void call() {
  5. throw new RuntimeException("surprise");
  6. }
  7. });

當然,你要選擇合適的時機去關閉(unsubscribe)worker來釋放資源。

自帶光環的操作符

某些操作符是有默認的線程模型的,比如前文提到的repeat 與retry會默認在trampoline線程模型下執行, buffer ,debounce之類會默認切換到computation。這里不做深入探討,只是當你遇到某些問題時記得,有些人物是自帶裝備與光環的。

總結

理解RxJava的線程模型最重要的是要與我們平常對異步的理解來區分開:

  1. doAsync("magic", new Callback() {
  2. @Override
  3. public void handle(Object msg) {
  4. a) ....
  5. }
  6. });
  7. b)....

這是之前我們常寫的代碼,通常只會區分UI線程和非UI 線程,doAsync函數開始后,程序進行了分流,一個線程在執行一個doAsync, 另一個線程在執行b段代碼。RxJava另辟蹊徑,對整個線程做了抽象,RxJava的處理順序像一條流水,這不僅僅表現在代碼寫起來像一條鎖鏈上,邏輯上也是如此,對Observable自身而言,更改線程只是變換了流水前進的軌道,並不是進行分流,Android中常見 非UI線程處理數據,UI 線程展示數據也只是這條流水變換的一種方式。

就我個人的理解,對於RxJava的線程切換,把它理解為異步,非異步,阻塞,非阻塞都有些不恰當,暫且只能理解為變換。so amazing!

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM