Android : 跟我學Binder --- (1) 什么是Binder IPC?為何要使用Binder機制?



目錄:

 

 

一、引言

  如果把Android系統比作一幅精美絕倫的畫,那Binder則是其濃墨重彩的獨特一筆。初步了解過的人應該知道Binder是Android核心進程間通信(IPC:Internet Process Connection)手段之一,它是基於開源的 OpenBinder 實現,OpenBinder 起初由 Be Inc. 開發,后由 Plam Inc. 接手。從字面上來解釋 Binder 有膠水、粘合劑的意思,顧名思義就是粘和不同的進程,使之實現通信。而日常開發中涉及到的如:AIDL、插件化編程技術 等等,底層通信實現都離不開Binder,所以如果想在“Android系統開發工程師”的頭銜前面加上“高級”兩個字,那理解、掌握Binder機制則是必經之路。

 

二、Linux 下傳統的進程間通信原理

  首先了解一下 Linux IPC 相關的概念和原理有助於理解 Binder 通信原理。

  1.Linux 中跨進程通信涉及到的一些基本概念:

    進程隔離進程間不可直接相互訪問資源

      簡單的說就是操作系統中,進程與進程間內存是不共享的,兩個進程就像兩個平行的世界,A 進程沒法直接訪問 B 進程的數據,這就是進程隔離的通俗解釋。A 進程和 B 進程之間要進行數據交互就得采用特殊的通信機制:進程間通信(IPC)。

 

    ②進程空間划分:用戶空間(User Space)/內核空間(Kernel Space)

      現在操作系統都是采用的虛擬存儲器,對於 32 位系統而言,它的尋址空間(虛擬存儲空間)就是 2 的 32 次方,也就是 4GB。操作系統的核心是內核,獨立於普通的應用程序,可以訪問受保護的內存空間,也可以訪問底層硬件設備的權限。為了保護用戶進程不能直接操作內核,保證內核的安全,操作系統從邏輯上將虛擬空間划分為用戶空間(User Space)和內核空間(Kernel Space)。針對 Linux 操作系統而言,將最高的 1GB 字節供內核使用,稱為內核空間;較低的 3GB 字節供各進程使用,稱為用戶空間,它們在自己的空間運行,相互隔離。

 

    ③系統調用:用戶態/內核態

      雖然從邏輯上進行了用戶空間和內核空間的划分,但不可避免的用戶空間需要訪問內核資源,比如文件操作、訪問網絡等等。為了突破隔離限制,就需要借助系統調用來實現。系統調用是用戶空間訪問內核空間的唯一方式,保證了所有的資源訪問都是在內核的控制下進行的,避免了用戶程序對系統資源的越權訪問,提升了系統安全性和穩定性。當一個任務(進程)執行系統調用而陷入內核代碼中執行時,稱進程處於內核運行態(內核態),執行的內核代碼會使用當前進程的內核棧,每個進程都有自己的內核棧。當進程在執行用戶自己的代碼的時候,則稱其處於用戶運行態(用戶態)。系統調用主要通過如下兩個函數來實現,在編寫Linux設備驅動程序時經常用到:

      copy_from_user() //將數據從用戶空間拷貝到內核空間       copy_to_user() //將數據從內核空間拷貝到用戶空間

  2.Linux 下的傳統 IPC 通信原理:

    Linux的IPC通常做法是消息發送方將要發送的數據存放在內存緩存區中,通過系統調用進入內核態。然后內核程序在內核空間分配內存,開辟一塊內核緩存區,調用 copy_from_user() 函數將數據從用戶空間的內存緩存區拷貝到內核空間的內核緩存區中。同樣的,接收方進程在接收數據時在自己的用戶空間開辟一塊內存緩存區,然后內核程序調用 copy_to_user() 函數將數據從內核緩存區拷貝到接收進程的內存緩存區。這樣數據發送方進程和數據接收方進程就完成了一次數據傳輸。

  但是這種傳統的 IPC 通信方式有兩個顯著缺點:

  (1)一次數據傳遞需要經歷:內存緩存區 --> 內核緩存區 --> 內存緩存區,需要 2 次數據拷貝,效率低,可能此時會想到共享內存方式,但是其難於控制不穩定;

  (2)接收數據的緩存區由數據接收進程提供,但是接收進程並不知道需要多大的空間來存放將要傳遞過來的數據,因此只能開辟盡可能大的內存空間或者先調用 API 接收消息頭來獲取消息體的大小,對於手機這種資源緊張的嵌入式移動設備來說無疑是巨大負擔;

  可見傳統IPC效率低,占資源,除此之外還有安全、穩定性等缺點不足以勝任Android的核心進程間通信方式,下面正式介紹Binder機制,看其有何過人之處。

 

三、為何要用Binder通信機制?

  Android系統的內核Linux已經有很多進程間通信的方式,比如:管道(Pipe)、信號(Signal)和跟蹤(Trace)、插口(Socket)、報文隊列(Message)、共享內存(Share Memory)和信號量(Semaphore)等 IPC 機制,那Android為何還要再實現一個Binder IPC 呢?主要是基於高效性穩定性安全性幾方面原因。

  1.高效對於手機移動通信設備來說,是基於Client-Server即C/S架構的通信方式,而上面提到的Linux傳統IPC中只有socket支持Client-Server的通信方式,但是socket作為一款通用接口,其傳輸效率低,開銷大,主要用在跨網絡的進程間通信和本機上進程間的低速通信。消息隊列和管道采用存儲-轉發方式,即數據先從發送方緩存區拷貝到內核開辟的緩存區中,然后再從內核緩存區拷貝到接收方緩存區,至少有兩次拷貝過程。共享內存雖然無需拷貝,但控制復雜,難以使用。

IPC方式 數據拷貝次數
共享內存 0
Binder 1
Socket/管道/消息隊列 2

  2.穩定性Binder 基於 C/S 架構,客戶端(Client)有什么需求就丟給服務端(Server)去完成,架構清晰、職責明確又相互獨立,自然穩定性更好。所以從穩定性的角度講,Binder 機制是也優於內存共享的復雜控制缺點。

  3.安全Android 作為一個開放性的平台,市場上有各類海量的應用供用戶選擇安裝,因此安全性對於 Android 平台而言極其重要。作為用戶當然不希望我們下載的 APP 偷偷讀取我的通信錄,上傳我的隱私數據,后台偷跑流量、消耗手機電量。傳統的 IPC 沒有任何安全措施,完全依賴上層協議來確保。首先傳統的 IPC 接收方無法獲得對方可靠的進程用戶ID/進程ID(UID/PID),從而無法鑒別對方身份。Android 為每個安裝好的 APP 分配了自己的 UID,故而進程的 UID 是鑒別進程身份的重要標志。傳統的 IPC 只能由用戶在數據包中填入 UID/PID,但這樣不可靠,容易被惡意程序利用。可靠的身份標識只有由 IPC 機制在內核中添加。其次傳統的 IPC 訪問接入點是開放的,只要知道這些接入點的程序都可以和對端建立連接,不管怎樣都無法阻止惡意程序通過猜測接收方地址獲得連接。同時 Binder 既支持實名 Binder,又支持匿名 Binder,安全性高。

    

  Binder優勢總結:

優勢 描述
性能 只需要一次數據拷貝,性能上僅次於共享內存
穩定性 基於 C/S 架構,職責明確、架構清晰,因此穩定性好
安全性 為每個 APP 分配 UID,進程的 UID 是鑒別進程身份的重要標志

 

 

  另外上面講過Linux IPC的通信原理,現在正式介紹 Binder IPC 的通信原理

  正如前面所說,跨進程通信是需要內核空間做支持的。傳統的 IPC 機制如管道、Socket 都是內核的一部分,因此通過內核支持來實現進程間通信自然是沒問題的。但是 Binder 並不是 Linux 系統內核的一部分,那怎么辦呢?這就得益於 Linux 的動態內核可加載模塊(Loadable Kernel Module,LKM)的機制;模塊是具有獨立功能的程序,它可以被單獨編譯,但是不能獨立運行。它在運行時被鏈接到內核作為內核的一部分運行。這樣,Android 系統就可以通過動態添加一個內核模塊運行在內核空間,用戶進程之間通過這個內核模塊作為橋梁來實現通信,此內核模塊就叫 Binder 驅動(Binder Dirver)。

  那么在 Android 系統中用戶進程之間是如何通過這個內核模塊(Binder 驅動)來實現通信的呢?難道是和前面說的傳統 IPC 機制一樣,先將數據從發送方進程拷貝到內核緩存區,然后再將數據從內核緩存區拷貝到接收方進程,通過兩次拷貝來實現嗎?顯然不是,否則也不會有開篇所說的 Binder 在性能方面的優勢了。這就不得說到 Linux 下的另一個概念:內存映射(mmap):將用戶空間的一塊內存區域映射到內核空間。映射關系建立后,用戶對這塊內存區域的修改可以直接反應到內核空間;反之內核空間對這段區域的修改也能直接反應到用戶空間,內存映射能減少數據拷貝次數,實現用戶空間和內核空間的高效互動。兩個空間各自的修改能直接反映在映射的內存區域,從而被對方空間及時感知。

  但是 mmap() 通常是用在有物理介質的文件系統上的,比如對flash的操作,因為進程中的用戶區域是不能直接和物理設備打交道的,如果想要把flash上的數據讀取到進程的用戶區域,需要兩次拷貝(flash-->內核空間-->用戶空間),通常在這種場景下 mmap() 就能發揮作用,通過在物理介質和用戶空間之間建立映射,減少數據的拷貝次數,用內存讀寫取代I/O讀寫,提高文件讀取效率。而 Binder 並不存在物理介質,因此 Binder 驅動使用 mmap() 並不是為了在物理介質和用戶空間之間建立映射,而是用來在內核空間創建數據接收的緩存空間。mmap()使用方法如下:

/*fd描述為打開的/dev/binder文件句柄;
 *mapsize為映射內存區域的大小;
 *mapped為映射到用戶空間的內存起始地址;
 */
 bs->fd = open("/dev/binder", O_RDWR);
 bs->mapsize = mapsize;
 bs->mapped = mmap(NULL, mapsize, PROT_READ, MAP_PRIVATE, bs->fd, 0);

 一次完整的 Binder IPC 通信過程通常是這樣:

  ①首先 Binder 驅動在內核空間創建一個數據接收緩存區;

  ②接着在內核空間開辟一塊內核緩存區,建立內核緩存區內核中數據接收緩存區之間的映射關系,以及內核中數據接收緩存區接收進程用戶空間地址的映射關系;

  ③發送方進程通過系統調用 copy_from_user() 將數據 copy 到內核中的內核緩存區,由於內核緩存區和接收進程的用戶空間存在內存映射,因此也就相當於把數據發送到了接收進程的用戶空間;

 

四、Binder通信模型實現

  通過介紹、對比Android Binder IPC和Linux 傳統IPC之間的差異,Binder IPC的各優點已經凸顯出來。一次完整的進程間通信必然至少包含兩個進程,通常我們稱通信的雙方分別為客戶端進程(Client)和服務端進程(Server),由於進程隔離機制的存在,通信雙方必然需要借助 Binder 來實現。接下來看看實現層面是如何設計的?

 1. Client/Server/ServiceManager/驅動

  前面介紹過,Binder 是基於 C/S 架構的。由一系列的組件組成,包括 Client、Server、ServiceManager、Binder 驅動。其中 Client、Server、Service Manager 運行在用戶空間,Binder 驅動運行在內核空間。其中 Service Manager 和 Binder 驅動由系統提供,而 Client、Server 由應用程序來實現。Client、Server 和 ServiceManager 均是通過系統調用 open、mmap 和 ioctl 來訪問設備文件 /dev/binder,從而實現與 Binder 驅動的交互來間接的實現跨進程通信。

  Client、Server、ServiceManager、Binder 驅動這幾個組件在通信過程中扮演的角色就如同互聯網中服務器(Server)、客戶端(Client)、DNS域名服務器(ServiceManager)以及路由器(Binder 驅動)之前的關系。通常我們訪問一個網頁的步驟是這樣的:首先在瀏覽器輸入一個地址,如 www.google.com 然后按下回車鍵。但是並沒有辦法通過域名地址直接找到我們要訪問的服務器,因此需要首先訪問 DNS 域名服務器,域名服務器中保存了 www.google.com 對應的 ip 地址 10.249.23.13,然后通過這個 ip 地址才能放到到 www.google.com 對應的服務器。下面是Binder類比介紹:

Binder 驅動
  Binder 驅動就如同路由器一樣,是整個通信的核心;驅動負責進程之間 Binder 通信的建立,Binder 在進程之間的傳遞,Binder 引用計數管理,數據包在進程之間的傳遞和交互等一系列底層支持。 

ServiceManager 與實名 Binder
  ServiceManager 和 DNS 類似,作用是將字符形式的 Binder 名字轉化成 Client 中對該 Binder 的引用,使得 Client 能夠通過 Binder 的名字獲得對 Binder 實體的引用。注冊了名字的 Binder 叫實名 Binder,就像網站一樣除了有 IP 地址外還有自己的網址。Server 創建了 Binder,並為它起一個字符形式,可讀易記得名字,將這個 Binder 實體連同名字一起以數據包的形式通過 Binder 驅動發送給 ServiceManager ,通知 ServiceManager 注冊一個名為“張三”的 Binder,它位於某個 Server 中。驅動為這個穿越進程邊界的 Binder 創建位於內核中的實體節點以及 ServiceManager 對實體的引用,將名字以及新建的引用打包傳給 ServiceManager。ServiceManger 收到數據后從中取出名字和引用填入查找表。
  細心的讀者可能會發現,ServierManager 是一個進程,Server 是另一個進程,Server 向 ServiceManager 中注冊 Binder 必然涉及到進程間通信。當前實現進程間通信又要用到進程間通信,這就好像蛋可以孵出雞的前提卻是要先找只雞下蛋!Binder 的實現比較巧妙,就是預先創造一只雞來下蛋,ServiceManager 和其他進程同樣采用 Bidner 通信,ServiceManager 是 Server 端,有自己的 Binder 實體,其他進程都是 Client,需要通過這個 Binder 的引用來實現 Binder 的注冊,查詢和獲取。ServiceManager 提供的 Binder 比較特殊,它沒有名字也不需要注冊。當一個進程使用 BINDER_SET_CONTEXT_MGR 命令將自己注冊成 ServiceManager 時 Binder 驅動會自動為它創建 Binder 實體(這就是那只預先造好的那只雞)。其次這個 Binder 實體的引用在所有 Client 中都固定為 0 而無需通過其它手段獲得。也就是說,一個 Server 想要向 ServiceManager 注冊自己的 Binder 就必須通過這個 0 號引用和 ServiceManager 的 Binder 通信。類比互聯網,0 號引用就好比是域名服務器的地址,你必須預先動態或者手工配置好。要注意的是,這里說的 Client 是相對於 ServiceManager 而言的,一個進程或者應用程序可能是提供服務的 Server,但對於 ServiceManager 來說它仍然是個 Client。

Client 獲得實名 Binder 的引用
  Server 向 ServiceManager 中注冊了 Binder 以后, Client 就能通過名字獲得 Binder 的引用了。Client 也利用保留的 0 號引用向 ServiceManager 請求訪問某個 Binder: 我申請訪問名字叫張三的 Binder 引用。ServiceManager 收到這個請求后從請求數據包中取出 Binder 名稱,在查找表里找到對應的條目,取出對應的 Binder 引用作為回復發送給發起請求的 Client。從面向對象的角度看,Server 中的 Binder 實體現在有兩個引用:一個位於 ServiceManager 中,一個位於發起請求的 Client 中。如果接下來有更多的 Client 請求該 Binder,系統中就會有更多的引用指向該 Binder ,就像 Java 中一個對象有多個引用一樣。

至此,大致能總結出 Binder 通信過程:

  ①首先,一個進程使用 BINDER_SET_CONTEXT_MGR 命令通過 Binder 驅動將自己注冊成為 ServiceManager;

  ②Server 通過驅動向 ServiceManager 中注冊 Binder(Server 中的 Binder 實體),表明可以對外提供服務。驅動為這個 Binder 創建位於內核中的實體節點以及 ServiceManager 對實體的引用,將名字以及新建的引用打包傳給 ServiceManager,ServiceManger 將其填入查找表。

  ③Client 通過名字,在 Binder 驅動的幫助下從 ServiceManager 中獲取到對 Binder 實體的引用,通過這個引用就能實現和 Server 進程的通信。

 

 2. Binder 通信中的代理模式

  目前已經解釋清楚 Client、Server 借助 Binder 驅動完成跨進程通信的實現機制了,但是還有個問題比較困惑:A 進程想要 B 進程中某個對象(object)是如何實現的呢?畢竟它們分屬不同的進程,A 進程 沒法直接使用 B 進程中的 object。

  前面介紹跨進程通信的過程都有 Binder 驅動的參與,因此在數據流經 Binder 驅動的時候驅動會對數據做一層轉換。當 A 進程想要獲取 B 進程中的 object 時,驅動並不會真的把 object 返回給 A,而是返回了一個跟 object 看起來一模一樣的代理對象 objectProxy,這個 objectProxy 具有和 object 一摸一樣的方法,但是這些方法並沒有 B 進程中 object 對象那些方法的能力,這些方法只需要把把請求參數交給驅動即可。對於 A 進程來說和直接調用 object 中的方法是一樣的。當 Binder 驅動接收到 A 進程的消息后,發現這是個 objectProxy 就去查詢自己維護的表單,一查發現這是 B 進程 object 的代理對象。於是就會去通知 B 進程調用 object 的方法,並要求 B 進程把返回結果發給自己,當驅動拿到 B 進程的返回結果后就會轉發給 A 進程,一次通信就完成了。

   到此可以對 Binder 做個更加全面的定義了:

  • 從進程間通信的角度看,Binder 是一種進程間通信的機制;
  • 從 Server 進程的角度看,Binder 指的是 Server 中的 Binder 實體對象;
  • 從 Client 進程的角度看,Binder 指的是對 Binder 代理對象,是 Binder 實體對象的一個遠程代理;
  • 從傳輸過程的角度看,Binder 是一個可以跨進程傳輸的對象,Binder 驅動會對這個跨越進程邊界的對象做一點點特殊處理,自動完成代理對象和本地對象之間的轉換。

 

 

  可以參考該博客自測對binder機制的理解程度:https://www.jianshu.com/p/adaa1a39a274

 

-end-


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM