原文標題:Async/Await
原文鏈接:https://os.phil-opp.com/async-await/#multitasking
公眾號: Rust 碎碎念
翻譯 by: Praying
Pinning
在本文中我們已經與pinning
偶遇多次。現在終於可以來討論pinning
是什么以及為什么需要它?
自引用結構體(Self-Referential Structs)
正如上面所解釋的,狀態機的變換把每個暫停點的局部變量存儲在一個結構體中。對於像example
函數這樣的小例子,這會很直觀且不會導致什么問題。但是,當變量開始互相引用時,事情就變得困難了。例如,考慮下面的函數:
async fn pin_example() -> i32 {
let array = [1, 2, 3];
let element = &array[2];
async_write_file("foo.txt", element.to_string()).await;
*element
}
這個函數創建了一個array
,其中包含有1
,2
,3
。它接着創建了一個對 array
最后一個元素的引用然后把它存入element
變量。接下來,它把這個已經轉換為字符串的數字異步地寫入到文件foo.txt
中。最后,它返回了被element
引用的數字。
因為這個函數使用了一個的await
操作,所以得到的狀態機有三種狀態:啟動(start)、結束(end)和等待寫入(waiting on write)。這個函數沒有傳入參數,所以開始狀態的結構體是空的。和之前一樣,結束狀態也是空的因為函數在這個位置已經結束了。等待寫入狀態的結構體就比較有意思了:
struct WaitingOnWriteState {
array: [1, 2, 3],
element: 0x1001c, // address of the last array element
}
我們需要把array
和element
變量都存儲起來,因為element
在返回值的時候需要,而array
被element
所引用。element
是一個引用,它存儲了一個指向被引用元素的指針(也就是一個內存地址)。這里我們假設地址是0x1001c
,在實際中,它需要是array
的最后一個元素的地址,因此,它取決於結構體在內存中所處的位置。帶有這樣的內部指針的結構體被稱為自引用(self-referential)結構體
,因為它們通過自己的一個字段引用了它們自身。
自引用結構體的問題
我們的自引用結構體的內部指針導致了一個基本問題,當我們看到它的內存布局后,這個問題就會變得明顯:

array
字段的起始地址為0x10014
,element
字段在地址0x10020
。它指向了地址0x1001c
,因為 array
的最后一個元素的位置就在這里。此時,一切都沒有問題。但是,當我們試圖把這個結構體移動到一個不同的內存地址時,問題就出現了:

我們把結構體往后移動了一下,因此現在它的起始地址為0x10024
。當我們把結構體作為函數參數傳遞時或者把它賦值給另一個棧上的變量,就會發生這種情況。問題在於,element
字段仍然指向地址0x1001c
,而array
的最后一個元素的地址已經變成0x1002c
。因此,這個指針是懸垂(dangling)的,並會導致下一次調用poll
時發生未定義行為。
可能的解決方案
解決這個懸垂指針問題有三種基本方式:
-
在移動時更新指針:思路是無論什么時候,只要結構體在內存中被移動,就更新內部的指針,因此這個指針在移動后仍然是有效的。不幸的是,這種方式將會需要 Rust 作出很大的改變並且有可能導致巨大的性能開銷。原因是,運行時需要追蹤所有結構體字段的類型並且在每次移動操作時都要檢查是否需要更新指針。
-
存儲一個偏移量來取代自引用:為了避免更新指針的需要,編譯器可以把自引用存儲為個結構體開始位置的偏移量。例如,上面的
WaitingOnWriteState
結構體中的element
字段可以存儲為值為 8 的element_offset
字段。因為,引用指向的 array 里的元素起始於結構體開頭的 8 字節。因為偏移位置在結構體移動時是不變的,所以不需要進行字段更新。
這種方式的問題在於它需要編譯器去探查所有的自引用。這在編譯時是不可能實現的,因為一個引用的值可能取決於用戶輸入,因此,我們可能再次需要一個運行時系統來分析引用並正確地創建狀態結構體。這不會導致運行時開銷,但是也阻礙了特定的編譯器優化,因此,它可能會再度引起巨大的性能開銷。 -
禁止移動結構體:正如我們上面所見,懸垂指針僅發生於我們在內存中移動結構體時,通過完全禁止在自引用結構體上的移動操作,可以避免這個問題。這種方式的一個顯著優勢在於,它可以在類型系統層面上被實現而不需要額外的運行時開銷。缺點在於,它把處理可能是自引用結構的移動操作的負擔交給了程序員。
因為要保證提供零成本抽象(zero cost abstraction)的原則,這意味着抽象不應該引入額外的運行時開銷,所以 Rust 選擇了第三種方案。也因此,pinningAPI 在RFC2349中被提出。接下來,我們將會對這個 API 進行簡要介紹,並解釋它是如何與 async/await 以及 future 一同工作的。
堆上的值(Heap Values)
第一個發現是,在大多數情況下,堆分配(heap allocated)的值已經在內存中有了一個固定地址。它們通過調用allocate
來創建,然后被一個指針類型引用,比如Box<T>
。盡管指針類型有可能被移動,但是指針指向的堆上的值仍然保持在相同的內存地址,除非它被一個deallocate
調用來釋放。
使用堆分配,我們可以嘗試去創建一個自引用結構體:
fn main() {
let mut heap_value = Box::new(SelfReferential {
self_ptr: 0 as *const _,
});
let ptr = &*heap_value as *const SelfReferential;
heap_value.self_ptr = ptr;
println!("heap value at: {:p}", heap_value);
println!("internal reference: {:p}", heap_value.self_ptr);
}
struct SelfReferential {
self_ptr: *const Self,
}
我們創建了一個名為SelfReferential
的簡單結構體,該結構體僅包含一個單獨的指針字段。首先,我們使用一個空指針來初始化這個結構體,然后使用Box::new
在堆上分配它。接着,我們計算出這個分配在堆上的結構體的內存地址並將其存儲到一個ptr
變量中。最后,我們通過把ptr
變量賦值給self_ptr
字段使得結構體成為自引用的。
當我們在 playground 上執行這段代碼時,我們看到這個堆上的值的地址和它的內部指針的地址是相等的,這意味着,self_ptr
字段是一個有效的自引用。因為heap_value
只是一個指針,移動它(比如,把它作為參數傳入函數)不會改變結構體自身的值,所以self_ptr
在指針移動后依然是有效的。
但是,仍然有一種方式來破壞這個示例:我們可以擺脫Box<T>
或者替換它的內容:
let stack_value = mem::replace(&mut *heap_value, SelfReferential {
self_ptr: 0 as *const _,
});
println!("value at: {:p}", &stack_value);
println!("internal reference: {:p}", stack_value.self_ptr);
這里,我們使用mem::replace
函數使用一個新的結構體實例來替換堆分配的值。這使得我們把原始的heap_value
移動到棧上,而結構體的self_ptr
字段現在是一個仍然指向舊的堆地址的懸垂指針。當你嘗試在 playground 上運行這個示例時,你會看到打印出的"value at:"
和"internal reference:"
這一行確實是輸出的不同的指針。因此,在堆上分配一個值並不能保證自引用的安全。
出現上面的破綻的基本問題是,Box<T>
允許我們獲得堆分配值的&mut T
引用。這個&mut
引用讓使用類似mem::replace
或者mem::swap
的方法使得堆上值失效成為可能。為了解決這個問題,我們必須阻止創建對自引用結構體的&mut
引用。
Pin<Box
>和 Unpin
pinning API 以Pin
包裝類型和Unpin
標記 trait 的形式提供了一個針對&mut T
問題的解決方案。這些類型背后的思想是對Pin
的所有能被用來獲得對 Unpin trait 上包裝的值的&mut
引用的方法(如get_mut
或者deref_mut
)進行管控。Unpin
trait 是一個auto trait,它會為所有的類型自動實現,除了顯式選擇退出(opt-out)的類型。通過讓自引用結構體選擇退出Unpin
,就沒有(安全的)辦法從一個Pin<Box<T>>
類型獲取一個&mut T
。因此,它們的內部的自引用就能保證仍是有效的。
舉個例子,讓我們修改上面的SelfReferential
類型來選擇退出Unpin
:
use core::marker::PhantomPinned;
struct SelfReferential {
self_ptr: *const Self,
_pin: PhantomPinned,
}
我們通過添加一個類型為PhantomPinned的_pin
字段來選擇退出。這個類型是一個零大小標記類型,它唯一目的就是不去實現Unpin
trait。因為 auto trait 的工作方式,有一個字段不滿足Unpin
,那么整個結構體都會選擇退出Unpin
。
第二步是把例子中的Box<SelfReferential>
改為Pin<Box<SelfReferential>>
類型。實現這個的最簡單的方式是使用Box::pin
函數,而不是使用Box::new
創建堆分配的值。
let mut heap_value = Box::pin(SelfReferential {
self_ptr: 0 as *const _,
_pin: PhantomPinned,
});
除了把Box::new
改為Box::pin
之外,我們還需要在結構體初始化添加新的_pin
字段。因為PhantomPinned
是一個零大小類型,我們只需要它的類型名來初始化它。
當我們嘗試運行調整后的示例時,我們看到它無法編譯:
error[E0594]: cannot assign to data in a dereference of `std::pin::Pin<std::boxed::Box<SelfReferential>>`
--> src/main.rs:10:5
|
10 | heap_value.self_ptr = ptr;
| ^^^^^^^^^^^^^^^^^^^^^^^^^ cannot assign
|
= help: trait `DerefMut` is required to modify through a dereference, but it is not implemented for `std::pin::Pin<std::boxed::Box<SelfReferential>>`
error[E0596]: cannot borrow data in a dereference of `std::pin::Pin<std::boxed::Box<SelfReferential>>` as mutable
--> src/main.rs:16:36
|
16 | let stack_value = mem::replace(&mut *heap_value, SelfReferential {
| ^^^^^^^^^^^^^^^^ cannot borrow as mutable
|
= help: trait `DerefMut` is required to modify through a dereference, but it is not implemented for `std::pin::Pin<std::boxed::Box<SelfReferential>>`
兩個錯誤發生都是因為Pin<Box<SelfReferential>>
類型沒有實現DerefMut
trait。這也正是我們想要的,因為DerefMut
trait 將會返回一個&mut
引用,這是我們想要避免的。發生這種情況是因為我們選擇退出了Unpin
並把Box::new
改為了Box::pin
。
現在的問題在於,編譯器不僅阻止了第 16 行的移動類型,還禁止了第 10 行的self_ptr
的初始化。這會發生時因為編譯器無法區分&mut
引用的有效使用和無效使用。為了能夠正常初始化,我們不得不使用不安全的get_unchecked_mut方法:
// safe because modifying a field doesn't move the whole struct
unsafe {
let mut_ref = Pin::as_mut(&mut heap_value);
Pin::get_unchecked_mut(mut_ref).self_ptr = ptr;
}
get_unchecked_mut函數作用於Pin<&mut T>
而不是Pin<Box<T>>
,所以我們不得不使用Pin::as_mut
來對之前的值進行轉換。接着,我們可以使用get_unchecked_mut
返回的&mut
引用來設置self_ptr
字段。
現在,生下來的唯一的錯誤是mem::replace
上的期望錯誤。記住,這個操作試圖把一個堆分配的值移動到棧上,這將會破壞存儲在self_ptr
字段上的自引用。通過選擇退出Unpin
和使用Pin<Box<T>>
,我們可以在編譯期阻止這個操作,從而安全地使用自引用結構體。正如我們所見,編譯器無法證明自引用的創建是安全的,因此我們需要使用一個不安全的塊(block)並且確認其自身的正確性。
棧 Pinning 和 Pin<&mut T>
在先前的部分,我們學習了如何使用Pin<Box<T>>
來安全地創建一個堆分配的自引用的值。盡管這種方式能夠很好地工作並且相對安全(除了不安全的構造),但是需要的堆分配也會帶來性能損耗。因為 Rust 一直想要盡可能地提供零成本抽象, 所以 pinning API 也允許去創建Pin<&mut T>
實例指向棧分配的值。
不像Pin<Box<T>>
實例那樣能夠擁有被包裝的值的所有權,Pin<&mut T>
實例只是暫時地借用被包裝的值。這使得事情變得更加復雜,因為它要求程序員自己確認額外的保證。最重要的是,一個Pin<&mut T>
必須在被引用的T
的整個生命周期被保持 pinned,這對於棧上的變量很難確認。為了幫助處理這類問題,就有了像pin-utils這樣的 crate。但是我仍然不會推薦 pinning 到棧上除非你真的知道自己在做什么。
想要更加深入地了解,請查閱pin 模塊和Pin::new_unchecked方法的文檔。
Pinning 和 Futures
正如我們在本文中已經看到的,Future::poll方法以Pin<&mut Self>
參數的形式來使用 pinning:
fn poll(self: Pin<&mut Self>, cx: &mut Context) -> Poll<Self::Output>
這個方法接收self: Pin<&mut Self>
而不是普通的&mut self
,其原因在於,從 async/await 創建的 future 實例常常是自引用的。通過把Self
包裝進Pin
並讓編譯器為由 async/await 生的自引用的 futures 選擇退出Unpin
,可以保證這些 futures 在poll
調用之間在內存中不被移動。這就保證了所有的內部引用都是仍然有效的。
值得注意的是,在第一次poll
調用之前移動 future 是沒問題的。因為事實上 future 是懶惰的(lazy)並且直到它們被第一次輪詢之前什么事情也不會做。生成的狀態機中的start
狀態因此只包含函數參數,而沒有內部引用。為了調用poll
,調用者必須首先把 future 包裝進Pin
,這就保證了 future 在內存中不會再被移動。因為棧上的 pinning 難以正確操作,所以我推薦一直使用Box::pin
組合Pin::as_mut
。
如果你想了解如何安全地使用棧 pinning 實現一個 future 組合字函數,可以去看一下map 組合子方法的源碼,以及 pin 文檔中的 projections and structural pinning部分
