.Net Core中使用ref和Span 提高程序性能


一、前言

其實說到ref,很多同學對它已經有所了解,ref是C# 7.0的一個語言特性,它為開發人員提供了返回本地變量引用和值引用的機制。
Span 也是建立在ref語法基礎上的一個復雜的數據類型,在文章的后半部分,我會有一個例子說明如何使用它。

二、ref關鍵字

不論是ref還是out關鍵,都是一種比較難以理解和操作的語言特性,如C語言中操作指針一樣,這樣的高級語法總是什么帶來一些副作用,但是我不認為這有什么,而且不是每一個C#開發者都要對這些內部運行的機制有着深刻的理解,我覺得不論什么復雜的東西只是為人們提供了一個自由的選擇,風險和靈活性永遠是不能兼容的。

來看幾個例子來說明引用與指針的相同性,當然下面的使用方式早在C# 7.0之前就可以使用了:

public static void IncrementByRef(ref int x)
{
    x++;
}

public unsafe static void IncrementByPointer(int* x)
{
   (*x)++;
}

上面兩個函數分別是使用ref和非安全指針來完成參數+1。

int i = 30;
IncrementByRef(ref i);
// i = 31
unsafe{
   IncrementByPointer(&i);
}
// i = 32

下面是C# 7.0提供的特性:

1.ref locals (引用本地變量)

int i = 42;
ref var x = ref i;
x = x + 1;
// i = 43

這個例子中為本地 i 變量的引用 x, 當改變x的值時i變量的值也改變了。

2.ref returns (返回值引用)

ref returns是C# 7中一個強大的特性,下面代碼是最能體現其特性的,該函數提供了,返回int數組中某一項的引用:

public static ref int GetArrayRef(int[] items, int index) => ref items[index];

通過下標取得數組中的項目的引用,改變引用值時,數組也會隨之改變。

三、Span

System.Span 是.Net Core核心的一部分,在 System.Memory.dll 程序集下。目前該特性是獨立的,將來可能會集成到CoreFx中;

如何使用呢?在.Net Core 2.0 SDK創建的項目下引用如下NuGet包:

  <ItemGroup>
    <PackageReference Include="System.Memory" Version="4.4.0-preview1-25305-02" />
    <PackageReference Include="System.Runtime.CompilerServices.Unsafe" Version="4.4.0-preview1-25305-02" />
  </ItemGroup>

在上面我們看到了使用ref關鍵字可以提供的類似指針(T*)的操作單一值對象方式。基本上在.NET體系下操作指針都不認為是一件好的事件,當然.NET為我們提供了安全操作單值引用的ref。但是單值只是用戶使用“指針”的一小部分需求;對於指針來說,更常見的情況是操作一系列連續的內存空間中的“元素”時。

Span 表示為一個已知長度和類型的連續內存塊。許多方面講它非常類似T[]或ArraySegment ,它提供安全的訪問內存區域指針的能力。其實我理解它更將是.NET中操作(void*)指針的抽象,熟悉C/C++開發者應該更明白這意味着什么。

Span 的特點如下:

  • 抽象了所有連續內存空間的類型系統,包括:數組、非托管指針、堆棧指針、fixed或pinned過的托管數據,以及值內部區域的引用
  • 支持CLR標准對象類型和值類型
  • 支持泛型
  • 支持GC,而不像指針需要自己來管理釋放

下面來看下Span 的定義,它與ref有着語法和語義上的聯系:

public struct Span<T> {
    ref T _reference;
    int _length;
    public ref T this[int index] { get {...} }
    ...
}

public struct ReadOnlySpan<T> {
    ref T _reference;
    int _length;
    public T this[int index] { get {...} }
    ...
}

接下來我會用一個直觀的例子來說明Span 的使用場景;我們以字符截取和字符轉換(轉換為整型)為例:

如有一個字符串string content = "content-length:123",要轉換將123轉換為整型,通常的做法是先Substring將與數字字符無關的字符串進行截斷,轉換代碼如下:

string content = "content-length:123";
Stopwatch watch1 = new Stopwatch();
watch1.Start();
for (int j = 0; j < 100000; j++)
{
    int.Parse(content.Substring(15));
}
watch1.Stop();
Console.WriteLine("\tTime Elapsed:\t" + watch1.ElapsedMilliseconds.ToString("N0") + "ms");

為什么使用這個例子呢,這是一個典型的substring的使用場景,每次操作string都會生成新的string對象,當然不光是Substring,在進行int.Parse時重復操作string對象,如果大量操作就會給GC造成壓力。

使用Span實現這個算法:

string content = "content-length:123";
ReadOnlySpan<char> span = content.ToCharArray();    
span.Slice(15).ParseToInt();
watch.Start();
for (int j = 0; j < 100000; j++)
{
    int icb = span.Slice(15).ParseToInt();
}
watch.Stop();
Console.WriteLine("\tTime Elapsed:\t" + watch.ElapsedMilliseconds.ToString("N0") + "ms");

這里將string轉換為int的算法利用ReadonlySpan實現,這也是Span 的典型使用場景,官方給的場景也是如些,Span 適用於多次復用操作連續內存的場景。

轉換代碼如下:

public static class ReadonlySpanxtension
{
    public static int ParseToInt(this ReadOnlySpan<char> rspan)
    {
        Int16 sign = 1;
        int num = 0;
        UInt16 index = 0;
        if (rspan[0].Equals('-')){
            sign = -1; index = 1;
        }
        for (int idx = index; idx < rspan.Length; idx++){
            char c = rspan[idx];
            num = (c - '0') + num * 10;
        }
        return num * sign;
    }

}

四、最后

上述兩段代碼100000次調用的時間如下:

String Substring Convert:
        Time Elapsed:   18ms
ReadOnlySpan Convert:
        Time Elapsed:   4ms

目前Span 的相關支持還夠,它只是最基礎架構,之后CoreFx會對很多API使用Span 進行重構和實現。可見.Net Core的性能日后會越來越強大。

相關Demo會上傳到QQ群中。

  GitHub:https://github.com/maxzhang1985/YOYOFx 如果覺還可以請Star下, 歡迎一起交流。

  .NET Core 開源學習群:214741894


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM