C#迭代器

本文轉載自查看原文 2015-02-25 14:31 2118 C# in depth筆記

在.NET中，迭代器模式是通過IEnumerator和IEnumerable接口以及它們的泛型版本來實現的。如果某個類實現了IEnumerable接口，就說明它可以被迭代訪問，調用GetEnumerator()方法將返回IEnumerator的實現，這個就是迭代器本身。

在C# 1.0中，利用foreach語句實現了訪問迭代器的內置支持，讓集合的遍歷變得簡單、明了。其實，foreach的實現就是調用GetEnumerator和MoveNext方法以及Current屬性。所以說，在C# 1.0中要獲得迭代器就必須實現IEnumerable接口中的GetEnumerator方法，要實現一個迭代器就要實現IEnumerator接口中的MoveNext和Reset方法

在C# 2.0中提供的語法糖來簡化迭代器的實現，可以通過yield關鍵字來簡化迭代器的實現。

C# 1.0中的迭代器實現

假設我們要實現一個字符列表類型，並且可以通過foreach來遍歷這個類型。那么，在C# 1.0中，就要實現IEnumerable和IEnumerator接口。

namespace IteratorTest
{
    class Program
    {
        static void Main(string[] args)
        {
            CharList charList = new CharList("Hello World");
            foreach (var c in charList)
            {
                Console.WriteLine(c);
            }

            Console.Read();
        }
    }

    class CharList : IEnumerable
    {
        public string TargetStr { get; set; }

        public CharList(string str)
        {
            this.TargetStr = str;
        }

        public IEnumerator GetEnumerator()
        {
            return new CharIterator(this.TargetStr);
        }
    }

    class CharIterator : IEnumerator
    {
        //引用要遍歷的字符串
        public string TargetStr { get; set; }
        //指出當前遍歷的位置
        public int position { get; set; }

        public CharIterator(string targetStr)
        {
            this.TargetStr = targetStr;
            this.position = this.TargetStr.Length;
        }

        public object Current
        {
            get
            {
                if (this.position == -1 || this.position == this.TargetStr.Length)
                {
                    throw new InvalidOperationException();
                }
                return this.TargetStr[this.position];
            }
        }

        public bool MoveNext()
        {
            //如果滿足繼續遍歷的條件，設置position的值
            if (this.position != -1)
            {
                this.position--;
            }
            return this.position > -1;
        }

        public void Reset()
        {
            this.position = this.TargetStr.Length;
        }
    }
}

在上面的例子中，CharIterator就是迭代器的實現，position字段存儲當前的迭代位置，通過Current屬性可以得到當前迭代位置的元素，MoveNext方法用於更新迭代位置，並且查看下一個迭代位置是不是有效的。

當我們通過VS單步調試下面語句的時候

foreach (var c in charList)

代碼首先執行到foreach語句的charList處獲得迭代器CharIterator的實例，然后代碼執行到in會調用迭代器的MoveNext方法，最后變量c會得到迭代器Current屬性的值；前面的步驟結束后，會開始一輪新的循環，調用MoveNext方法，獲取Current屬性的值。

C# 2.0通過yield簡化迭代器實現

通過C# 1.0中迭代器的代碼看到，要實現一個迭代器就要實現IEnumerator接口，然后實現IEnumerator接口中的MoveNext、Reset方法和Current屬性。

在C# 2.0中可以直接使用yield語句來簡化迭代器的實現。

class CharList : IEnumerable
{
    public string TargetStr { get; set; }

    public CharList(string str)
    {
        this.TargetStr = str;
    }

    public IEnumerator GetEnumerator()
    {
        for (int index = this.TargetStr.Length; index > 0; index--)
        {
            yield return this.TargetStr[index-1];
        }
    }
}

通過上面的代碼可以看到，通過使用yield return語句，我們可以替換掉整個CharIterator類。

yield return語句就是告訴編譯器，要實現一個迭代器塊。如果GetEnumerator方法的返回類型是非泛型接口，那么迭代器塊的生成類型（yield type）是object，否則就是泛型接口的類型參數。

通過IL代碼可以看到，對於yield return語句語句，編譯器為我們生成了一個嵌套的類型(nested type) <GetEnumerator>d__0，並且這個類實現了IEnumerator接口。

當編譯器遇到迭代塊時，它創建了一個實現了狀態機的內部類。這個類記住了我們迭代器的准確當前位置以及本地變量，包括參數。這個類有點類似與C# 1.0中手寫的那段代碼，它將所有需要記錄的狀態保存為實例變量。為了實現一個迭代器，這個狀態機需要按順序執行的操作：

它必須具有某個初始狀態
當MoveNext被調用時，他需要執行GetEnumerator方法中的代碼來准備下一個待返回的數據
當調用Current屬性是，它必須返回上一個生成的數據
需要知道什么時候迭代結束，MoveNext會返回false

注意，當我們想要避免迭代器中的裝箱和拆箱是，就要實現迭代器的泛型版本，由於泛型IEnumerable <T>接口繼承了泛型型IEnumerable接口，我們需要在泛型迭代器代碼中加入

System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
{
　　return GetEnumerator();
}

這樣，非泛型方法轉而調用泛型方法，從而不需要再去實現非泛型的IEnumerable接口了。

迭代器的工作流程

前面簡單提到了迭代器的工作流程，下面我們通過一個例子進一步看看迭代器工作流程。

class Program
{
    static readonly String Padding = new String(' ', 30);
    static IEnumerable<Int32> CreateEnumerable()
    {
        Console.WriteLine("{0}Start of CreateEnumerable", Padding);
        for (int i = 0; i < 3; i++)
        {
            Console.WriteLine("{0}About to yield {1}", Padding, i);
            yield return i;
            Console.WriteLine("{0}After yield", Padding);
        }
        Console.WriteLine("{0}Yielding final value", Padding);
        yield return -1;
        Console.WriteLine("{0}End of CreateEnumerable()", Padding);
    }

    static void Main(string[] args)
    {
        IEnumerable<Int32> iterable = CreateEnumerable();
        IEnumerator<Int32> iterator = iterable.GetEnumerator();
        Console.WriteLine("Starting to iterate");
        while (true)
        {
            Console.WriteLine("Calling MoveNext()...");
            Boolean result = iterator.MoveNext();
            Console.WriteLine("...MoveNext result={0}", result);
            if (!result)
            {
                break;
            }
            Console.WriteLine("Fetching Current...");
            Console.WriteLine("...Current result={0}", iterator.Current);
        }
        Console.Read();
    }
}

一般迭代器都會結合foreach語句，然后foreach會在最后調用Dispose方法。這里為了演示，代碼中使用while語句實現循環。

稍微打斷一下，插入一個內容的介紹，通常為了實現IEnumerable，我們只會返回IEnumerator；如果僅僅是在方法中生成一個序列，可以返回IEnumerable。所以將代碼改為下面的方式也可以工作：

static IEnumerator<Int32> CreateEnumerable()
{
    ……
}

……
//IEnumerable<Int32> iterable = CreateEnumerable();
IEnumerator<Int32> iterator = CreateEnumerable();

兩種方式的IL代碼是不同的，這里只列出了編譯器內嵌類型實現了那些接口，更詳細的內容可以通過ILSpy查看：

返回IEnumerable

.class nested private auto ansi sealed beforefieldinit '<CreateEnumerable>d__0'
    extends [mscorlib]System.Object
    implements class [mscorlib]System.Collections.Generic.IEnumerable`1<int32>,
               [mscorlib]System.Collections.IEnumerable,
               class [mscorlib]System.Collections.Generic.IEnumerator`1<int32>,
               [mscorlib]System.Collections.IEnumerator,
               [mscorlib]System.IDisposable
{……}

返回IEnumerator

.class nested private auto ansi sealed beforefieldinit '<CreateEnumerable>d__0'
    extends [mscorlib]System.Object
    implements class [mscorlib]System.Collections.Generic.IEnumerator`1<int32>,
               [mscorlib]System.Collections.IEnumerator,
               [mscorlib]System.IDisposable
{……}

回到這個例子，程序的輸出結果為：

在這段代碼中有幾個注意點：

直到第一次調用MoveNext，CreateEnumerable中的方法才被調用
在調用MoveNext的時候，已經做好了所有操作，獲取Current屬性並沒有執行任何代碼
代碼在yield return之后就停止執行，在下一次調用MoveNext方法的時候繼續執行
同一個方法的不同地方可以有多個yield return語句
代碼不會在最后的yield return處結束，而是通過返回false的MoveNext調用來結束方法的執行

第一點尤為重要：這意味着如果在方法調用時需要立即執行，就不能使用迭代器塊。例如如果將參數驗證放在迭代塊中，那么他將不能夠很好的起作用，這是經常會導致的錯誤的地方，而且這種錯誤不容易發現。

進一步了解迭代器工作流程

在常規方法中，return語句通常有兩種作用：一是返回調用者執行的結果。二是終止方法的執行，在終止之前執行finally語句中的方法。在上面的例子中，我們看到了yield return語句只是短暫的退出了方法，在調用MoveNext的時候繼續執行。根本沒有檢查finally代碼塊的行為。

如何真正的退出方法？退出方法時finnally語句塊如何執行？下面來看看一個比較簡單的結構：yield break語句塊。

使用yield return結束迭代器執行

通常方法只有一個退出點，不過有時候我們想"提早退出。對於迭代器塊，使用yield break就能達到想要的效果。它能夠馬上終止迭代，使得下一次調用MoveNext的時候返回false。

下面的代碼演示了從1迭代到100，但是時間超時的時候就停止了迭代：

class Program
{
    static IEnumerable<Int32> CountWithTimeLimit(DateTime limit)
    {
        for (int i = 1; i <= 100; i++)
        {
            if (DateTime.Now >= limit)
            {
                yield break;
            }
            yield return i;
        }         
    }

    static void Main(string[] args)
    {
        DateTime stop = DateTime.Now.AddSeconds(2);
        foreach (Int32 i in CountWithTimeLimit(stop))
        {
            Console.WriteLine("Received {0}", i);
            Thread.Sleep(300);
        }
        Console.WriteLine("End of Main");
        Console.Read();
    }
}

從程序的輸出可以看到，yield break語句的行為類似於普通方法的return，迭代器的迭代被停止，並提前退出。

下面就看看finally語句塊是如何執行以及何時執行的。

finally代碼塊的執行

通常，finally語句塊在當方法執行退出特定區域時就會執行。迭代塊中的finally語句和普通方法中的finally語句塊不一樣。就像我們看到的，yield return語句停止了方法的執行，而不是退出方法，根據這一邏輯，在這種情況下，finally語句塊中的語句不會執行。

但當碰到yield break語句的時候，就會執行finally 語句塊。一般在迭代塊中使用finally語句來釋放資源，就像使用using語句一樣。

下面修改前面的例子來看finally語句如何執行。不管是迭代到了100次或者是由於時間到了停止了迭代，或者是拋出了異常，finally語句總會執行。

static IEnumerable<Int32> CountWithTimeLimit(DateTime limit)
{
    try
    {
        for (int i = 1; i <= 100; i++)
        {
            if (DateTime.Now >= limit)
            {
                yield break;
            }
            yield return i;
        }
    }
    finally
    {
        Console.WriteLine("Stopping");
    }
}

只有在調用MoveNext后迭代塊中的語句才會執行，那么如果不掉用MoveNext呢，如果調用幾次MoveNext然后停止調用，結果會怎么樣呢？看下面一段代碼

DateTime stop = DateTime.Now.AddSeconds(2);
foreach (Int32 i in CountWithTimeLimit(stop))
{
    if (i > 3)
    {
        Console.WriteLine("Returning");
        return;
    }
    Thread.Sleep(300);
}

在上面代碼中，我們不是提前停止執行迭代器塊，而是提前停止使用迭代器。在foreach循環中的return語句執行后，迭代器的finally代碼也被執行了。

之所以這里的finally被執行了，是因為foreach會在自己的finall代碼塊中調用IEnumerator 所提供的Dispose方法。當迭代器完成迭代之前，如果調用由迭代器代碼塊創建的迭代器上的Dispose方法，那么狀態機就會執行在代碼當前"暫停"位置范圍內的任何finally代碼塊。這有點復雜，但是結果很容易解釋：只要使用foreach循環，迭代塊中的finally塊會如期望的那樣執行。

上面的描述可以通過下面的代碼進行驗證：

static void Main(string[] args)
{
    DateTime stop = DateTime.Now.AddSeconds(2);
    IEnumerable<Int32> iterable = CountWithTimeLimit(stop);
    IEnumerator<Int32> iterator = iterable.GetEnumerator();

    iterator.MoveNext();
    Console.WriteLine("Reveived {0}", iterator.Current);

    iterator.MoveNext();
    Console.WriteLine("Reveived {0}", iterator.Current);

    //顯示調用Dispose來執行迭代器的finally代碼塊
    //iterator.Dispose();

    Console.WriteLine("End of Main");
    Console.Read();
}

總結

本文中看到了C# 1.0中如何實現一個迭代器，以及通過C# 2.0中提供的yield return如何簡化一個迭代器的實現。通過對迭代器工作流程的介紹，看到了yield return的延遲執行，yield return語句只表示"暫時的"退出方法。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C#枚舉器和迭代器詳解C# 迭代器 C# 迭代器 Iterator C#知識點-枚舉器和迭代器 C# 8 中的異步迭代器 IAsyncEnumerable 解析 C# 迭代器與yield關鍵字 C# Iterator迭代器的實現方式【轉】【C#】迭代器IEnumerable和IEnumerator c++之迭代器 C++STL容器和迭代器