C#迭代器


在.NET中,迭代器模式是通過IEnumerator和IEnumerable接口以及它們的泛型版本來實現的。如果某個類實現了IEnumerable接口,就說明它可以被迭代訪問,調用GetEnumerator()方法將返回IEnumerator的實現,這個就是迭代器本身。

在C# 1.0中,利用foreach語句實現了訪問迭代器的內置支持,讓集合的遍歷變得簡單、明了。其實,foreach的實現就是調用GetEnumerator和MoveNext方法以及Current屬性。所以說,在C# 1.0中要獲得迭代器就必須實現IEnumerable接口中的GetEnumerator方法,要實現一個迭代器就要實現IEnumerator接口中的MoveNext和Reset方法

在C# 2.0中提供的語法糖來簡化迭代器的實現,可以通過yield關鍵字來簡化迭代器的實現。

C# 1.0中的迭代器實現

假設我們要實現一個字符列表類型,並且可以通過foreach來遍歷這個類型。那么,在C# 1.0中,就要實現IEnumerable和IEnumerator接口。

namespace IteratorTest
{
    class Program
    {
        static void Main(string[] args)
        {
            CharList charList = new CharList("Hello World");
            foreach (var c in charList)
            {
                Console.WriteLine(c);
            }

            Console.Read();
        }
    }

    class CharList : IEnumerable
    {
        public string TargetStr { get; set; }

        public CharList(string str)
        {
            this.TargetStr = str;
        }

        public IEnumerator GetEnumerator()
        {
            return new CharIterator(this.TargetStr);
        }
    }

    class CharIterator : IEnumerator
    {
        //引用要遍歷的字符串
        public string TargetStr { get; set; }
        //指出當前遍歷的位置
        public int position { get; set; }

        public CharIterator(string targetStr)
        {
            this.TargetStr = targetStr;
            this.position = this.TargetStr.Length;
        }

        public object Current
        {
            get
            {
                if (this.position == -1 || this.position == this.TargetStr.Length)
                {
                    throw new InvalidOperationException();
                }
                return this.TargetStr[this.position];
            }
        }

        public bool MoveNext()
        {
            //如果滿足繼續遍歷的條件,設置position的值
            if (this.position != -1)
            {
                this.position--;
            }
            return this.position > -1;
        }

        public void Reset()
        {
            this.position = this.TargetStr.Length;
        }
    }
}

在上面的例子中,CharIterator就是迭代器的實現,position字段存儲當前的迭代位置,通過Current屬性可以得到當前迭代位置的元素,MoveNext方法用於更新迭代位置,並且查看下一個迭代位置是不是有效的。

當我們通過VS單步調試下面語句的時候

foreach (var c in charList)

代碼首先執行到foreach語句的charList處獲得迭代器CharIterator的實例,然后代碼執行到in會調用迭代器的MoveNext方法,最后變量c會得到迭代器Current屬性的值;前面的步驟結束后,會開始一輪新的循環,調用MoveNext方法,獲取Current屬性的值。

C# 2.0通過yield簡化迭代器實現

通過C# 1.0中迭代器的代碼看到,要實現一個迭代器就要實現IEnumerator接口,然后實現IEnumerator接口中的MoveNext、Reset方法和Current屬性。

在C# 2.0中可以直接使用yield語句來簡化迭代器的實現。

class CharList : IEnumerable
{
    public string TargetStr { get; set; }

    public CharList(string str)
    {
        this.TargetStr = str;
    }

    public IEnumerator GetEnumerator()
    {
        for (int index = this.TargetStr.Length; index > 0; index--)
        {
            yield return this.TargetStr[index-1];
        }
    }
}

通過上面的代碼可以看到,通過使用yield return語句,我們可以替換掉整個CharIterator類。

yield return語句就是告訴編譯器,要實現一個迭代器塊。如果GetEnumerator方法的返回類型是非泛型接口,那么迭代器塊的生成類型(yield type)是object,否則就是泛型接口的類型參數。

通過IL代碼可以看到,對於yield return語句語句,編譯器為我們生成了一個嵌套的類型(nested type) <GetEnumerator>d__0,並且這個類實現了IEnumerator接口。

當編譯器遇到迭代塊時,它創建了一個實現了狀態機的內部類。這個類記住了我們迭代器的准確當前位置以及本地變量,包括參數。這個類有點類似與C# 1.0中手寫的那段代碼,它將所有需要記錄的狀態保存為實例變量。為了實現一個迭代器,這個狀態機需要按順序執行的操作:

  • 它必須具有某個初始狀態
  • 當MoveNext被調用時,他需要執行GetEnumerator方法中的代碼來准備下一個待返回的數據
  • 當調用Current屬性是,它必須返回上一個生成的數據
  • 需要知道什么時候迭代結束,MoveNext會返回false

注意,當我們想要避免迭代器中的裝箱和拆箱是,就要實現迭代器的泛型版本,由於泛型IEnumerable <T>接口繼承了泛型型IEnumerable接口,我們需要在泛型迭代器代碼中加入

System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
{
  return GetEnumerator();
}

這樣,非泛型方法轉而調用泛型方法,從而不需要再去實現非泛型的IEnumerable接口了。

迭代器的工作流程

前面簡單提到了迭代器的工作流程,下面我們通過一個例子進一步看看迭代器工作流程。

class Program
{
    static readonly String Padding = new String(' ', 30);
    static IEnumerable<Int32> CreateEnumerable()
    {
        Console.WriteLine("{0}Start of CreateEnumerable", Padding);
        for (int i = 0; i < 3; i++)
        {
            Console.WriteLine("{0}About to yield {1}", Padding, i);
            yield return i;
            Console.WriteLine("{0}After yield", Padding);
        }
        Console.WriteLine("{0}Yielding final value", Padding);
        yield return -1;
        Console.WriteLine("{0}End of CreateEnumerable()", Padding);
    }

    static void Main(string[] args)
    {
        IEnumerable<Int32> iterable = CreateEnumerable();
        IEnumerator<Int32> iterator = iterable.GetEnumerator();
        Console.WriteLine("Starting to iterate");
        while (true)
        {
            Console.WriteLine("Calling MoveNext()...");
            Boolean result = iterator.MoveNext();
            Console.WriteLine("...MoveNext result={0}", result);
            if (!result)
            {
                break;
            }
            Console.WriteLine("Fetching Current...");
            Console.WriteLine("...Current result={0}", iterator.Current);
        }
        Console.Read();
    }
}

一般迭代器都會結合foreach語句,然后foreach會在最后調用Dispose方法。這里為了演示,代碼中使用while語句實現循環。

稍微打斷一下,插入一個內容的介紹,通常為了實現IEnumerable,我們只會返回IEnumerator;如果僅僅是在方法中生成一個序列,可以返回IEnumerable。所以將代碼改為下面的方式也可以工作:

static IEnumerator<Int32> CreateEnumerable()
{
    ……
}

……
//IEnumerable<Int32> iterable = CreateEnumerable();
IEnumerator<Int32> iterator = CreateEnumerable();

兩種方式的IL代碼是不同的,這里只列出了編譯器內嵌類型實現了那些接口,更詳細的內容可以通過ILSpy查看:

返回IEnumerable

.class nested private auto ansi sealed beforefieldinit '<CreateEnumerable>d__0'
    extends [mscorlib]System.Object
    implements class [mscorlib]System.Collections.Generic.IEnumerable`1<int32>,
               [mscorlib]System.Collections.IEnumerable,
               class [mscorlib]System.Collections.Generic.IEnumerator`1<int32>,
               [mscorlib]System.Collections.IEnumerator,
               [mscorlib]System.IDisposable
{……}

返回IEnumerator

.class nested private auto ansi sealed beforefieldinit '<CreateEnumerable>d__0'
    extends [mscorlib]System.Object
    implements class [mscorlib]System.Collections.Generic.IEnumerator`1<int32>,
               [mscorlib]System.Collections.IEnumerator,
               [mscorlib]System.IDisposable
{……}

回到這個例子,程序的輸出結果為:

在這段代碼中有幾個注意點:

  • 直到第一次調用MoveNext,CreateEnumerable中的方法才被調用
  • 在調用MoveNext的時候,已經做好了所有操作,獲取Current屬性並沒有執行任何代碼
  • 代碼在yield return之后就停止執行,在下一次調用MoveNext方法的時候繼續執行
  • 同一個方法的不同地方可以有多個yield return語句
  • 代碼不會在最后的yield return處結束,而是通過返回false的MoveNext調用來結束方法的執行

第一點尤為重要:這意味着如果在方法調用時需要立即執行,就不能使用迭代器塊。例如如果將參數驗證放在迭代塊中,那么他將不能夠很好的起作用,這是經常會導致的錯誤的地方,而且這種錯誤不容易發現。

進一步了解迭代器工作流程

在常規方法中,return語句通常有兩種作用:一是返回調用者執行的結果。二是終止方法的執行,在終止之前執行finally語句中的方法。在上面的例子中,我們看到了yield return語句只是短暫的退出了方法,在調用MoveNext的時候繼續執行。根本沒有檢查finally代碼塊的行為。

如何真正的退出方法?退出方法時finnally語句塊如何執行?下面來看看一個比較簡單的結構:yield break語句塊。

使用yield return結束迭代器執行

通常方法只有一個退出點,不過有時候我們想"提早退出。對於迭代器塊,使用yield break就能達到想要的效果。它能夠馬上終止迭代,使得下一次調用MoveNext的時候返回false。

下面的代碼演示了從1迭代到100,但是時間超時的時候就停止了迭代:

class Program
{
    static IEnumerable<Int32> CountWithTimeLimit(DateTime limit)
    {
        for (int i = 1; i <= 100; i++)
        {
            if (DateTime.Now >= limit)
            {
                yield break;
            }
            yield return i;
        }         
    }

    static void Main(string[] args)
    {
        DateTime stop = DateTime.Now.AddSeconds(2);
        foreach (Int32 i in CountWithTimeLimit(stop))
        {
            Console.WriteLine("Received {0}", i);
            Thread.Sleep(300);
        }
        Console.WriteLine("End of Main");
        Console.Read();
    }
}

從程序的輸出可以看到,yield break語句的行為類似於普通方法的return,迭代器的迭代被停止,並提前退出。

下面就看看finally語句塊是如何執行以及何時執行的。

finally代碼塊的執行

通常,finally語句塊在當方法執行退出特定區域時就會執行。迭代塊中的finally語句和普通方法中的finally語句塊不一樣。就像我們看到的,yield return語句停止了方法的執行,而不是退出方法,根據這一邏輯,在這種情況下,finally語句塊中的語句不會執行。

但當碰到yield break語句的時候,就會執行finally 語句塊。一般在迭代塊中使用finally語句來釋放資源,就像使用using語句一樣。

下面修改前面的例子來看finally語句如何執行。不管是迭代到了100次或者是由於時間到了停止了迭代,或者是拋出了異常,finally語句總會執行。

static IEnumerable<Int32> CountWithTimeLimit(DateTime limit)
{
    try
    {
        for (int i = 1; i <= 100; i++)
        {
            if (DateTime.Now >= limit)
            {
                yield break;
            }
            yield return i;
        }
    }
    finally
    {
        Console.WriteLine("Stopping");
    }
}

只有在調用MoveNext后迭代塊中的語句才會執行,那么如果不掉用MoveNext呢,如果調用幾次MoveNext然后停止調用,結果會怎么樣呢?看下面一段代碼

DateTime stop = DateTime.Now.AddSeconds(2);
foreach (Int32 i in CountWithTimeLimit(stop))
{
    if (i > 3)
    {
        Console.WriteLine("Returning");
        return;
    }
    Thread.Sleep(300);
}

在上面代碼中,我們不是提前停止執行迭代器塊,而是提前停止使用迭代器。在foreach循環中的return語句執行后,迭代器的finally代碼也被執行了。

之所以這里的finally被執行了,是因為foreach會在自己的finall代碼塊中調用IEnumerator 所提供的Dispose方法。當迭代器完成迭代之前,如果調用由迭代器代碼塊創建的迭代器上的Dispose方法,那么狀態機就會執行在代碼當前"暫停"位置范圍內的任何finally代碼塊。這有點復雜,但是結果很容易解釋:只要使用foreach循環,迭代塊中的finally塊會如期望的那樣執行。

上面的描述可以通過下面的代碼進行驗證:

static void Main(string[] args)
{
    DateTime stop = DateTime.Now.AddSeconds(2);
    IEnumerable<Int32> iterable = CountWithTimeLimit(stop);
    IEnumerator<Int32> iterator = iterable.GetEnumerator();

    iterator.MoveNext();
    Console.WriteLine("Reveived {0}", iterator.Current);

    iterator.MoveNext();
    Console.WriteLine("Reveived {0}", iterator.Current);

    //顯示調用Dispose來執行迭代器的finally代碼塊
    //iterator.Dispose();

    Console.WriteLine("End of Main");
    Console.Read();
}

總結

本文中看到了C# 1.0中如何實現一個迭代器,以及通過C# 2.0中提供的yield return如何簡化一個迭代器的實現。通過對迭代器工作流程的介紹,看到了yield return的延遲執行,yield return語句只表示"暫時的"退出方法。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM