使用Distinct()內置方法對List集合的去重 問題


 

說到對集合去重處理,第一時間想到的肯定是Linq的Distinct擴展方式,對於一般的值類型集合去重,很好處理,直接list.Distinct()即可。但是如果想要對一個引用類型的集合去重(屬性值都相同就認為重復),就會發現,直接Distinct()是不行的

 

先來看看泛型鏈表 List<T> 的定義:

public class List<T> : IList<T>, ICollection<T>, IList, ICollection, IReadOnlyList<T>, IReadOnlyCollection<T>, IEnumerable<T>, IEnumerable

可見它實現了 IEnumerable<T>,而IEnumerable<T>規定了Distinct方法。

 

使用這個方法時要注意:

(1)該方法並不會改變原來的鏈表;

(2)該方法返回一個對象(假設叫做dis),通過該對象可以枚舉原鏈表中的非重復元素,但是並沒有把非重復元素復制一份到新的對象中(連簽拷貝也沒有)

(3)由於(2),在枚舉dis時,始終是依賴於原有鏈表,所以如果在獲得dis后,又更新了原有鏈表,那么使用dis枚舉將會使用原有鏈表的最新狀態。

 

var list=new List<SampleVersionDto>()///表明具有重復值得集合

有時候Distinct()不能對引用類型去重時 我們就要自定義了 自定義代碼如下:

public class User
{
    public int Id { get; set; }
    public string Name { get; set; }
}
var list = new List<User>() { new User() { Id = 1, Name = "張三" } , new User() { Id = 1, Name = "張三" } , new User() { Id = 3, Name = "李四" } , }; var newList1 = list.Distinct().ToList();
 

運行上述代碼會發現,並不是預期想要的結果,newList1還是有3個元素。之所以會產生這樣的結果,是因為Distinct()是通過使用默認的相等比較器對值進行比較返回序列中的非重復元素。對於值類型,默認的相等比較器是比較值是否相等,對於引用類型,默認的相等比較器是比較對象的引用地址,所以上述例子中即使屬性值都相同,也不能去重。

IEqualityComparer<TSource>

聰明的我們,很容易就能發現,Linq已經為我們重載了一個去重方法,可以滿足我們的需求:

public static IEnumerable<TSource> Distinct<TSource>(this IEnumerable<TSource> source, IEqualityComparer<TSource> comparer);

重載的這個方法,多提供了一個參數IEqualityComparer<TSource> comparer,是一個泛型接口,我們只需要對這個接口進行實現,即可滿足我們的去重需求:

public class UserComparer : IEqualityComparer<User>
{
    public bool Equals(User x, User y)
    {
        return x.Id == y.Id && x.Name == y.Name;
    }

    public int GetHashCode(User obj)
    {
        return obj.ToString().GetHashCode();
    }
}

IEqualityComparer<TSource> 定義了兩個方法,一個是Equals,一個是GetHashCode。這里我查找參考資料發現,進行比較時,默認先通過GetHashCode對兩個元素進行比較,如果HashCode不同,則認為兩個元素不同,如果相同則再通過Equals方法比較。所以這里我不能直接將User對象GetHashCode處理,而是先轉換成了字符串再GetHashCode。通過這個重載方法,我們就可以到達目的了:

ar newList2 = list.Distinct(new UserComparer()).ToList();

甚至我們還可以實現只要某個屬性相同就認為重復的效果,只需要在Equals方法按想要比較方式進行處理即可

延伸思考

Distinct的重載方法,基本已經能夠滿足我們的各式各樣的去重需求了,但是想來想去,還是覺得有點別扭,那就是如果有類似的去重需求,我們都要新增一個類去實現IEqualityComparer<TSource>接口,不夠靈活,本着封裝重用的原則,想了想能否在這方面進行優化。恰巧最近在搞一個Android項目,學習了一下java,了解到java有一個匿名實現接口的語法特性,如果C#也能匿名實現接口,那就不需要增加那么多類去實現接口,會方便很多。很遺憾C#中沒有這個特性,看了下資料我感覺java其實也不算是真正意義上的匿名實現,它是編譯器做了手腳,編譯的時候生成了一個真實的類去實現接口。在一番查找資料后,終於找到了一個很好的解決方案:

public class LambdaComparer<T> : IEqualityComparer<T>
{
    private readonly Func<T, T, bool> _lambdaComparer;
    private readonly Func<T, int> _lambdaHash;
    public LambdaComparer(Func<T, T, bool> lambdaComparer)
        : this(lambdaComparer, EqualityComparer<T>.Default.GetHashCode)
    {
    }
    public LambdaComparer(Func<T, T, bool> lambdaComparer, Func<T, int> lambdaHash)
    {
        if (lambdaComparer == null)
            throw new ArgumentNullException("lambdaComparer");
        if (lambdaHash == null)
            throw new ArgumentNullException("lambdaHash");
            _lambdaComparer = lambdaComparer;
            _lambdaHash = lambdaHash;
    }

    public bool Equals(T x, T y)
    {
        return _lambdaComparer(x, y);
    }

    public int GetHashCode(T obj)
    {
        return _lambdaHash(obj);
    }
}

很巧妙的采用了泛型委托的方式,實現只需要定義一個類實現IEqualityComparer<TSource>接口,Equals、GetHashCode的實現,由傳入的委托方法決定,接下來就簡單了

var newList3 = list.Distinct(new LambdaComparer<User>((a, b) => a.Id == b.Id && a.Name == b.Name, obj => obj.ToString().GetHashCode())).ToList();

是不是很熟悉的寫法,想怎么比較就怎么比較,方便快捷,不需要定義那么多類去實現接口,目的達到。Linq中有很多擴展方法,都會用到IEqualityComparer<TSource>接口。通過這種方式,可以大大提高重用率

 

參考資料

1、https://www.cnblogs.com/mirageJ/p/8950842.html

2、https://ask.helplib.com/c-Sharp/post_1277383


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM