本文需要對C#里的LINQ、Lambda 表達式 、委托有一定了解。
在工作中,經常遇到需要對比兩個集合的場景,如:
- 頁面集合數據修改,需要保存到數據庫
- 全量同步上游數據到本系統數據庫
在這些場景中,需要識別出需要新增、更新、刪除的數據,由於每次應用是,需要比較的對象類型不一致,因此寫了個相對通用的方法。這個過程中,需要理解的有以下2個核心概念:
- 唯一標識比較: 如果兩個對象的唯一標識相等,則認為這兩個對象在業務上代表同一個東西(次要屬性是否相等暫不考慮)。
- 實體比較:表示兩個對象在業務是不是相等(唯一標識相等、次要屬性相等)。
代碼示例如下:
void Main()
{
// 對比源集合
var source = GenerateStudent(1, 10000, 1000);
// 目標集合
var target = GenerateStudent(5000, 10000, 1000);
// 唯一標識比較
Func<Student, Student, bool> keyCompartor = (s, t) => s.Id == t.Id;
// 實體相等比較
Func<Student, Student, bool> entityCompartor = (s, t) => s.Id == t.Id && s.Name.Equals(t.Name) && s.Age == t.Age;
// 新增前准備
Func<Student, Student> insertAction = (s) =>
{
return new Student
{
Id = s.Id,
Name = s.Name,
Age = s.Age,
Operation = "Insert"
};
};
// 更新前准備
Func<Student, Student, Student> updateAction = (s, t) =>
{
t.Name = s.Name;
t.Age = s.Age;
t.Operation = "Update";
return t;
};
// 刪除前准備
Func<Student, Student> deleteAction = (t) =>
{
t.Operation = "Delete";
return t;
};
// 去掉相等對象
RemoveDuplicate(source, target, entityCompartor, (s1, s2) => s1.Id == s2.Id, keyCompartor);
// 需要新增的集合
var insertingStudents = GetInsertingEntities(source, target, keyCompartor, insertAction);
// 需要更新的集合
var updatingStudents = GetUpdatingEntities(source, target, keyCompartor, entityCompartor, updateAction);
// 需要刪除的集合
var deletingStudents = GetDeletingEntities(source, target, keyCompartor, deleteAction);
// 后續業務
// InsertStudents(insertingStudents);
// UpdateStudents(updatingStudents);
// DeleteStudents(deletingStudents);
}
// 集合去重
private void RemoveDuplicate<S, T>(List<S> source, List<T> target, Func<S, T, bool> entityCompartor,
Func<S, S, bool> sourceKeyCompartor, Func<S, T, bool> keyComportor)
{
var sameEntities = source.Where(s => target.Exists(t => entityCompartor(s, t))).ToList();
source.RemoveAll(s => sameEntities.Exists(s2 => sourceKeyCompartor(s, s2)));
target.RemoveAll(t => sameEntities.Exists(s => keyComportor(s, t)));
}
// 獲取需要新增的對象集合
private List<T> GetInsertingEntities<S, T>(List<S> source, List<T> target, Func<S, T, bool> keyComportor,
Func<S, T> insertAction)
{
var result = new List<T>();
foreach (var s in source)
{
var t = target.FirstOrDefault(x => keyComportor(s, x));
if (t == null)
{
// 目標集合中不存在,則新增
result.Add(insertAction(s));
}
}
return result;
}
// 獲取需要更新的對象集合
private List<T> GetUpdatingEntities<S, T>(List<S> source, List<T> target, Func<S, T, bool> keyComportor,
Func<S, T, bool> entityCompartor, Func<S, T, T> updateAction)
{
var result = new List<T>();
foreach (var s in source)
{
var t = target.FirstOrDefault(x => keyComportor(s, x));
if (t != null && !entityCompartor(s, t))
{
// 目標集合中存在,但是次要屬性不相等,則更新
result.Add(updateAction(s, t));
}
}
return result;
}
// 獲取需要刪除的對象集合
private List<T> GetDeletingEntities<S, T>(List<S> source, List<T> target,
Func<S, T, bool> keyComportor, Func<T, T> deleteAction)
{
var result = new List<T>();
foreach (var t in target)
{
var s = source.FirstOrDefault(x => keyComportor(x, t));
if (s == null)
{
// 源集合中存在,目標集合中需要刪除
result.Add(deleteAction(t));
}
}
return result;
}
// 隨機生成測試集合
private List<Student> GenerateStudent(int minId, int maxId, int maxNumber)
{
var r = new Random();
var students = new List<Student>();
for (int i = 0; i < maxNumber; i++)
{
students.Add(new Student
{
Id = r.Next(minId, maxId),
Name = $"name: {r.Next(1, 10)}",
Age = r.Next(6, 10)
});
}
return students.GroupBy(s => s.Id).Select(s => s.First()).ToList();
}
public class Student
{
public int Id { get; set; }
public string Name { get; set; }
public int Age { get; set; }
public string Operation { get; set; }
}
例子中源集合與目標集合使用了相同的對象Student
,但實際使用中,兩者的類型可以不一樣,只要最終返回目標集合的類型就可以了。
上面是我對集合比較的一點心得,只滿足了小數據量的業務情景,並沒有在大數據量的情況下做過調優。在這里也算是拋磚引玉,大家要是有更好的辦法,還希望不吝賜教。