图片 2

[C#]关于Distinct与重写IEqualityComparer时得知道的二三事

Posted by

前言

我们在想对一个可枚举的对象集合进行去重操作时,一般第一个想到的就是就是Linq的Distinct方法。

List集合操作去除重复数据的这种情况经常会碰到,博客园里面也有很多大神们做过,在这里主要是借鉴然后自己整理了一下,主要是为了方便自己,以后再次碰到这种去重问题,直接打开自己的链接拿起键盘就是干,,,,

先定义一个类,然后使用Distinct方法去重

一、方法一

class Man
        {
            public int Age { get; set; }
            public string Name { get; set; }
            public string Adress { get; set; }
            public decimal Weight { get; set; }
            public decimal Height { get; set; }
        }

List<Man> list = new List<Man>()
            { 
            new Man(){Age=21,Name="Adam",Adress="Shenzhen",Weight=60,Height=170},
            new Man(){Age=21,Name="Adam",Adress="Shenzhen",Weight=60,Height=170}
            };
            var distinct = list.Distinct();

利用HashSet去重,在实体类里重写Equals和GetHashCode方法

然而去重得到的distinct集合的Count依然为二,集合里依然存在两个Adam。

 class Program
    {
        static void Main(string[] args)
        {
            List<UserInfo> list = new List<UserInfo>()
            {
                new UserInfo() {  Id="1", UserName="111"},
                new UserInfo() {  Id="1", UserName="111"}
            };

            // 因为我们通常操作的是List集合,所以我在这里把list转成了HashSet类型来接受
            HashSet<UserInfo> hs = new HashSet<UserInfo>(list); 
            foreach (var item in hs)
            {
                Console.WriteLine($"Id:{item.Id}  UserName:{item.UserName}");
            }

            Console.ReadKey();
        }

        class UserInfo
        {
            public string Id { get; set; }
            public string UserName { get; set; }

            public override bool Equals(object obj)
            {
                UserInfo user = obj as UserInfo;
                return this.Id == user.Id ;
            }
            public override int GetHashCode()
            {
                return this.Id.GetHashCode();
            }
        }
    }

实际上,Distinct方法内进行比较的是声明的引用,而不是对象属性,就和对两个属性一模一样的对象使用Equals()方法得到的是False一样。

二、方法二

因此我们对对象集合使用Distinct方法时要使用重载Distinct<TSource>(this
IEnumerable<TSource> source, IEqualityComparer<TSource>
comparer);

利用拉姆达表达式Distinct方法,我们转到定义可以看到两个重载的Distinct方法,如图

要使用这个方法,我们得重写IEqualityComparer接口,再使用Distinct方法:

图片 1

public class ManComparer : IEqualityComparer<Man>
        {
            public bool Equals(Man x, Man y)
            {
                return x.Age == y.Age
                    && x.Name == y.Name
                    && x.Adress == y.Adress
                    && x.Weight == y.Weight
                    && x.Height == y.Height;
            }

            public int GetHashCode(Man obj)
            {
                return obj.GetHashCode();
            }
        }

 var distinct = list.Distinct(new ManComparer());

我们再转到定义看看IEqualityComparer接口里面到底是个啥玩意,原来有两个方法

然而,再一次,distinct集合内依然有两个对象。

图片 2

实际上,由于直接获取对象的HashCode,用HashCode进行比较的速度比 Equals
方法更快,

这时候我们来实现IEqualityComparer接口里面的方法

因此IEqualityComparer内部会在使用 Equals 前先使用
GetHashCode 方法,在两个对象的HashCode都相同时即刻判断对象相等。

class Program
    {
        static void Main(string[] args)
        {

            UserInfo info = new UserInfo();
            List<UserInfo> list = new List<UserInfo>()
            {
                new UserInfo() {  Id="1", UserName="111"},
                new UserInfo() {  Id="1", UserName="111"}
            };

            list.Distinct(new DistinctCompare()).ToList().ForEach(item =>
            {

                Console.WriteLine($"Id:{item.Id}  UserName:{item.UserName}");
            });

            Console.ReadKey();
        }


        class UserInfo
        {
            public string Id { get; set; }
            public string UserName { get; set; }
        }


        class DistinctCompare : IEqualityComparer<UserInfo>
        {
            public bool Equals(UserInfo x, UserInfo y)
            {
                return x.Id == y.Id;//可以自定义去重规则,此处将Id相同的就作为重复记录
            }
            public int GetHashCode(UserInfo obj)
            {
                return obj.Id.GetHashCode();
            }
        }
    }

而当两个对象HashCode不相同时, Equals
方法就会被调用,对要比较的对象进行判断。

我们再来写一个通用的扩展方法

由于在上例中list中的两个引用实际上是两个不同的对象,因此HashCode必定不相同

相关文章

Leave a Reply

电子邮件地址不会被公开。 必填项已用*标注