c# - リストから重複を削除するC＃で

Question

誰もがC＃でジェネリックリストを重複排除するための簡単な方法を持っていますか？

score 922 · Accepted Answer

.Net 3以降を使用している場合は、Linqを使用できます。

List<T> withDupes = LoadSomeData();
List<T> noDupes = withDupes.Distinct().ToList();

score 237 · Accepted Answer

おそらく、HashSetの使用を検討する必要があります。

MSDNリンクから：

using System;
using System.Collections.Generic;

class Program
{
    static void Main()
    {
        HashSet<int> evenNumbers = new HashSet<int>();
        HashSet<int> oddNumbers = new HashSet<int>();

        for (int i = 0; i < 5; i++)
        {
            // Populate numbers with just even numbers.
            evenNumbers.Add(i * 2);

            // Populate oddNumbers with just odd numbers.
            oddNumbers.Add((i * 2) + 1);
        }

        Console.Write("evenNumbers contains {0} elements: ", evenNumbers.Count);
        DisplaySet(evenNumbers);

        Console.Write("oddNumbers contains {0} elements: ", oddNumbers.Count);
        DisplaySet(oddNumbers);

        // Create a new HashSet populated with even numbers.
        HashSet<int> numbers = new HashSet<int>(evenNumbers);
        Console.WriteLine("numbers UnionWith oddNumbers...");
        numbers.UnionWith(oddNumbers);

        Console.Write("numbers contains {0} elements: ", numbers.Count);
        DisplaySet(numbers);
    }

    private static void DisplaySet(HashSet<int> set)
    {
        Console.Write("{");
        foreach (int i in set)
        {
            Console.Write(" {0}", i);
        }
        Console.WriteLine(" }");
    }
}

/* This example produces output similar to the following:
 * evenNumbers contains 5 elements: { 0 2 4 6 8 }
 * oddNumbers contains 5 elements: { 1 3 5 7 9 }
 * numbers UnionWith oddNumbers...
 * numbers contains 10 elements: { 0 2 4 6 8 1 3 5 7 9 }
 */

score 225 · Accepted Answer

225

どうですか：

var noDupes = list.Distinct().ToList();

.net 3.5では？

于 2008-09-06T19:56:06.237 に答える

score 92 · Accepted Answer

同じタイプのリストでHashSetを初期化するだけです。

var noDupes = new HashSet<T>(withDupes);

または、リストを返したい場合：

var noDupsList = new HashSet<T>(withDupes).ToList();

score 49 · Accepted Answer

並べ替えてから、2つと2つを並べて確認します。これは、重複がまとまってしまうためです。

このようなもの：

list.Sort();
Int32 index = list.Count - 1;
while (index > 0)
{
    if (list[index] == list[index - 1])
    {
        if (index < list.Count - 1)
            (list[index], list[list.Count - 1]) = (list[list.Count - 1], list[index]);
        list.RemoveAt(list.Count - 1);
        index--;
    }
    else
        index--;
}

ノート：

削除するたびにリストを再利用する必要がないように、比較は後ろから前に行われます。
この例では、C＃値タプルを使用してスワッピングを実行します。使用できない場合は、適切なコードに置き換えてください。
最終結果はソートされなくなりました

score 40 · Accepted Answer

私はこのコマンドを使用するのが好きです：

List<Store> myStoreList = Service.GetStoreListbyProvince(provinceId)
                                                 .GroupBy(s => s.City)
                                                 .Select(grp => grp.FirstOrDefault())
                                                 .OrderBy(s => s.City)
                                                 .ToList();

リストに次のフィールドがあります: Id、StoreName、City、PostalCode 値が重複しているドロップダウンに都市のリストを表示したかったのです。解決策: 都市ごとにグループ化し、リストの最初の都市を選択します。

score 31 · Accepted Answer

それは私のために働いた。単に使用する

List<Type> liIDs = liIDs.Distinct().ToList<Type>();

「Type」を目的のタイプ、たとえば int に置き換えます。

score 23 · Accepted Answer

kronoz が .Net 3.5 で言ったように、使用できますDistinct()。

.Net 2 では、次のように模倣できます。

public IEnumerable<T> DedupCollection<T> (IEnumerable<T> input) 
{
    var passedValues = new HashSet<T>();

    // Relatively simple dupe check alg used as example
    foreach(T item in input)
        if(passedValues.Add(item)) // True if item is new
            yield return item;
}

これは、任意のコレクションの重複排除に使用でき、元の順序で値を返します。

Distinct()通常、コレクションからアイテムを削除するよりも、コレクションをフィルター処理する方がはるかに高速です (両方とこのサンプルが行うように)。

score 13 · Accepted Answer

拡張メソッドは適切な方法かもしれません...次のようなものです：

public static List<T> Deduplicate<T>(this List<T> listToDeduplicate)
{
    return listToDeduplicate.Distinct().ToList();
}

そして、たとえば次のように呼び出します。

List<int> myFilteredList = unfilteredList.Deduplicate();

score 12 · Accepted Answer

Javaの場合（C＃は多かれ少なかれ同一であると思います）：

list = new ArrayList<T>(new HashSet<T>(list))

元のリストを本当に変更したい場合：

List<T> noDupes = new ArrayList<T>(new HashSet<T>(list));
list.clear();
list.addAll(noDupes);

順序を維持するには、HashSetをLinkedHashSetに置き換えるだけです。

score 7 · Accepted Answer

ヘルパーメソッドとして (Linq なし):

public static List<T> Distinct<T>(this List<T> list)
{
    return (new HashSet<T>(list)).ToList();
}

score 6 · Accepted Answer

隣接する重複をその場で削除するための拡張方法を次に示します。最初にSort（）を呼び出し、同じIComparerを渡します。これは、RemoveAtを繰り返し呼び出すLasse V. Karlsenのバージョンよりも効率的です（複数のブロックメモリ移動が発生します）。

public static void RemoveAdjacentDuplicates<T>(this List<T> List, IComparer<T> Comparer)
{
    int NumUnique = 0;
    for (int i = 0; i < List.Count; i++)
        if ((i == 0) || (Comparer.Compare(List[NumUnique - 1], List[i]) != 0))
            List[NumUnique++] = List[i];
    List.RemoveRange(NumUnique, List.Count - NumUnique);
}

score 6 · Accepted Answer

順序を気にしない場合は、アイテムをに押し込むことができます。順序を維持したい場合は、次のようにすることができますHashSet。

var unique = new List<T>();
var hs = new HashSet<T>();
foreach (T t in list)
    if (hs.Add(t))
        unique.Add(t);

またはLinqの方法：

var hs = new HashSet<T>();
list.All( x =>  hs.Add(x) );

編集：HashSet方法は並べ替え中のO(N)時間とO(N)空間であり、次に（@ lassevkなどによって提案されているように）一意にするのはO(N*lgN)時間とO(1)空間であるため、並べ替え方法が劣っていることは私には（一見したように）あまり明確ではありません（私の一時的な反対票をお詫びします...）

score 6 · Accepted Answer

2つのクラスがProductありCustomer、それらのリストから重複するアイテムを削除したい場合

public class Product
{
    public int Id { get; set; }
    public string ProductName { get; set; }
}

public class Customer
{
    public int Id { get; set; }
    public string CustomerName { get; set; }

}

以下のフォームでジェネリッククラスを定義する必要があります。

public class ItemEqualityComparer<T> : IEqualityComparer<T> where T : class
{
    private readonly PropertyInfo _propertyInfo;

    public ItemEqualityComparer(string keyItem)
    {
        _propertyInfo = typeof(T).GetProperty(keyItem, BindingFlags.GetProperty | BindingFlags.Instance | BindingFlags.Public);
    }

    public bool Equals(T x, T y)
    {
        var xValue = _propertyInfo?.GetValue(x, null);
        var yValue = _propertyInfo?.GetValue(y, null);
        return xValue != null && yValue != null && xValue.Equals(yValue);
    }

    public int GetHashCode(T obj)
    {
        var propertyValue = _propertyInfo.GetValue(obj, null);
        return propertyValue == null ? 0 : propertyValue.GetHashCode();
    }
}

次に、リスト内の重複したアイテムを削除できます。

var products = new List<Product>
            {
                new Product{ProductName = "product 1" ,Id = 1,},
                new Product{ProductName = "product 2" ,Id = 2,},
                new Product{ProductName = "product 2" ,Id = 4,},
                new Product{ProductName = "product 2" ,Id = 4,},
            };
var productList = products.Distinct(new ItemEqualityComparer<Product>(nameof(Product.Id))).ToList();

var customers = new List<Customer>
            {
                new Customer{CustomerName = "Customer 1" ,Id = 5,},
                new Customer{CustomerName = "Customer 2" ,Id = 5,},
                new Customer{CustomerName = "Customer 2" ,Id = 5,},
                new Customer{CustomerName = "Customer 2" ,Id = 5,},
            };
var customerList = customers.Distinct(new ItemEqualityComparer<Customer>(nameof(Customer.Id))).ToList();

このコードは、他のプロパティで重複アイテムを削除する場合に重複アイテムを削除します。同じようにId変更してから、プロパティで重複アイテムを削除できます。nameof(YourClass.DuplicateProperty)nameof(Customer.CustomerName)CustomerName

score 4 · Accepted Answer

重複がリストに追加されていないことを確認する方が簡単かもしれません。

if(items.IndexOf(new_item) < 0) 
    items.add(new_item)

score 2 · Accepted Answer

.Net2.0の別の方法

    static void Main(string[] args)
    {
        List<string> alpha = new List<string>();

        for(char a = 'a'; a <= 'd'; a++)
        {
            alpha.Add(a.ToString());
            alpha.Add(a.ToString());
        }

        Console.WriteLine("Data :");
        alpha.ForEach(delegate(string t) { Console.WriteLine(t); });

        alpha.ForEach(delegate (string v)
                          {
                              if (alpha.FindAll(delegate(string t) { return t == v; }).Count > 1)
                                  alpha.Remove(v);
                          });

        Console.WriteLine("Unique Result :");
        alpha.ForEach(delegate(string t) { Console.WriteLine(t);});
        Console.ReadKey();
    }

score 2 · Accepted Answer

これは、読みにくい LINQ やリストの事前の並べ替えを必要としない単純なソリューションです。

   private static void CheckForDuplicateItems(List<string> items)
    {
        if (items == null ||
            items.Count == 0)
            return;

        for (int outerIndex = 0; outerIndex < items.Count; outerIndex++)
        {
            for (int innerIndex = 0; innerIndex < items.Count; innerIndex++)
            {
                if (innerIndex == outerIndex) continue;
                if (items[outerIndex].Equals(items[innerIndex]))
                {
                    // Duplicate Found
                }
            }
        }
    }

score 2 · Accepted Answer

David J.'s answer is a good method, no need for extra objects, sorting, etc. It can be improved on however:

for (int innerIndex = items.Count - 1; innerIndex > outerIndex ; innerIndex--)

So the outer loop goes top bottom for the entire list, but the inner loop goes bottom "until the outer loop position is reached".

外側のループはリスト全体が処理されることを確認し、内側のループは実際の重複を見つけます。それらは外側のループがまだ処理されていない部分でのみ発生する可能性があります。

または、内側のループでボトムアップを行いたくない場合は、内側のループを outerIndex + 1 から開始することができます。

score 2 · Accepted Answer

解決するには多くの方法があります - リスト内の重複の問題、以下はその1つです:

List<Container> containerList = LoadContainer();//Assume it has duplicates
List<Container> filteredList = new  List<Container>();
foreach (var container in containerList)
{ 
  Container duplicateContainer = containerList.Find(delegate(Container checkContainer)
  { return (checkContainer.UniqueId == container.UniqueId); });
   //Assume 'UniqueId' is the property of the Container class on which u r making a search

    if(!containerList.Contains(duplicateContainer) //Add object when not found in the new class object
      {
        filteredList.Add(container);
       }
  }

乾杯ラヴィ・ガネサン

score 2 · Accepted Answer

シンプルで直感的な実装:

public static List<PointF> RemoveDuplicates(List<PointF> listPoints)
{
    List<PointF> result = new List<PointF>();

    for (int i = 0; i < listPoints.Count; i++)
    {
        if (!result.Contains(listPoints[i]))
            result.Add(listPoints[i]);
        }

        return result;
    }

score 1 · Accepted Answer

HashSetを使用すると、これを簡単に行うことができます。

List<int> listWithDuplicates = new List<int> { 1, 2, 1, 2, 3, 4, 5 };
HashSet<int> hashWithoutDuplicates = new HashSet<int> ( listWithDuplicates );
List<int> listWithoutDuplicates = hashWithoutDuplicates.ToList();

c# - リストから重複を削除するC＃で

31 に答える 31

Related

Reference