0

重複ファイル(.pst)を見つけて削除し、最終的に一意の電子メールを取得する必要があります。現在、Powershellを使用して、フォルダーを再帰的に調べて.pstファイルのみを検索し、特定のメタデータを.csvファイルにエクスポートしています。比較(名前、ファイルの日付など)を行うために.csvをSQLにインポートすることをお勧めします。その後、私は立ち往生しています。

必要なファイルを取得して残りを削除するには、どの言語またはプログラムが最適ですか?私はVB.Net(C#を試すことができます)とPowerShellでかなり働いています。

4

2 に答える 2

1

.csvをSQLデータベースにインポートしたと仮定します。テーブル名がpstsだとしましょう。

まず、同じメールアドレスを持つレコードの数を確認するには、

SELECT email, count(*)
FROM psts
GROUP BY email

次に、1つの値を持つものを見たくないので、

SELECT email, count(*)
FROM psts
GROUP BY email
HAVING count(*) >= 2

それらのレコードのリストを取得するには、

SELECT out.email, count(*), out.<other fields you want to see>
FROM psts out
  INNER JOIN psts pst_count ON out.email = pst_count.email
GROUP BY out.email
HAVING count(*) >= 2
于 2012-10-25T18:39:07.513 に答える
1

ファイルシステムを編集する方法があり、SQLクエリを実行できる限り、実際に必要なものを使用できます。

VB.netがSQLサーバーをサポートしているかどうかはわかりませんが、.net言語なので、サポートされていると確信しています。

私はあなたがこれらの2つの機能をサポートするあなたが知っているどんな言語でも行くと言うでしょう:)

于 2012-10-25T18:31:13.880 に答える