0

20,000 個のドメイン名を 1 行に 1 つずつ含む txt ファイル (A.txt) があります。一緒にコンパイルされた何千もの Whois レコードを含む別の txt ファイル (B.txt) があります。A.txt のどのドメインが B.txt で参照されていないかを知りたいです。これを1つずつ行うのは簡単ですが、どうすればまとめて行うことができますか? ありがとう

4

1 に答える 1

0

ファイルA.txtを編集してスタイルの行を、example.com A other stuffファイルB.txtを編集して形式の行を含めることができますexample.com B other stuff。次に、2 つのファイルを一緒に並べ替えます。次に、Notepad++ 正規表現の置換を実行し、 を検索し^([^ ]+) A .*\r\n(\1 B )て置換し\2ます。その結果、 B.txtに一致する A.txt 行削除され、B.txt行が残ります。1 つのB.txtに一致するA.txt行が複数ある場合は、行が置換されなくなるまで置換を 2 回以上実行します。最後に、B.txt行を削除します (正規表現を使用して、探している行を見つけてマークします。^([^ ]+) B次に、ブックマークされた行を削除します) 一致しない行を残しますA.txt

ソース ファイル A.txt および B.txt の形式がわからないため、行頭に URL の後に A または B を付ける正規表現を提案できません。

于 2013-03-23T09:35:53.427 に答える