20,000 個のドメイン名を 1 行に 1 つずつ含む txt ファイル (A.txt) があります。一緒にコンパイルされた何千もの Whois レコードを含む別の txt ファイル (B.txt) があります。A.txt のどのドメインが B.txt で参照されていないかを知りたいです。これを1つずつ行うのは簡単ですが、どうすればまとめて行うことができますか? ありがとう
1 に答える
0
ファイルA.txtを編集してスタイルの行を、example.com A other stuff
ファイルB.txtを編集して形式の行を含めることができますexample.com B other stuff
。次に、2 つのファイルを一緒に並べ替えます。次に、Notepad++ 正規表現の置換を実行し、 を検索し^([^ ]+) A .*\r\n(\1 B )
て置換し\2
ます。その結果、 B.txtに一致する A.txt 行が削除され、B.txt行が残ります。1 つのB.txtに一致するA.txt行が複数ある場合は、行が置換されなくなるまで置換を 2 回以上実行します。最後に、B.txt行を削除します (正規表現を使用して、探している行を見つけてマークします。^([^ ]+) B
次に、ブックマークされた行を削除します) 一致しない行を残しますA.txt
。
ソース ファイル A.txt および B.txt の形式がわからないため、行頭に URL の後に A または B を付ける正規表現を提案できません。
于 2013-03-23T09:35:53.427 に答える