情報をソートしたファイルがあり、そのファイルの特定のインデックスを別のファイルのインデックスと比較したいのですが、問題の 1 つは、ファイルが非常に大きく、何百万行もあるということです。私が持っているファイルを行ごとに比較したいのですが、一致する場合は、インデックスメソッドを使用して、これらの値と他の値の両方を入力したいと考えています。
=======================
はっきりさせておきますが、line[x] と言いたいのですが、x は均一にフォーマットされているので同じままです。別のファイルで line[y] に対して line[x] を実行したいのですが、これを全体に対して実行したいのです。ファイルに保存し、一致するすべてのペアを別のファイルに出力します。その他のファイルには、次のようなインデックスを追加するだけのような、最初のファイルの他の部分も含めることができるようにしたいと考えています。line[a]、line[b]、line[c]、line[d]、そして最後に line[y] がその情報に一致します。
3 を試してください:
次の形式の情報を含むファイルがあります。
#x は線
x= data,data,data,data,data,data
それには何百万もの行があります。
同じ形式の別のファイルがあります。
xis a line
x= data,data,data,data
最初のファイルの x[#] と 2 番目のファイルの x[#] を使用したいのですが、これら 2 つの値が一致するかどうかを確認し、一致する場合はそれらを出力したいと思います。同じ行にある 2 番目のファイル。
それは理解するのにまったく役立ちましたか?ファイルの形式は私が言ったようなものです:(しかし、何百万ものファイルがあり、すべてが一致する必要があるため、2 つのファイルでペアを見つけたいと思います)
line 1 data,data,data,data
line 2 data,data,data,data
ファイル 1 のデータ:
(N'068D556A1A665123A6DD2073A36C1CAF', N'A76EEAF6D310D4FD2F0BD610FAC02C04DFE6EB67',
N'D7C970DFE09687F1732C568AE1CFF9235B2CBB3673EA98DAA8E4507CC8B9A881');
ファイル 2 のデータ:
00000040f2213a27ff74019b8bf3cfd1|index.docbook|Redhat 7.3 (32bit)|Linux
00000040f69413a27ff7401b8bf3cfd1|index.docbook|Redhat 8.0 (32bit)|Linux
00000965b3f00c92a18b2b31e75d702c|Localizable.strings|Mac OS X 10.4|OSX
0000162d57845b6512e87db4473c58ea|SYSTEM|Windows 7 Home Premium (32bit)|Windows
000011b20f3cefd491dbc4eff949cf45|totem.devhelp|Linux Ubuntu Desktop 9.10 (32bit)|Linux
ソート順は英数字で、スライダー方式を使いたいです。つまり、file1[x] が < file2[x] である場合、一方の値が他方よりも大きいかどうかに応じて、一致が見つかるまでスライダーを上下に動かし、一致する場合は他の値とともに出力を出力しますそれはそのハッシュを識別します。
結果として私が望むのは次のとおりです。
file1[x] とそれに対応する file2[x] の一致がファイルに出力されます。他の file1[x] と同様に、x は行の任意のインデックスにできます。