数日前、2つのテキストファイルのタグ付けの違いについて質問したところ、すぐに回答されました。
今、私はかなり似た質問がありますが、もう少し複雑です。次の特性を持つ2つのファイルのペアがあります:pair1:(File1.txt、File2.txt)pair2:(File3.txt、File4.txt)
これらのペアの各ファイルの間には、行ごとの対応があります。File1.txtとFile3.txtは英語の単語であり、File2.txtとFile4.txtはそれぞれアラビア語とフランス語の翻訳であると言います。さらに、File1.txtとFile3.txtは非常に似ています(場合によっては同じです)。
File1.txt File2.txt
EnWord1 ArTrans1
EnWord2 ArTrans2
EnWord3 ArTrans3
Enword4 ArTrans4
File3.txt File4.txt
EnWord1 FrTrans1
EnWord3 FrTrans3
Enword4 FrTrans4
Enword5 FrTrans5
ここで私がやりたいのは、これらのペアの英語側を比較し、両方のファイル(EnWord1、EnWord3、およびEnWord4)に表示される共通の単語を見つけて、対応する翻訳を除外することです。要するに、私は2つのバイリンガルの英語-アラビア語と英語のフランス語の辞書を使用して、3つの言語の英語-アラビア語-フランス語の辞書を作成しようとしていると言えます。どうすれば可能ですか?
そのようなペアがたくさんあるので(辞書は異なるファイルに保存されているため、各ファイルには単語の一部が含まれており、何らかの理由でファイルをマージして処理することはできません)、コードの速度を追加する必要があります非常に重要であり、私はこれを行うための迅速な方法を探しています。
最後に、Perlでこれを行うためのいくつかのポイント(または場合によっては完全なコード)を教えてください。
よろしく、ハキム