0

1 つの「マスター リスト」と比較する必要がある多数の CSV ファイルがあり、一意の ID に基づいて、これらの他のファイルにそのキーのエントリが含まれているかどうかを判断します。

Pythonでこれを行う最も簡単な方法は何ですか? つまり、データをどのような構造に読み込むことをお勧めしますか? また、どのようにデータを反復処理することをお勧めしますか?

これが私が探しているデータと出力の例です。

**Master List**

Unique ID : File Name : File Version : Responsible Party

J578221 : Expander : 1.23 : Joe Bloggs

KK89821 : Top : 0.9 : Mike Smith


**Location X**

Region : File Name : Unique ID

USA : Acme Expander : J578221

USA : Acme Tail : MK33431

**Location Z**

Reqion : File Name : Unique ID : Date Added

China : Expander : J578221 : 03-04-2012

HK : Acme Top : KK89821 : 06-07-2012

**Output:**

Unique ID : File Name : File Version : Responsible Party : In Location X : In Location Z

J578221 : Expander : 1.23 : Joe Bloggs : YES : YES

KK89821 : Top : 0.9 : Mike Smith : NO : YES
4

1 に答える 1

0

最も簡単な方法は、正規表現 (こちらのドキュメントを参照) を使用して、マスター ファイルの各行のキーを取得することです。(最初にファイルの構造を評価し、Unique-ID の位置が変更された場合は式を変更する必要がある場合があります。)

この ID リストをディクショナリにキーとして格納し、リストを値として使用して、各マスター キーが含まれるファイルを示します。

その後、1 つまたは複数のファイルの ID (キー) の辞書をフィルター処理したり、1 つの特定の ID を含むファイルを検索したりできます。

于 2013-04-18T12:22:07.637 に答える