私の質問には、対処すべきいくつかの問題があります。2 つのフィールド (ID として使用される数値フィールドと説明として使用される文字列フィールド) を含む csv ファイルをインポートする必要があります。次に、文字列フィールドを個々の単語のセット (list? tuple? dict?) に変換し、他のセットを検索して一致をカウントします。
例:
id_field | desc_field
1 | some description
2 | some other description
3 | some third other description
これから必要なのは、一致する id_field のリストです
id_field 1 has 2 matches in id_field 2
id_field 1 has 2 matches in id_field 3
id_field 2 has 3 matches in id_field 3
等
ファイルのインポートは、csv
次を使用して簡単に実行できます。
import csv
reader = csv.reader(open('SOMEFILE.csv'), delimiter=',', quotechar='"'
find または in 演算子を使用して単語の検索とカウントを処理できると確信していますが、csv 文字列フィールドを検索できるようにするコードの記述に問題があります。