0

私は次のような会社名を持っています:

1.Apple Inc. 2.Apple computers Inc. 3.Apple 4.IBM 5.International Business Machines 4.International Business Machines Corporation 5.International Business Machines Corp. 6.Ibm Corp..

テキストを正しい会社名と一致させ、他のすべての同様のものを正しい会社名に置き換える必要があります...何か方法はありますか???

4

2 に答える 2

0

多分これは役立つかもしれませんか?これは python diff ライブラリです。

各文字列間の差分を計算できます。2 つの文字列が非常に類似している場合は、おそらく (おそらく注意してください)、それらには多くの共通点があるため、同じ会社である可能性があると想定できます。

于 2013-07-07T05:17:43.157 に答える
0

名前の照合を行うpython ライブラリがあります。

> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
  [('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
  ("Dallas Cowboys", 90)
于 2013-08-24T18:00:28.877 に答える