多数のテキストでいくつかの都市名やその他の地理的トピックを検索するパーサーを作成したいと思います。たとえばSydney
、、、..。Tower Bridge
_Munich
私の考えは、ヒットがあった場合、地理に関する情報( http://www.geonames.org/など、いくつかの都市情報をダウンロードできます)を含むローカルデータベースにいくつかの単語を要求することです。データベースはいくつかのlanおよびlonコーディネーターに応答します。単語は大文字で始まり、長さが2より大きい必要があります
しかし、パフォーマンスは非常に悪いと思います。1つのテキストには10〜100語が含まれます。テキストに関する地理情報を見つけるためのより良い方法はありますか?
そして、おそらくより多くの地理情報を備えたより良いデータベースがありますか?
ご挨拶、運命