0

RSSフィードを解析して国への参照を探しています。現時点では Python を使用していますが、この質問は (理論的には) 言語にかなり依存していると思います。

3つのリストがあるとしましょう(すべて関連しています)

  • 国 - 名詞 (つまり、イングランド、ノルウェー、フランス)
  • 国 - 形容詞 (例: 英語、ノルウェー語、フランス語)
  • 都市 (つまり、ロンドン、ニューカッスル、バーミンガム)

私の目的は、これらの文字列のフィードを解析することから始めることです。

たとえば、「London」が見つかった場合、国は「England」になり、「Norwegian」が見つかった場合は「Norway」になります。

このデータを処理するための最適な方法は何ですか? 入れ子になった辞書を作成するのは jason であり、すべてを引き込むことでしょうか? セット?またはある種のデータベース?

現時点では、これはローカル マシンでの使用のみを目的としています。

4

2 に答える 2

0

それは非常に議論の余地のある質問です。これには複数の解決策があります。私があなたなら、Mongodbにある小さなDBで、このような3つのテーブルがあります。

  1. 国:列:id、name
  2. Country-adj:列:id、name、country_id
  3. 都市:列:id、name、country_id

次に、単純なクエリで目的の結果が得られます。

于 2012-11-11T14:04:40.810 に答える
0

"England" -> "England"3 つのデータ リストを 1 つの辞書にマージして、名前を国名"English" -> "England"にマップすることをお勧めします "London" -> "England"。データベースやファイルに簡単に保存して取得できます。

次に、ディクショナリでキーを検索し、ディクショナリの値でアイテムにラベルを付けます。

于 2012-11-18T14:21:34.507 に答える