私の関数はテキストを解析し、「a」、「the」、「in」、「on」、「at」などの短い単語を削除します。
これらの単語のリストは、将来変更される可能性があります。また、異なるリスト間(つまり、異なる言語用)の切り替えもオプションになる場合があります。
では、そのようなリストはどこに保存すればよいのでしょうか。
- 約50〜200語
- 毎分多くの読み取り
- 書き込み(変更)はほとんどありません-たとえば、数か月に1回
私はこれらのオプションを心に留めています:
- コード内のリスト(最速ですが、良い習慣のようには聞こえません)
- 別のファイル「stop_words.txt」(ファイルからの読み取り速度はどれくらいですか?同じ関数を呼び出す数秒ごとに同じファイルから同じデータを読み取る必要がありますか?)
- データベーステーブル。単語のリストがほとんど静的であると想定される場合、それは本当に効率的でしょうか?
私はRubyonRailsを使用しています(それが違いを生む場合)。