私は、すべての記事を XML として保存するニュース Web サイトで働いています。最善の方法ではないことはわかっていますが、それが現状です。私がやろうとしているのは、Web サイトから XML ファイルを検索できるようにすることです。現在、検索機能はすべて Google を利用しています (Google が既にクロールしたもののみを検索します)。
私がすぐに考えているのは、Grep を使用することです。これは問題なく動作しますが、おそらくあまりスケールアウトしないでしょう。より多くの作業が必要ですが、はるかにうまく機能するもう 1 つのオプションは、XML の一部をリレーショナル データベースに格納することです。
バックエンドの設定方法を考えると、別のストレージ モデルに移行するには時間がかかるため、当面はこれで作業する必要があります。アイデア?