xml - XML ファイルの検索またはインデックス作成

Question

私は、すべての記事を XML として保存するニュース Web サイトで働いています。最善の方法ではないことはわかっていますが、それが現状です。私がやろうとしているのは、Web サイトから XML ファイルを検索できるようにすることです。現在、検索機能はすべて Google を利用しています (Google が既にクロールしたもののみを検索します)。

私がすぐに考えているのは、Grep を使用することです。これは問題なく動作しますが、おそらくあまりスケールアウトしないでしょう。より多くの作業が必要ですが、はるかにうまく機能するもう 1 つのオプションは、XML の一部をリレーショナルデータベースに格納することです。

バックエンドの設定方法を考えると、別のストレージモデルに移行するには時間がかかるため、当面はこれで作業する必要があります。アイデア？

score 3 · Accepted Answer

キャッシュを追加すると、grep のアイデアをスケールアウトするのに役立つ場合があります。ただし、今日の問題を応急処置するだけでなく、明日により良い解決策に近づける解決策を検討することもできます。おそらく、より良いソリューションを設計し、時間をかけて少しずつ実装することでうまくいくでしょう。

score 0 · Accepted Answer

XML の使用に専念している場合は、Berkeley DBXML や eXist-db などのネイティブ XML データベースソリューションを採用することをお勧めします。どちらも xquery を起動できます。eXist は、DBXML にはない全文検索も実装していますが、DBXML の方がデータの取得が高速です。

xml - XML ファイルの検索またはインデックス作成

3 に答える 3

Related

Reference