5

私は、すべての記事を XML として保存するニュース Web サイトで働いています。最善の方法ではないことはわかっていますが、それが現状です。私がやろうとしているのは、Web サイトから XML ファイルを検索できるようにすることです。現在、検索機能はすべて Google を利用しています (Google が既にクロールしたもののみを検索します)。

私がすぐに考えているのは、Grep を使用することです。これは問題なく動作しますが、おそらくあまりスケールアウトしないでしょう。より多くの作業が必要ですが、はるかにうまく機能するもう 1 つのオプションは、XML の一部をリレーショナル データベースに格納することです。

バックエンドの設定方法を考えると、別のストレージ モデルに移行するには時間がかかるため、当面はこれで作業する必要があります。アイデア?

4

3 に答える 3

3

キャッシュを追加すると、grep のアイデアをスケールアウトするのに役立つ場合があります。ただし、今日の問題を応急処置するだけでなく、明日により良い解決策に近づける解決策を検討することもできます。おそらく、より良いソリューションを設計し、時間をかけて少しずつ実装することでうまくいくでしょう。

于 2013-01-23T16:05:26.043 に答える
0

XML の使用に専念している場合は、Berkeley DBXML や eXist-db などのネイティブ XML データベース ソリューションを採用することをお勧めします。どちらも xquery を起動できます。eXist は、DBXML にはない全文検索も実装していますが、DBXML の方がデータの取得が高速です。

于 2013-06-15T06:24:51.697 に答える