indexing - 最速の読み取り応答を得るためにインデックスを構築する最良の方法は何ですか?

Question

最速で読み取るには、最大 500,000 エントリのインデックスを作成する必要があります。インデックスはディスク上で定期的に再構築する必要があります。ディスク上のハッシュのような単純なファイルか、組み込みデータベースの単一のテーブルかを決定しようとしています。RDBMS エンジンは必要ありません。

score 1 · Accepted Answer

1

おそらくBDB？高性能です。DBMSを使用しないデータベース。

于 2008-09-16T00:54:00.437 に答える

score 1 · Accepted Answer

score 1 · Accepted Answer

1

データが変更されない場合はcdb 。

/アラン

于 2008-09-16T01:34:36.410 に答える

score 1 · Accepted Answer

PyTables Pro は、「迅速な更新や削除を必要としない状況では、OPSI はおそらく利用可能な最高のインデックスエンジンの 1 つです」と主張しています。ただし、私は個人的には使用していませんが、PyTables の F/OSS バージョンは既に優れたパフォーマンスを提供しています。

score 1 · Accepted Answer

リレーショナル DBMS (mySql、Oracle、Postgres など) のインデックステーブルについて言及していると思います。

インデックスは、テーブルのフィールドのサブセットのレコードを特定の順序で保持するセカンダリデータストアです。

インデックスを作成すると、WHERE 句でインデックス付けされたフィールドのサブセットを含むすべてのクエリがより高速に実行されます。

ただし、インデックスを追加すると、INSERT のパフォーマンスが低下します。

一般に、インデックスは破損しない限り再構築する必要はありません。これらは、DBMS によってオンザフライで維持される必要があります。

score 0 · Accepted Answer

データを完全に最新にする必要がない場合は、OLAP 用のデータウェアハウスツール ( MSOLAPなど) の使用を検討することもできます。は、事前計算されたデータに基づいて超高速の読み取り専用クエリを実行できます。

score 0 · Accepted Answer

0

これがMapReduceが発明された目的です。Hadoopはクールな Java 実装です。

于 2008-09-16T00:20:39.987 に答える

7 に答える 7