最速で読み取るには、最大 500,000 エントリのインデックスを作成する必要があります。インデックスはディスク上で定期的に再構築する必要があります。ディスク上のハッシュのような単純なファイルか、組み込みデータベースの単一のテーブルかを決定しようとしています。RDBMS エンジンは必要ありません。
7 に答える
おそらくBDB?高性能です。DBMSを使用しないデータベース。
キーごとに状態オブジェクトを保存している場合は、 BerkeleyDBはどうでしょうか。
データが変更されない場合はcdb 。
/アラン
PyTables Pro は、「迅速な更新や削除を必要としない状況では、OPSI はおそらく利用可能な最高のインデックス エンジンの 1 つです」と主張しています。ただし、私は個人的には使用していませんが、PyTables の F/OSS バージョンは既に優れたパフォーマンスを提供しています。
リレーショナル DBMS (mySql、Oracle、Postgres など) のインデックス テーブルについて言及していると思います。
インデックスは、テーブルのフィールドのサブセットのレコードを特定の順序で保持するセカンダリ データ ストアです。
インデックスを作成すると、WHERE 句でインデックス付けされたフィールドのサブセットを含むすべてのクエリがより高速に実行されます。
ただし、インデックスを追加すると、INSERT のパフォーマンスが低下します。
一般に、インデックスは破損しない限り再構築する必要はありません。これらは、DBMS によってオンザフライで維持される必要があります。
データを完全に最新にする必要がない場合は、OLAP 用のデータ ウェアハウス ツール ( MSOLAPなど) の使用を検討することもできます。は、事前計算されたデータに基づいて超高速の読み取り専用クエリを実行できます。