TDB の最新リリースには、バルク ロード用の 2 つのコマンド ライン ユーティリティ、tdbloader と tdbloader2 があります。1 つ目は純粋な Java で、Windows だけでなく、JVM を備えた任意のマシンでも実行されます。2 つ目は、Java と UNIX のシェル スクリプトを組み合わせたものです (特に、UNIX の並べ替えを使用しています)。Linux で動作しますが、Cygwin で動作するかどうかはわかりません。できるだけ多くの RAM を搭載した 64 ビット マシンで tdbloader を使用することをお勧めします。:-)
TDB の最新リリースは、http:
//www.apache.org/dist/incubator/jena/jena-tdb-0.9.0-incubating/jena-tdb-0.9.0-incubating-distribution.zipから入手できます。
TDB の開発バージョンには、tdbloader3 という追加のバルク ローダー コマンドがあります。これは、tdbloader2 のピュア Java バージョンです。UNIX ソート (テキスト ファイルでのみ機能する) を使用する代わりに、バイナリ ファイルで純粋な Java 外部ソートを使用しました。tdbloader3 の詳細については、JENA-117 の問題を検索してください。
まだリリースされていない Apache スナップショット リポジトリで TDB の SNAPSHOT を見つけることができます。
より冒険的なものには、Apache Jena には含まれていない tdbloader4 もあり、実験的なプロトタイプと見なされます。tdbloader4 は、MapReduce を使用して TDB インデックス (つまり、B+Tree インデックス) を構築します (これは MapReduce モデルを少し拡張していますが、機能します)。ここで tdbloader4 を見つけることができます: https://github.com/castagna/tdbloader4
結論として、Windows の場合、TDB の最新の公式リリースをダウンロードし、大量の RAM を搭載した 64 ビット マシンで tdbloader を使用することをお勧めします。持っていない場合は、m1.xlarge EC2 インスタンス (つまり、15 GB の RAM) (または同等のもの) を使用します。
さらにヘルプが必要な場合は、公式の jena-users@incubator.apache.org メーリング リストに参加することをお勧めします。このメーリング リストでは、より適切で迅速なサポートが得られると確信しています。