0

重複の可能性があることをあらかじめお詫び申し上げます。

N-TRIPLESTDB データセットのデフォルト グラフにロードしたい117,426 個のファイル (それぞれの形式) を含むアーカイブがあります。ファイル数が多いため、アップロードする個々のファイルを手動で選択することなく、このインポートを実行できる必要があります。

私は Bash を使用しており、Jena と Fuseki のディストリビューションを自由に使用できます。

可能であれば、Java アプリケーションを作成してこれを行うという最悪のシナリオは避けたいと考えています。このための Java アプリケーションを作成する必要がある場合、RIOT/TDB にはプログラムによる一括読み込みを実行するためのフックが存在しますか?

4

1 に答える 1

3

一般的なコメントとして、1 つの方法は、N-Triples ファイルを連結して 1 つのファイルを生成することです。

tdbloaderまたはを使用して、一度に多数のファイルをロードできますtdbloader2

tdbloader --loc DB ... your files ...

117,426 は、1 回のコマンド ライン呼び出しで OS に負担をかける可能性があります。ファイルをパイプすることができますtdbloader(最初にファイルを連結するのと同じです)

... | tdbloader --loc DB -- -

...bash でファイルを cat する方法はどこにありますか (サブシェルから可能)。

例 (117,426 個のファイルすべてをファイルするように調整する必要があります):

( for x in data*.nt
  do
    cat $x 
  done
) | tdbloader --loc DB -- -
于 2014-09-08T18:48:17.447 に答える