0

yago.n3 データセットをダウンロードしました

ただし、テストのために、データセットの小さいバージョン (データセットが 2 GB であるため) で作業したいと考えています。小さな変更を加えても、デバッグに多くの時間がかかります。

したがって、データのごく一部をコピーして別のファイルを作成しようとしましたが、これは機能せず、字句エラーが発生しました。

以前の投稿を見ましたが、以前の投稿は大きなデータセットに関するものでしたが、私は小さなデータセットを探しています。

同じデータセットを少量取得する方法はありますか?

4

1 に答える 1

3

yago.n3 ファイルを読み取るための RDF パーサーが手元にある場合は、それを解析して、実験を実行する小さなデータセットに必要な数の RDF トリプルを別のファイルに書き込むことができます。

N-Triples 形式 (つまり、1 行に 1 つの RDF トリプル) のデータが見つかった場合は、必要な数の行を取り、データセットを必要なだけ小さくすることができます: head -n 10 filename.nt は、小さな10 個のトリプルのデータセット。

于 2012-05-25T06:20:26.480 に答える