私はdbpedia ダウンロード ページで提供されているさまざまなデータセットをいじっていましたが、それが時代遅れであることがわかりました。
次に、 dbpedia ライブサイトから最新のダンプをダウンロードしました。6 月 30 日のファイルを抽出したところ、37 GB の巨大な .nt ファイルが 1 つだけ得られました。
最新のダンプからさまざまなデータセット (ダウンロード ページで入手できるさまざまな .nt ファイルなど) を取得したいと考えています。それを行うためのスクリプトまたはプロセスはありますか?