1

皆さん、こんにちは。開発中のアルゴリズムのテストを行うのに十分な大きさのセマンティック データセットを探していました。

これは、AllegroGraph に「簡単に」アップロードできる既存の RDF/XML ファイルを意味します。ダミーのデータセットをいくつか見つけましたが、それらは「char1」、「char2」、「node121」などの非現実的なデータを使用しています。最初はこれで問題ありません。

しかし今、車、植物、映画、本など、実際のものに関するデータセットを使用してテストする必要があります。いくつかの組み合わせが理想的です。具体的には、少なくとも 3 つまたは 4 つのファセットを持つ 50,000 を超えるオブジェクトを含むものです。これらのデータセットはどこかにあると言われましたが、見つかりません。

リンク、ポインタ、または提案は大歓迎です。また、この質問を投稿するためのより良いサイトがあれば、アドバイスに従います。

4

1 に答える 1

1

もっと時間をかけて調べた後、私は非常に良い選択肢に出くわしました。それがDBpedia.org です。ウィキペディアからすべてのデータを収集し、特定の部分に分割します。私のテスト目的で、私はおそらく使用するでしょう。私の問題は、セマンティック Web に関しては、概念と必要なものを検索する方法にまだ慣れていないことだと思います。このリンクがより多くの人に役立つことを願っています:)

于 2011-05-21T02:46:47.910 に答える