セマンティック情報のスクレイピングにJenaを使用してJavaでアプリを構築しています。すべてのRDFaステートメントを正しく抽出できるRDFaパーサーを探しています。具体的には、使用されている名前空間に関する情報を抽出し、ページ内でRDFaタグが正しいと仮定すると、オブジェクトとデータのプロパティを区別する正しいトリプルが生成されます。
http://rdfa.info/wiki/ConsumeforJavaのサイトからすべてのRDFaパーサーを調べました。それらはすべてRDFaステートメントを抽出するのに苦労し、クラッシュしない場合、Jena RDFaパーサーは多くのエラーを表示し、ひどい死を迎えます。データは誤って処理され、一般的に混同されるため、ほとんど役に立ちません。私はこの分野の初心者なので、優しくしてください:)
また、別の言語で書かれたライブラリを使用することも考えていましたが、Javaコードにプラグインする方法がわかりません。助言がありますか?