問題タブ [dbpedia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sparql - SPARQL OPTIONAL を適切に使用して、存在する可能性のあるリソースの属性を取得する方法は?
SPARQL クエリを使用して DBpedia リソース (Person) に関する情報を取得しようとしています。リソース URI をパラメーター化することで、同じクエリを使用して任意の Person に関するデータを取得したいと考えています。特定のリソースには一部の属性が存在しない可能性があるため、OPTIONAL
ステートメントを利用しています。これが私のクエリです:
label、abstract、page 以外はすべて に残しましたOPTIONAL
。別の人に同じクエリを使用すると、それらのプロパティがない可能性があるためです。問題は、これらのオプションの属性が結果に表示されないことです。Neil Simon の場合、http://dbpedia.org/resource/Neil_SimonbirthDate
に、 、birthPlace
およびの値があることがわかります。ただし、クエリを実行すると、これらの値は表示されません: DBpedia SPARQL query。私は何を間違っていますか?オプションでそれらのプロパティを取得するにはどうすればよいですか?thumbnail
java - Dbpedia 抽出フレームワーク - mediawiki の書式設定マークアップを削除する方法
私はdbpedia抽出フレームワークをいじっています。とてもいい感じで、喜んでウィキペディアのページの AST を作成し、リンクを抽出しています (WikiParser を使用)。しかし、解析からは構造化されたツリーが得られますが、テキスト ノードにはまだ多くの書式設定マークアップが含まれていることに気付きました (たとえば、イタリック体、太字などに使用されるアポストロフィ)。私の目的では、これらは役に立ちません。プレーンテキストが必要なだけです。
これを取り除くために独自のコードを書くのに時間を費やすことができますが、このようなものが dbpedia に役立つだろうと推測しています - そしてそれはライブラリのどこかに存在します。私は正しいですか?もしそうなら - 裸のテキストに落とす余分な機能はどこにありますか?
それ以外の場合 - mediawiki マークアップを削除する他の (できれば scala) パッケージを知っている人はいますか?
編集
詳細についてのリクエストに応えて。次のマークアップ:
TextNode のコンテンツとして dbpedia を通過しますが、そのままです。私はそれを次のように削除する機能が欲しいです:
または、生のテキストの各セクションを表す追加のノードを含む、より構造化された AST に、おそらく (各ノードに) 適用される書式設定の種類 (イタリック体、太字など) で注釈が付けられます。
現状では、dbpedia 解析の最終結果は依然としてマークアップでいっぱいです。
それが役立つことを願っています。
sparql - DBpedia と SPARQL: アクセント記号を含むクエリが機能しない
というわけで、いろいろ試して解決策を探しましたが、うまくいきませんでした...
私のSPARQLクエリは
$term が名前にアクセント記号が付いたものと等しい場合、すべてが台無しになり、結果が得られません。私はさまざまなことを試しましたが、それらのどれも機能させることができないようです。助けを期待しています。
ありがとう
編集
私はPHPとcurlを使用しています。これは、私がダウンロードして必要に応じて変更したものです...これは、dbpedia と通信する部分です。
$query は上に掲載されており、使用されている形式は json です。
編集 2
これが私が使用しているもののソースコードです。https://gist.github.com/380379完全なコードを見ると、何が問題なのかがわかります。
アクセント付きの姓を含むデータベース フィールドを 'utf8_unicode_ci' に変更しましたが、まだ行き詰まっており、有効な解決策が見つかりません。
sparql - ピリオドを含む DBpedia SPARQL クエリ
マンチェスター・ユナイテッドのサッカーチームの概要を取得しようとしていますが、問題は wiki リンクにピリオドが含まれていることです。これを試したところ、
FCの後のピリオドのため、エラーを返しました
これを修正する方法についてのアイデアはありますか?
rdf - DBPedia Infobox カテゴリの取得
現在、SPARQL エンドポイントを介してDBPedia の Infobox Onyology データベースにクエリを実行し、クラスのリスト、選択したクラスのサブクラス、および特定のクラスのプロパティを取得する方法を探しています。私が見つけた限りでは、探しているプロパティを知るか、特定のものを検索する必要があります。私が見つけたすべての例は、特定のものを検索したいという考えに基づいているようです。 (特定の標高を超える都市の人口など)、カテゴリを効果的に「閲覧」できるものを構築したいと考えています。例えば、このクラス階層図の「owl:Thing」のサブクラス一覧から選択したサブクラスのサブクラスのリストをユーザーに提示します。マッピング wiki を介してこのようなものを参照することは可能のようですが、SPARQL エンドポイントに直接クエリを実行することをお勧めします。
利用可能なクラスとそれらのクラスのプロパティを返す単純な SPARQL クエリはありますか?
更新:このクエリ を反復することにより、クラス階層を取得する方法を思いつきました:
これは、owl:Thing のサブクラスのリストを返します。owl:Thing をサブクラスの 1 つに置き換えると、そのサブクラスのリストが取得され、サブクラスがなくなるまで続きます。サブクラスがなくなると、すべてのリソースを選択できます。選択されたサブクラスによって与えられる型。ただし、サブクラスに共通のすべてのプロパティを取得する方法はまだよくわかりません。
更新 2 近づいています。このクエリは、国でもあるすべてのプロパティ (dbpedia:property の子) とそのタイトルを取得します。
実際に私が本当に求めたのはこれだけです。私が今やろうとしている最後のことは、それらが表示されるページ数でこれらを並べることです (おそらく、最も一般的なプロパティが最も興味深いものになります)。
frameworks - 新しいマッピングを作成するために独自の DBpedia サーバーをセットアップする
DBpedia のマッピング データベースを拡張したいと考えています。したがって、自分のコンピューターで独自の抽出フレームワーク インスタンスを実行したいと考えています。後者は単純に行われますが、新しく作成されたマッピングをフレームワークに供給する方法がわかりません。
これまでにわかったこと:
- 「config.properties」では、独自のダンプ フォルダーを定義できます。
- 一部の出力ディレクトリも同様に定義できます。しかし、そこには正確に何が保存されているのでしょうか?
- 「Configuration.scala」では、マッピング ページの URL が定義されています。これは、フレームワークが、マッピングを検索する入力として Web ページを想定していることを意味しますか?
私の目標は、プレーン テキスト ファイルでいくつかのマッピングを定義し、抽出フレームワークにこのファイルをすべてのマッピングのソースとして使用するように指示することです。すべてが順調に進んだら、結果を dbpedia チームに提供します。
ご協力いただきありがとうございます!
distinct - SPARQL でいくつかの異なるタグといくつかの異なるタグを選択する
オントロジーの特定のクラスに関連するプロパティのリストを DBPedia に照会しようとしていますが、人間が読める「ラベル」が常に明確であるとは限らないため、データベースからの例も提供したいと思います。問題は、個別のプロパティをすべて選択したいのに、各プロパティの 1 つの例だけが必要なことです。例をキャプチャせずに私のクエリがどのように見えるかを次に示します。
このように変更すると、?prop の値が重複し始めます。
私は SPARQL とデータベース クエリ全般を使用することに非常に慣れていないため、これを行う方法がまったくわかりません。理想的には、DISTINCT(?prop) ?title ?example のようなものを用意します。これは、prop のすべての一意の値を選択し、そのタイトルと例を返します。
sparql - DBpediaとJenaからのSPARQLXMLの結果
DBpediaSPARQLエンドポイントから次のXMLを取得します。
イエナと一緒に読んでスキャンしようとすると、次のようになります。
私は常に次の例外を受け取ります:
これはイエナのバグですか、それとも他に何がありますか?
編集:完全を期すために、私はこのエラーについてのスレッドを報告します:
bio2rdfメーリングリストからの助けがあれば、エラーをもう少し追跡することができました。
Arq2.8.3は正常に動作しますArq2.8.4は説明されたエラーで失敗しますArq2.8.5は説明されたエラーで失敗しますしたがって、テストのためにArt2.8.3を保持すると思います。このエラーをもう少しデバッグするのに役立つかどうか教えてください。
変。エラーはSTaXパーサーから発生しています-すべての基本レベルのXML解析はWoodstoxに委託されています。ほとんどの場合、新しい入力をブロックするのではなく、入力が到着してEOFを確認するよりも速く読み取っています。ストリーム全体を読み取ってから、読み取ったバイトを解析してみましたが、問題なく動作します。2.8.3がなぜ違うのかは、今のところタイミングがわかりません。
回避策:XMLパーサーを次のように切り替えます。
ARQ.getContext()。setTrue(ARQ.useSAX);
QueryExecutionFactory.sparqlServiceAndyを呼び出す前に
random - SPARQLからランダムなDBPediaノードを選択するには?
sparql エンドポイントを使用して DBpedia からランダム サンプルを選択するにはどうすればよいですか?
このクエリ
(ここにあります) は、ほとんどの SPARQL エンドポイントで問題なく動作するようですが、http://dbpedia.org/sparqlではキャッシュされます (したがって、常に同じ 10 ノードが返されます)。
JENA から試すと、次の例外が発生します。
そして、「bif」名前空間が何であるかがわかりません。
これを解決する方法について何か考えはありますか?
ムロン
java - jenaを使用してプロパティ名を指定することにより、dbpediaでプロパティの名前空間を取得するにはどうすればよいですか?
jena http://dbpedia.org/page/Black_Sabbathのsparqlを使用して、次のdbpediaリンクでプロパティジャンルの値を取得しようとしています。
しかし、dbpedia(私の例ではdbpedia-owl .genre)からプロパティの名前空間を取得する方法がわかりません。ハードコーディングしたくありません。誰かが私を助けてくれますか...
どうもありがとう