0

プロパティ dbpedia-owl:abstract でいくつかの html フラグメントを認識することがあります。

これはhttp://dbpedia.org/page/Albizia_julibrissinの例で、英語の要約でいくつかの html フラグメント (強調) が表示されます。

このページは、Antonio Durazzini によって記述されたツリーに関するものです。ジョン・ギルバート・ベイカーは、ウィリアム・ロックスバーグのミモザ・カルコラであるプレインのアルビジア・カルコラを指すのに同じ学名を使用した.colspan=2 style="text-align: center; background-color: transparent; text-align:center; border: 1px solid red;" | | ペルシャの絹の木 ファイル:セヴァストポリ 1 の Albizzia julibrissin.jpg 生息地の保存状況 未評価 colspan=2 style="text-align: center; background-color: transparent; text-align:center; border: 1px solid red;" | | 科学的分類 界: 植物 (ランクなし): 被子植物 (ランクなし): Eudicots (ランクなし): Rosids 目: ファバレス 家族: マメ科 属: アルビジア 種: A. julibrissin colspan=2 style="text-align: center; background-color:透明; text-align:center; 境界線: 1px 単色の赤;" | | 二項名 Albizia julibrissin colspan=2 style="text-align: center; background-color: transparent; text-align:center; border: 1px solid red;" | | 同義語 多く、テキストを参照Albizia julibrissin は、Albizia 属のマメ科植物の一種で、南西および東アジア、ペルシャ東部から中国および韓国まで原産です。「ミモザ」や「ペルシャの絹の木」としても広く知られています。この属は、18 世紀半ばにそれをヨーロッパに導入した有名なフィレンツェのアルビッツィ家に属するイタリアの貴族フィリッポ デッリ アルビッツィにちなんで名付けられました。種小名のジュリブリシンは、ペルシア語で「絹の花」を意味する gul-i abrisham (گل ابریشم) が転じたものである (gul گل 「花」 + abrisham ابریشم 「絹」から)。

抽象プロパティが人間が判読できるように、これらのフラグメントを削除/抽出する方法はありますか?

4

1 に答える 1

0

これは、データ入力 dbpedia の問題です。ヘッダー

「このページは、アントニオ・デュラッツィーニによって説明された木に関するものです。ジョン・ギルバート・ベイカーは、ウィリアム・ロクスバーグのミモザ・カコラであるプレーンのアルビジア・カコラを参照するために同じ学名を使用しました。」

通常、プロパティ dbpedia-owl : abstract には関連付けられていません。

DBpedia SPARQL エンドポイントから、SPARQL 1.1 ソリューションは次のとおりです。

select distinct ?clean_abstract 
where {
  <http://dbpedia.org/resource/Albizia_julibrissin> <http://dbpedia.org/ontology/abstract> ?abstract.
  filter (lang(?abstract) = 'en')
  bind (strafter(?abstract,"see text ") as ?clean_abstract)
}

そして、このヘッダーを含む別のソリューション (ただし、このプロパティにリンクするべきではありません):

select distinct ?clean_abstract 
where {
  <http://dbpedia.org/resource/Albizia_julibrissin> <http://dbpedia.org/ontology/abstract> ?abstract.
  filter (lang(?abstract) = 'en')
  bind (concat(strbefore(?abstract,"colspan="), strafter(?abstract,"see text ")) as ?clean_abstract)
}
于 2013-06-15T07:58:15.320 に答える