0

ウィキペディアのページエントリのテンプレートタイプを見つける必要があります。これまで、ウィキペディアへのクエリの結果を解析することに依存してきましたが、これはある程度機能します。

たとえば、 Joel Spolskyを検索すると、正規表現の一致'infobox'を検索して、このページがInfoboxPersonを参照していることがわかります。

しかし、問題は、ウィキペディアのテンプレートタイプに一貫した命名スキームがなく、テンプレートの名前に「infobox」が使用されていないことが多いことです。

たとえば、ピッツバーグスティーラーズを検索した場合、結果からNFLチームテンプレートを抽出する方法を確実に見つけることができません。

ウィキペディアページのテンプレートタイプを照会する方法を知っている人はいますか?ありがとう :)

4

2 に答える 2

1

最も簡単な方法は、テンプレートの代わりにページのカテゴリを確認することです。たとえば、ジョエル スポルスキーには「生きている人々」というカテゴリがあり、ピッツバーグ スティーラーズには「ナショナル フットボール リーグ チーム」というカテゴリがあります。

于 2011-02-07T20:14:30.270 に答える
0

DBpediaが役立つかもしれません。DBpedia は、ウィキペディアから構造化データを抽出し、ダウンロード用に提供して、公的にアクセス可能なデータベースに保存します。たとえば、http://dbpedia.org/sparqlで次のクエリを試してください。

select distinct ?t where {
  ?t a <http://dbpedia.org/ontology/AmericanFootballTeam> .
}

これは、DBpedia が認識しているすべてのアメリカン フットボール チームを RDF 形式で返します。現在、ほぼすべての言語に RDF API が用意されているため、必要なデータを比較的簡単に取得できるはずです。

于 2012-07-09T15:52:35.817 に答える