2

私は、APIを使用してウィキペディアから本の作家のリストを取得するために本当に一生懸命努力してきました。私のウェブサイトのユーザーに、彼らが好きな作家を示す能力を与えたいと思います。同じ作家が好きな他の人に見せるために、私は彼らに可能な作家を示す自動完了/提案テキストボックスを作成するのは良い考えだと思いました(後で、3文字を入力するとしましょう)。このようにして、スペルの問題が回避され、ユーザーを照合するために使用できるpageIdを保存することもできます。

コーディングは問題ではありません!問題は、正しいクエリを作成することです。いくつかのアプローチを試しましたが、欲しいものが得られません。この種のことを行う方法を示す例もほとんどありません。

私が欲しいもの:

  • ページのタイトルを返します
  • ページのみ(カテゴリ、リビジョンなどはありません)
  • 人々に関するページ、または可能であれば作家(国籍は重要ではありません)
  • タイトルのみで検索

そして可能であれば:

  • ページ上のテキストの少し(これはウィキペディアでしか入手できないと思いますか?)
  • ページへのURL
  • 生年月日、および適切な場合は死亡日

これが可能かどうかはわかりません。

4

1 に答える 1

0

ウィキペディアのデータのクエリは、現在、構造化されたデータの対応物であるウィキデータを介して行われます。https://www.wikidata.org/wiki/Wikidata:Data_access

たとえば、WDQを使用して、「being」または「having profession of」「writer」としてマークされたアイテムのリストを取得できます。http://tools.wmflabs.org/autolist/autolist1.html?q = tree%5B36180 %5D%5B%5D%5B31%2C106%5D(60kの結果)。

または、そのすべてのサブクラス(詩人など)も含めます:http ://tools.wmflabs.org/autolist/autolist1.html?q = tree%5B36180%5D%5B%5D%5B31%2C106%2C279%5D (gets 200kの結果で少し厄介ですが、フィルタリングが必要になります)。

于 2015-07-25T17:15:53.927 に答える