2

HIMYM と TBBT の最後のエピソードのタイトルと放送日を表示する個人的な TV ガイドのようなものを作ろうとしています。

この情報のリソースとして、ウィキペディアを使用することにしました。ウィキペディアには独自の API があることは知っており、かなり長い間ドキュメントを調べてきましたが、非常に広範で、どこから始めればよいかわかりません。ここまでで、次の URL を照会するところまで来ました。

http://en.wikipedia.org/w/api.php?action=query&title=List_of_How_I_Met_Your_Mother_episodes&prop=info&format=dbg

次の配列を受け取ります。

array (
  'query' => 
  array (
    'pages' => 
    array (
      6048517 => 
      array (
        'pageid' => 6048517,
        'ns' => 0,
        'title' => 'List of How I Met Your Mother episodes',
        'touched' => '2011-01-25T15:33:45Z',
        'lastrevid' => 409077359,
        'counter' => 0,
        'length' => 4417,
      ),
    ),
  ),
)

問題は、私が探している実際のデータに到達する方法がわからないことです:/誰かがウィキペディア API にもう少し経験があり、この問題を解決してくれるかもしれません。ありがとう

4

1 に答える 1

3

MediaWiki API は、MediaWiki の種類の情報へのアクセスのみを許可することに注意してください。Wiki は、ある種のテキストページの集まりです。MediaWiki ソフトウェアがウィキペディアに情報を保存する方法には、継承セマンティックはありません。すべては、特別なテキストベースのフォーマットで行われます。

したがって、ウィキペディアで何かに関する一般的で一貫した情報が見つかったとしても、それはソフトウェアがそれを行ったからではなく、作成者がデータを表示するための共通の基準を決めたからです。そのため、wiki から実際のセマンティックを取得するには、自分で情報を解析する必要があります。MediaWiki API を使用して、ソフトウェアが記事用に保存している正確なテキスト表現を取得し、テキストから探している情報を解析できます。もちろん、これには、特定の情報が通常どこどのように表示されるかを知っている必要があります。もちろん、常に、またはテストするすべてのページで機能するという保証はありません。

于 2011-01-25T21:27:33.233 に答える