2

MediaWiki API を使用して、ウィキペディアの記事の画像を検索します。ただし、記事をクリーンアップする必要がある場合のほうきや、クリエイティブ・コモンズ・ライセンスの下に配置するものを示すクリエイティブ・コモンズのロゴなど、役に立たないアイコンもすべて取得します。

どの画像がそのようなアイコンであるかを検出してドロップできるようにする方法はありますか? たとえば、画像が埋め込まれたサイズ (アイコンの場合でも巨大な元の画像のサイズではなく) を照会して、小さいものをすべて削除できるようにする方法があります。とにかく、非常に小さな画像にはあまり興味がありません。

4

1 に答える 1

1

私の知る限り、いいえ。その情報は単にデータベースに保存されないため、API 経由でも利用できません。

おそらくできることには、次のようなものがあります。

  • 記事の HTML マークアップを読み込み (API 経由action=parse、または単に index.php with 経由action=render)、そこから画像サイズを抽出します。

  • 除外する画像のリストを作成するだけです。これはプログラムで行うことができます (たとえば、Category:Wikipedia メンテナンス テンプレートとそのすべてのサブカテゴリに含まれるすべてのテンプレートで使用されているすべての画像を検索する) か、不要な画像を見つけたら除外リストに追加します。

于 2011-11-09T05:57:22.333 に答える