stats.grok.se ツールは、ウィキペディアの特定のページのページビュー統計を提供します。ウィキペディア API を使用して同じ情報を取得する方法はありますか? ページ ビュー カウンター プロパティの実際の意味は何ですか?
6 に答える
Pageview API は数日前にリリースされました。https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/{project}/{access}/{agent}/{article}/{granularity}/{start}/{end}
- https://wikimedia.org/api/rest_v1/?doc#/
- https://wikitech.wikimedia.org/wiki/Analytics/AQS/Pageview_API
{
"items": [
{
"project": "en.wikipedia",
"article": "Foo",
"granularity": "daily",
"timestamp": "2015101000",
"access": "all-access",
"agent": "all-agents",
"views": 79
},
{
"project": "en.wikipedia",
"article": "Foo",
"granularity": "daily",
"timestamp": "2015101100",
"access": "all-access",
"agent": "all-agents",
"views": 81
}
]
}
いいえ、ありません。
から返されるcounter
プロパティはprop=info
、サーバーからページが表示された回数を示します。ウィキペディアやその他のウィキメディア ウィキでは無効になっています。これは、積極的なイカ/ワニス キャッシングが、そのカウンターに影響を与えるために実際のサーバーに到達するページ ビューのごく一部のみを意味し、そのカウンターを更新するためにデータベースの書き込み負荷が増加するためです。おそらく禁止でしょう。
stats.grok.se ツールは、キャッシュ サーバーからの匿名化されたログを使用してページ ビューを計算します。生のログ ファイルはhttp://dammit.lt/wikistatsから入手できます。stats.grok.se からのデータにアクセスするための API が必要な場合は、stats.grok.se のオペレーターに連絡して作成を依頼する必要があります。
これは 4 年前に書かれたものであり、その後 API が作成されたことに注意してください (この回答を参照してください)。ただし、api.php 経由でアクセスする方法はまだありません。
ここで統計を調べることができます。ページビュー統計を取得するための API を経験した人はいますか? さらに、利用可能な生データも調べましたが、ページビュー カウントを抽出するソリューションが見つかりませんでした。
API はないようです。ただし、stats.grok.se に対して HTTP 要求を行い、HTML または JSON の結果を解析して、ページ ビュー カウントを抽出することができます。
私はウェブサイトhttp://wikipediaviews.orgを作成しました。これは、複数のページを複数の月や年にわたって簡単に比較できるようにするために、まさにそれを行います。処理を高速化し、stats.grok.se へのリクエスト数を最小限に抑えるために、過去のすべてのクエリ結果をローカルに保存しています。
私が使用したコードはhttp://github.com/vipulnaik/wikipediaviewsで入手できます。
実際の取得コードを含むファイルはhttps://github.com/vipulnaik/wikipediaviews/blob/master/backend/pageviewqueries.incにあります
function getpageviewsonline($page, $month, $language)
{
$url = getpageviewsurl($page,$month,$language);
$html = file_get_contents($url);
preg_match('/(?<=\bhas been viewed)\s+\K[^\s]+/',$html,$numberofpageviews);
return $numberofpageviews[0];
}
getpageviewsurl のコードはhttps://github.com/vipulnaik/wikipediaviews/blob/master/backend/stringfunctions.incにあります:
function getpageviewsurl($page,$month,$language)
{
$page = str_replace(" ","_",$page);
$page = str_replace("'","%27",$page);
return "http://stats.grok.se/" . $language . "/" . $month . "/" . $page;
}
PS: wikipediaviews.org へのリンクが機能しない場合は、ごく最近ドメインを登録したことが原因です。当面の間、代わりにhttp://wikipediaviews.subwiki.orgを試してください。
em ..この質問は6年前に尋ねられました。過去に公式サイトにそのような API はありませんでした。
変わった。
簡単な例:
https://en.wikipedia.org/w/api.php?action=query&format=json&prop=pageviews&titles=Buckingham+Palace%7CBank+of+England%7CBritish+Museum
ドキュメントを参照してください:
prop=ページビュー
ページごとのページビュー データ (過去のpvipdays日間ごとの 1 日あたりのページビュー数) を表示します。結果の形式は、ページ タイトル (アンダースコア付き) => 日付 (Ymd) => カウントです。