3

特定の言語セットの github リポジトリの数を取得することに興味があります (可能であれば履歴データを使用して)。

自分で統計の収集を開始しようとしたのは次のとおりです。

  1. 次のようなページのスクリーンスクレイピング:

https://github.com/search?q=language%3Aperl&type=&ref=simplesearch

  1. github API を使用する:

https://api.github.com/legacy/repos/search/KEYWORD?language=perl

残念ながら、結果を得るには KEYWORD が必要なようです。また、各レポのメタデータではなく、カウントのみが必要です。

過去のデータにも興味がありますが、それらの統計はすでにどこかで入手できるようです。

言語および/または履歴データごとにレポ数を取得するためのより良い方法に関するアイデアはありますか?

4

1 に答える 1

4

これを試すことができます: https://api.github.com/search/repositories?q=language:Python

また、github アーカイブを照会することもできます。大きなクエリ インターフェースを使用すると、クエリは次のようになります。

bq query 'SELECT repository_language, count(repository_language) as pushes
FROM [githubarchive:github.timeline]
WHERE type="CreateEvent" and repository_fork == "false"
GROUP BY repository_language
ORDER BY pushes DESC'

このクエリは、言語ごとのリポジトリ数の統計を生成します。

于 2014-04-12T00:07:32.563 に答える