1

消費者金融保護局 (CFPB) を Python 3.4 の Pandas データ フレームにロードしようとしています。私のコードは機能しますが、SODA API では 1,000 行に制限されているようです。アプリ トークンを使用し、ここで URL を参照しています

df = pd.read_json('http://data.consumerfinance.gov/resource/x94z-ydhh.json?$$app_token=XXXXXXXXXXXXXXXX')

データ構造は完璧ですが、データは 1,000 行に制限されています (データは 300,000 行近くあるはずです)。

ブラウザーを介して (アプリ トークンを使用して) 同じ URL にアクセスすると、1,000 行しか取り込まないように見えます。アプリ トークンを使用すると、データ セット全体にアクセスできるという印象を受けましたが、それは正しくありませんか?

4

1 に答える 1

7

パラメータのドキュメントを確認してください$limit

$limit パラメーターは、返される行の総数を制御し、既定では、要求ごとに 1,000 レコードに設定されます。

注: $limit の最大値は 50,000 レコードです。この制限を超えると、400 Bad Request 応答が返されます。

したがって、デフォルトの数のレコードが返されます。

1 回のAPI 呼び出しで 300,000 レコードすべてを取得することはできません$limit$offset

試す:

http://data.consumerfinance.gov/resource/x94z-ydhh.json?$limit=50000&$$app_token=XXXXXXXXXXXXXXXX
于 2015-06-19T17:29:25.300 に答える