出生証明書情報の大量のデータセットを生の DAT ファイルから Stata DTA に変換しています。国立経済研究所が作成したデータ辞書を持っており、他の年の同様のファイルをうまく入力できました。
ただし、この特定のファイルで入力プログラムを実行すると、エラーが発生します
記録が長すぎる
出力データセットには、レコードの ~14% がありません。ディスクに出力用の十分なスペースがあります。この一見逆説的なエラーは何を意味するのでしょうか?
出生証明書情報の大量のデータセットを生の DAT ファイルから Stata DTA に変換しています。国立経済研究所が作成したデータ辞書を持っており、他の年の同様のファイルをうまく入力できました。
ただし、この特定のファイルで入力プログラムを実行すると、エラーが発生します
記録が長すぎる
出力データセットには、レコードの ~14% がありません。ディスクに出力用の十分なスペースがあります。この一見逆説的なエラーは何を意味するのでしょうか?
この Stata エラーに関するオンライン ドキュメントをほとんど見つけることができなかったという理由だけで、これを投稿して回答することにしました。
私の場合、それは実際には簡単な修正でした。生データは zip ファイルに含まれています。もう一度生データを解凍したところ、元のファイルが作業中の生ファイルよりも約 1GB 大きく、14% が不足していることがわかりました。切り捨ての原因となった解凍エラーが何であれ、おそらくレコードの途中で切り捨てられたため、入力プログラムを実行したときにStataが「レコードが長すぎます」というエラーを生成しました。