1

以下は、米国消費者支出調査 (2011 年)のコードブックからの 2 つのサンプル変数の形式です。62.

VARIABLE_NAME VARIABLE_DESCRIPTION Format Note
FEDRFNDX During the past 12 months, what was the total amount of refund received from Federal income tax by ALL CU members?
NUM(8)
FEDTAXX During the past 12 months, what was the total amount PAID for Federal income tax, in addition to that 
withheld from earnings, by ALL CU members?
NUM(8)

ここで、CU は消費者単位 (または世帯) を意味します。Stata データファイルは、FEDRNDX および FEDTAXX 変数の次の形式を示しています。

FEDRFNDX    int     %8.0g
FEDTAXX long        %12.0g

私の質問は、コードブックでは両方とも NUM(8) であり、両方とも amount を参照しているにもかかわらず、これらの変数の Stata 形式が異なる理由です。調査データのエンド ユーザーとして、正しい形式であることをどのように確認できますか (たとえば、上記のようなコードブックが与えられた場合、NUM(8) と変数の開始位置と ASCII データではなく、ステータスデータ)?

この質問が局所的すぎる場合は申し訳ありません。

4

2 に答える 2

3

@Maarten Buisは優れた具体的な答えを出しました。以下のより一般的なコメントは、コメントするには長すぎます。

どの「フォーマット」が Stata にあり、どの「フォーマット」にないかについては、いくつかの誤解の対象となっています。その最大の理由は、コンピューティング全体で「フォーマット」の意味が緩く変化していることにあるかもしれません。理由が何であれ、ここでの特定の意味での形式は、Stata では表示形式のみを指します。変数に関連付けられたフォーマットを変更する主な方法は、formatコマンドを使用することです。そのコマンドのヘルプは、開始するのに適した場所です。

Stata は明らかに、そのデータ型をstorage typesにし、ユーザーにかなり見えるようにし、ストレージ タイプの選択に関してかなりの責任をユーザーに与えることで、多くのユーザーを驚かせています。しかし、ストレージ タイプとフォーマットの間の関連性は、せいぜいゆるいものです。つまり、ストレージ タイプが異なればデフォルト フォーマットも異なります。

Stata でフォーマットを変更しても、保存されているものは変わらないことを理解することが重要です。

中級および/または長期ユーザーの理解のテストは、ここで何が起こっているかを説明できるようにすることです

. set obs 1
obs was 0, now 1

. gen foo = 2000000001

. di %12.0f foo[1]
2000000000

Stata がその大きな整数を四捨五入した (ように見える) のはなぜですか? (手がかり: これはバグではなく、Stata がストレージ タイプに関する暗黙の指示に従っているだけです。)

于 2013-06-16T09:44:59.383 に答える