Excel ファイルに 2 つのワークシートがあります。
企業
A B C D E
1 COMPANY SECTOR VAR_1 VAR_2 VAR_3
2 Sony Tech 2.40 no
3 Ikea Home 7 1.44 yes
4 ING Bank 5 0 yes
5 BofA Bank 0 no
6 Google Tech 0 yes
7 Staples Home 5.24 no
8 Trump Ego 5 9.99 yes
9 ABN Bank 2.64 no
このシートには、数VAR
千の企業の数百の が含まれています。多くの欠損値があります (空のセルは欠損値であり、0
実際には観測された値です)。それぞれの観測値の数を知る必要がありますVAR
。(1) 観測数の全体数と (2) 銀行部門の企業の観測数が必要です。以下のシートでは、(1) は列B
、(2) は列C
:
変数
A B C
1 VARIABLE TOTAL BANK
2 VAR_1 4 2
3 VAR_2 7 2
4
5 Some random comment...
6
7 VAR_3 8 3
VAR_1
例として挙げてみましょう。companies
シートを見ると、この変数には 4 つの観測値 ( 7
、5
、0
および5
) があります。銀行だけを見ると( ING とBofA のSECTOR == 'Bank')
2 つの観測値があります)。5
0
シートでは、異なる変数の間にコメントがある可能性がvariables
あります (ただし、 in column にはありませんA
。この列は変数名を保持するか、空です)。また、変数の順序が同じでない場合もあります。だから、companies
言うことができます
... GH GI GJ
1 VAR_40 VAR_41 VAR_42
その中variables
で言います
A
...
60 VAR_40
61 VAR_42
62 VAR_41
variables
私の質問は次のとおりです。列B
と列の観測数を計算できる式は何C
ですか? どんな助けでも大歓迎です。