1

Excel ファイルに 2 つのワークシートがあります。

企業

  A       B      C     D     E
1 COMPANY SECTOR VAR_1 VAR_2 VAR_3
2 Sony    Tech         2.40  no
3 Ikea    Home   7     1.44  yes
4 ING     Bank   5        0  yes
5 BofA    Bank   0           no
6 Google  Tech            0  yes
7 Staples Home         5.24  no
8 Trump   Ego    5     9.99  yes
9 ABN     Bank         2.64  no

このシートには、数VAR千の企業の数百の が含まれています。多くの欠損値があります (空のセルは欠損値であり、0実際には観測された値です)。それぞれの観測値の数を知る必要がありますVAR。(1) 観測数の全体数と (2) 銀行部門の企業の観測数が必要です。以下のシートでは、(1) は列B、(2) は列C:

変数

   A       B     C
1 VARIABLE TOTAL BANK
2 VAR_1    4     2  
3 VAR_2    7     2
4
5          Some random comment...
6
7 VAR_3    8     3

VAR_1例として挙げてみましょう。companiesシートを見ると、この変数には 4 つの観測値 ( 750および5) があります。銀行だけを見ると( ING とBofA のSECTOR == 'Bank')2 つの観測値があります)。50

シートでは、異なる変数の間にコメントがある可能性がvariablesあります (ただし、 in column にはありませんA。この列は変数名を保持するか、空です)。また、変数の順序が同じでない場合もあります。だから、companies言うことができます

  ... GH     GI     GJ
1     VAR_40 VAR_41 VAR_42

その中variablesで言います

    A
...
60  VAR_40
61  VAR_42
62  VAR_41

variables私の質問は次のとおりです。列Bと列の観測数を計算できる式は何Cですか? どんな助けでも大歓迎です。

4

1 に答える 1