問題タブ [multilevel-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - マルチインデックス (行) の最も外側のレベルで合計するにはどうすればよいですか?
マルチインデックスの最も外側のレベルで合計する方法を見つけようとしています。したがって、個々のオペレーターと、リストされているすべてのショップに基づいて COUNTS 列を合計したいと思います。
df.sum 呼び出しを使用すると、両方のレベルで呼び出すことができますが、df.sum(axis=0, level=['OPERATOR']) に変更すると、パーセンテージ列が NaN になります。私はもともとカウント列を int として持っていたので、おそらくそれが問題だと思い、float に変換しましたが、これは問題を解決しませんでした.これは望ましい出力です:
(これは、オペレーターごとに各ショップのパーセンテージを計算するための足がかりにすぎません。つまり、最終的な最終出力は次のようになります):
その最後のステップも含めればボーナスポイント!! 私を助けてください!!!
cluster-analysis - クラスタリングの同質性は、異なる変数に関連しています
私は、2000 年から 2020 年までの 1 年ごとに、いくつかの株式 (列 2: vardep) の 5 つの変数 (Mkt、SMB、HML、RMW、および CMA) の値を持っている次のデータ (クラスター data.xsls) を使用しています。 :
そのデータの年間クラスターを構築する必要があります。次に、vardep をインデックスとして使用するために、最初に各年のデータを分割します (この例では 2000 年から 2005 年のデータのみを使用します)。
私が使用するクラスタリング方法は k-means です。次に、適切なクラスター数を決定するために誤差曲線の屈曲部を評価した後、毎年 3 つのクラスターを使用することに決め、次のようにクラスター化を実行します。
私が本当に必要としているのは、これらのクラスターの均一性を、問題のすべてのシェアの新しい変数に関して評価することです。その変数は売上高の伸びであり、すべての株の年間価値は、ここで「fundamental_comparison」として見つけることができます。
その正確な変数に関して、同じクラスター内のシェアと異なるクラスター間のシェアの違いを知りたいです。この論文の 12 ページで、マルチレベル モデルが使用されている可能性のあるヘルプを見つけましたが、私の場合は使用できませんでした。私のクラスターでその均一性を時間内にテストする方法を知っている人がいるかどうか、または論文の説明を適用するための適切なコードを実行するのを手伝ってくれるかどうかを知りたい.
初心者ですので、よろしくお願いします。