私はPythonが初めてで、イベント分析をしようとしています。2 つのデータセットがあります。1 つはイベントを含み、もう 1 つはストックデータを含みます。今、私は均等に重み付けされたポートフォリオを構築し、ポートフォリオ構築を毎月「更新」する必要があります。そのため、一貫したデータが必要です (推測します)。つまり、すべての日付について、この分析に含まれるすべての株式の株価が必要です。いいえ、この方法でデータをフィルタリングして、一定期間のすべての株式のデータがある最大の「クラスター」を表示したかったのです。別の方法として、データのあるすべての銘柄と期間を表示してください。皆さんが私の説明を理解してくれることを願っています。
import pandas_datareader as pdr
import pandas as pd
import numpy as np
from sklearn import linear_model
import scipy.stats as st
d = {'Date': ['1.02.2019', '2.02.2019', '3.02.2019', '4.02.2019', '5.02.2019'],
'a': [3.6, 3.4, 4.1, 4.2, 4.3],
'b': ['',2.4, 2.5, 2.6, 2.5],
'c': [2.5, 2.4,'',2.5, 2.5],
'd': [2.3, 2.4, 2.4, 2.5, '']}
df = pd.DataFrame(data=d)
df.set_index('Date')
この場合、2.5.2019 から 5.02.2019 までの a,b または 1.05.2019 から 4.5.2019 までの a,d などのいずれかが返されます。
パンダでこれのためのフォーラムはありますか?
事前にThx