python - Python/pandas を使用してデータセット内のクラスターまたは一貫した値を見つける

Question

私はPythonが初めてで、イベント分析をしようとしています。2 つのデータセットがあります。1 つはイベントを含み、もう 1 つはストックデータを含みます。今、私は均等に重み付けされたポートフォリオを構築し、ポートフォリオ構築を毎月「更新」する必要があります。そのため、一貫したデータが必要です (推測します)。つまり、すべての日付について、この分析に含まれるすべての株式の株価が必要です。いいえ、この方法でデータをフィルタリングして、一定期間のすべての株式のデータがある最大の「クラスター」を表示したかったのです。別の方法として、データのあるすべての銘柄と期間を表示してください。皆さんが私の説明を理解してくれることを願っています。

import pandas_datareader as pdr
import pandas as pd
import numpy as np
from sklearn import linear_model
import scipy.stats as st
 d = {'Date': ['1.02.2019', '2.02.2019', '3.02.2019', '4.02.2019', '5.02.2019'], 
     'a': [3.6, 3.4, 4.1, 4.2, 4.3], 
     'b': ['',2.4, 2.5, 2.6, 2.5], 
     'c': [2.5, 2.4,'',2.5, 2.5], 
     'd': [2.3, 2.4, 2.4, 2.5, '']}

df = pd.DataFrame(data=d)
df.set_index('Date')

この場合、2.5.2019 から 5.02.2019 までの a,b または 1.05.2019 から 4.5.2019 までの a,d などのいずれかが返されます。

パンダでこれのためのフォーラムはありますか?

事前にThx

python - Python/pandas を使用してデータセット内のクラスターまたは一貫した値を見つける

1 に答える 1

Related

Reference