私はデータ分析のためにpython + pandasを学んでいます。いくつかの投資アイデアを演習としてプログラムしようとしています。pandas には、Yahoo や Google などのオンライン ソースからデータを取得するための io.data モジュールがあります。ただし、data.py の次のコードで指定されているように、すべて開始日が必要です。デフォルトでは「2010.01.01」です。
http://github.com/pydata/pandas/blob/master/pandas/io/data.py :
def _sanitize_dates(start, end):
from pandas.core.datetools import to_datetime
start = to_datetime(start)
end = to_datetime(end)
if start is None:
start = dt.datetime(2010, 1, 1)
if end is None:
end = dt.datetime.today()
return start, end
過去のすべての株式が異なる日付で IPO されたため、ティッカーごとに特定することは非常に困難です。すべてのデータを読み取るように pandas を設定するオプションがあればいいと思いませんか? 50 年の歴史を持つ上場企業であっても、データはわずか 50*200 = 10,000 行です。Pythonはそれを処理するのに問題ないはずですよね?
ご協力ありがとうございました。そして、ウェスと他のパンダの貢献者に敬意を表します。パンダ最高!