これは R プログラミングの質問ではないことに同意しますが、この質問が (おそらく) クローズされる前に、とにかくいくつかコメントします。
要するに、セクターや市場全体で信頼できるファンダメンタル データを取得することは、たとえお金を使うことができたとしても十分に困難です。米国を見ている場合、いくつかのオプションがありますが、すべての主要な (「比較的信頼できる」と読みます) プロバイダー (FactSet、Bloomberg、Datastream など) は月額数千ドルを必要とします。基本的なデータを処理するために、私は FactSet を好んで使用しています。
一般的に言えば、各プロバイダーが提供する Excel ツールはより成熟しているため、スプレッドシートにデータを入力し、そのデータを R に読み込む方が簡単であることがわかりました。繰り返しになりますが、私は通常、せいぜい数十社のファンダメンタルズを扱っています。 、「既知の」企業のドメインから移動すると、異常をチェックするのにかかる時間が指数関数的に増加するためです。
多くの潜在的な「落とし穴」があります。最も明白なのは、定義がセクターごとに異なることです。たとえば、事業会社の「販売」は、銀行の「販売」とは大きく異なります。もう 1 つの問題は、定義の変更です。ほぼ毎年、何らかの会計規則またはその他の変更があり、データ系列が壊れています。昨年は少数派がここで報告されましたが、今年はこの項目が P&L などの別の位置に移動されました。
もう 1 つの問題は、企業自体の変化です。たとえば、合併、買収、スピンオフにどのように対処しますか? この種のことは、有機的な売上高の成長を測定することをほとんど不可能にする可能性があります. 心に留めておくべきさらに別の点は、営業利益または純利益を扱っている場合は、例外を考慮し、それらを調整するかどうかを検討する必要があるということです。
米国外の企業と取引すると、さらに多くの問題が発生します。もちろん、主要なデータ プロバイダーはグローバルに標準化しようとしています (FactSet Fundamentals など)。これは抽象化の別のレイヤーを追加するだけであり、通常、データがどのように操作されたかを確認するのは困難です。
要するに、データを取得するのは面倒で、信頼できる無料のソースがないことを私は知っています. 非常に均質な企業グループの最も単純な項目を扱っていない限り、たとえデータを持っていたとしても、これはワームの缶詰です。