R を使用して貸借対照表と損益計算書を分析することに興味があります。Yahoo と Google Finance から情報を取得する R パッケージがあることを見てきましたが、私が見たすべての例は過去の株価情報に関するものでした。R を使用して貸借対照表と損益計算書から過去の情報を引き出す方法はありますか?
11 に答える
私はネット上であなたの問題の部分的な解決策しか見つけませんでした。私は1年間の貸借対照表情報と財務諸表だけを取得することができたからです。私はそれをもっと何年も行う方法がわかりません。Rにはquantmodと呼ばれるパッケージがあり、CRANからインストールできます。
install.packages('quantmod')
次に、次のことを実行できます。NYSEにリストされている会社から財務情報を取得したいとします:GeneralElectric。ティッカー:GE
library(quantmod)
getFinancials('GE')
viewFinancials(GE.f)
データフレームとして、毎年報告される損益計算書のみを取得するには、次を使用します。
viewFinancials(GE.f, "IS", "A")
これを何年にもわたって行う方法を見つけたら、私に知らせてください。
あなたが尋ねて答えを得たいと思っている質問は、企業の貸借対照表を分析するための無料の XBRL データをどこで入手できるかということです。R でそのようなデータを使用するためのライブラリはありますか?
XBRL (Extensible Business Reporting Language - http://en.wikipedia.org/wiki/XBRL ) は、会計報告書 (損益計算書、貸借対照表、損益計算書) を XML 形式で簡単にマークアップできるようにするための標準です。コンピュータによって解析され、スプレッドシートに入れられます。
私の知る限り、多くの企業規制当局 (米国の SEC、オーストラリアの ASIC など) は、その管轄下にある企業に対して、そのような形式を使用して報告したり、試験運用を行ったりすることを奨励していますが、それが実際に行われているとは思えません。この時点で義務付けられています。XBRL 形式で自由に利用できる四半期報告書を作成している企業に投資対象を限定した場合 (このデータは投資目的で電子形式であると想定しています)、投資対象の企業のリストはかなり短いものになると思います。
ブルームバーグやロイターなどはいずれも、企業のファンダメンタル データを取得するための高価なフィードを持っています。XBRL 形式で貸借対照表を公開しているきちんとしたビジネスを運営している人もいるかもしれません。XIgnite のxFundamentalsおよびxGlobalFundamentals Web サービスは安価ですが、それでも有料ですが、それらから完全な貸借対照表データを取得することはできません。
「Yahoo または Google のデータへのアクセス」と「Yahoo または Google Finance で見たものはすべてダウンロードできる」というよくある間違いを犯しています。
R 関数が過去の株価データをダウンロードするとき、ほとんどの場合、この目的のために明示的に設計されたインターフェイスにアクセスします。たとえば、指定された銘柄記号と開始日と終了日を指定した csv ファイルを提供する cgi ハンドラーです。したがって、適切なクエリを作成し、Web サーバーにアクセスし、csv ファイルを取得して dparse するだけなので、これは簡単です。
現在、貸借対照表情報は (私の知る限り) そのようなインターフェイスでは利用できません。そのため、「スクリーン スクレイプ」して html を直接解析する必要があります。
R がこれに最適なツールであるかどうかは明らかではありません。Yahoo Finance から非時系列データを取得する目的で Perl モジュールがいくつかあることは知っていますが、使用したことはありません。
最後の 2 つのコメントを考慮すると、EdgardOnline を使用すると経済的に企業の財務諸表を取得できる可能性があります。無料ではありませんが、Bloomberg や Reuters よりも安価です。考慮すべきもう1つのことは、財務報告の正規化/標準化です。同じ業界で似たような製品を販売している 2 つの企業があるからといって、2 つの企業の損益計算書または貸借対照表を並べると、それらの報告項目が必ずしも一致するわけではありません。Compustat は、財務報告を正規化/標準化しています。
私はあなたが望むことをすると思う C# プログラムを書きました。nasdaq.com ページからの html を解析します。HTML を解析し、株式の年数に応じて 5 ~ 10 年前の損益計算書、キャッシュ フロー、貸借対照表の値を含む株式ごとに 1 つの csv ファイルを作成します。現在、いくつかの分析計算を追加する作業を行っています (この時点ではほとんどが過去の比率です)。R について学ぶことに興味があり、ファンダメンタルズ分析への応用に興味があります。お互いに助け合うことができるかもしれません。
私は R について何も知りませんが、REST API を呼び出して XML 形式でデータを消費できると仮定すると、http: //www.mergent.com/servius/ で Mergent Company Fundamentals API を試すことができます。非常に詳細な財務諸表データ (貸借対照表 / 損益計算書 / キャッシュフロー計算書 / 比率)、企業間で標準化され、20 年以上さかのぼる
私は実際にこれをGoogleスプレッドシートで行います。それを行うのが最も簡単な方法でもあると思いました。実際のライブ データを取得できるため、もう 1 つのボーナス ポイントでした。最後に、これらのステートメントを保存するためにスペースを消費することはありません。
=importhtml(" http://investing.money.msn.com/investments/stock-income-statement/?symbol=US%3A "&B1&"&stmtView=Ann", "table",0)
ここで、B1 セルにはティッカーが含まれています。
貸借対照表とキャッシュフローについても同じことができます。