問題タブ [edgar]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2014 参照

python - 10-k から製品説明を抽出する

修士論文の 10-k レポートから製品の説明を抽出したいと考えています (プログラミングの初心者、金融のバックグラウンド)。この商品説明は、レポートの「ITEM 1」と「ITEM 2」の間にあります。私がこれまでに行ったことは、すべての 10-ks を .txt 形式でダウンロードし、html タグを削除して、すべてのテキストを大文字にすることでした。私の問題は、必要なテキストを選択して別のディレクトリに保存しようとするときです。自分で選んでみましたが、満足のいく結果ではありませんでした。現在、GitHub で「iammrhelo」という男が作成したコードを使用しています。彼のコードは「ITEM 7」から「ITEM 8」を選択するためのものです。少し微調整して、必要なものを検索できるようにしました。彼のコードへのリンク: https://github.com/iammrhelo/edgar-10k-mda

私の問題は、解析がすべての 10-ks に対して機能しないことです。この 10k で製品の説明を選択するために機能します。

写真: コードが解析できる 10k

画像: コードが解析できない 10k

少しコンテキストを与えるために、コードが探す必要がある正しい構文を見つける必要があります。探している構文はリスト item1_begins にあります。テキストを選択するために使用しているコードは次のとおりです。

0 投票する
2 に答える
6501 参照

python - Beautiful Soup を使用して SEC の Edgar データベースをスクレイピングし、Desire データを受け取る方法

長い質問を事前にお詫びします-私はPythonが初めてで、かなり具体的な状況でできる限り明確にしようとしています。

定期的に SEC ファイリングから特定のデータ ポイントを特定しようとしていますが、会社の CIK ID とフォーム ファイリングを手動で検索する代わりに、これを自動化したいと考えています。これまでのところ、特定の期間に SEC が受け取ったすべてのファイリングに関するメタデータをダウンロードするところまで来ました。次のようになります。

このすべての情報があり、これらのテキスト ファイルをダウンロードして基になるデータを表示できるにもかかわらず、このデータは xbrl 形式であり、私の操舵室から少し外れているため、解析できません。代わりに、このスクリプトに出くわしました (このサイトhttps://www.codeproject.com/Articles/1227765/Parsing-XBRL-with-Pythonから親切に提供されました):

このスクリプトを実行するだけで、思いどおりに動作します。特定の会社 (この場合は IBM) の株主資本が返され、その値を取得して Excel ファイルに書き込むことができます。

私の2部構成の質問はこれです:

  1. 上記の元のメタデータ テーブルから関連する 3 つの列 (CIK、型、および日付) を取り出し、それをタプルのリストに書き込みました。 '20190215'),('1009891', 'D', '20190206'),...])。このデータを取得し、見つけたスクリプトの最初の部分を置き換え、それを効率的にループして、最終的に各企業、提出物、および日付の目的の値のリストを作成するにはどうすればよいでしょうか?
  2. これを行うためのより良い方法は一般的にありますか?関心のあるデータを照会するために、ある種の API または Python パッケージがあると思います。フォーム 10-K およびフォーム 10-Q に関する高レベルの情報がいくつかあることは知っていますが、フォームにいますややあいまいなDs。可能な限り最善の解決策に時間を効果的に費やしていることを確認したいだけです.

お手伝いありがとう!