最近、SO コミュニティから多くの助けを得ることができました。まず、皆さんに感謝の意を表したいと思います。
私の最近の Google スプレッドシートの追求は、指定されたティッカーの最新のファイリングについて sec.gov に照会することです。私はサイトをスクレイピングしようとしているのではなく、企業が SEC に何か新しいものを提出したときに警告できるように、最新の提出書類を取得したいだけです。
現在、importhtml と index を使用して、ティッカーごとにこれを行っています。
index(
importhtml("https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK="&A2&"&owner=include&count=100",
"table",3),2)
... ティッカーはセル A2 にあります。しかし、2500 を超えるティッカーに対して継続的にこれを実行しようとしているため、これは一貫して機能していません。一度に非常に多くの呼び出しがあると、importhtml で問題が発生することに気付きました。
Google Scripts を介してこれを自動化して、毎晩最新のファイリング (または最新の 5 つのファイリングなど) を呼び出せるようにする方法はありますか? 私は Google スクリプトとトリガーに精通していますが、その importhtml 制限を回避する方法と、スプレッドシートを圧倒しないようにスクリプトを最新の ~5 ファイリングのみに制限する方法がわかりません。正しい方向に軽く微調整するだけです。
ありがとうございました!