ブラウザのディスプレイからコピーして後で解析するかのように、表示されているWebページのコンテンツまたはテキストをキャプチャする方法はありますか(正規表現などを使用して)?htmlタグ、javascriptなどをクリーンアップするつもりはなく、残りのテキストのみを表示します。一部のスタイル要素は、ブラウザに表示されたときに一部のhtmlテキストを非表示にし、他の要素を表示する可能性があるため、表示されているすべてのテキストをコピーしたいと思います。これまで、運が悪かったので、nltk、lxml Cleaner、およびseleniumを調べてきました。たぶん私はセレンでスクリーンショットをキャプチャし、ocrを使用してテキストを抽出することができますが、それはコンピュータを集中的に使用するようですか?助けてくれてありがとう!