他のアイデアも大歓迎です。Pythonを使用して、本質的にギャラリー(または何らかのディレクトリ構造)を表示するjavascript html Webページのxmlを生成して、Excelファイルを取得しようとしています。Excel ファイルはかなり巨大になりますが、時間はそれほど重要ではないと仮定しましょう。
これまでのところ、Excel スプレッドシートのタブ区切りバージョンを XML に変換することができ、すべてのリンクを持っています...あとは、ブラウザを開いてスクリーンショットを撮り、それらを正しい方法でトリミングするか、保存するだけです。 Web コンテンツの特定の部分が何らかの形で....
セレンをWebクローラーとして使用し、autoit executeキーボードコマンドを使用してすべてのWebページを保存することを考えていましたが、さまざまな理由で機能しません(また、非常に遅くなります)。
アイデア?
「スマート クロップ」が行われるのを見た 1 つの例は、焦点を合わせると思われる画面の特定の部分にズームインする Camtasia です。ある程度は使えると思います。繰り返しになりますが、そのような仮定をかなりの精度で行う方法がわかりません。