0

他のアイデアも大歓迎です。Pythonを使用して、本質的にギャラリー(または何らかのディレクトリ構造)を表示するjavascript html Webページのxmlを生成して、Excelファイルを取得しようとしています。Excel ファイルはかなり巨大になりますが、時間はそれほど重要ではないと仮定しましょう。

これまでのところ、Excel スプレッドシートのタブ区切りバージョンを XML に変換することができ、すべてのリンクを持っています...あとは、ブラウザを開いてスクリーンショットを撮り、それらを正しい方法でトリミングするか、保存するだけです。 Web コンテンツの特定の部分が何らかの形で....

セレンをWebクローラーとして使用し、autoit executeキーボードコマンドを使用してすべてのWebページを保存することを考えていましたが、さまざまな理由で機能しません(また、非常に遅くなります)。

アイデア?

「スマート クロップ」が行われるのを見た 1 つの例は、焦点を合わせると思われる画面の特定の部分にズームインする Camtasia です。ある程度は使えると思います。繰り返しになりますが、そのような仮定をかなりの精度で行う方法がわかりません。

4

1 に答える 1

1

おそらくpywebkitgtkを使用して HTML をレンダリングし、次にPILを使用して画像を操作できます。

于 2010-01-13T22:49:21.913 に答える