1

最初にスクリーンショットを撮り、OCR を使用して内部のテキストを解析する必要がある Web ページがあります。ズームインすると (Mac: command + '=')、OCR のパフォーマンスが劇的に向上する可能性があります。Pythonでセレンを使用してズームイン/ズームアウトするにはどうすればよいのでしょうか。

同様の投稿がありますが、Java と C# での実装しかありませんが、目標は私のものと同じです。

セレンのズームイン/ズームアウトは、私の考えの1つにすぎません。パフォーマンスを向上させる。実装するにはいくつかの方法があるかもしれないことを知っています。以下は単なる私の考えであり、それらをうまく実装することはできません。それらが機能することを証明してフォントサイズを変更できれば、私も答えとして受け入れます.

  1. ブラウザの設定を変更してから Chrome プロファイルとして保存すると、次回はプロファイルを呼び出すことができ、「ZOOM」設定はプロセス全体で何も触れずに保持されるはずです。ただし、python selenium パッケージは chrome プロファイルのロードをサポートしていないようですが、firefox プロファイルをロードすることはできます。リンク

  2. たぶんスクリーンショットをベクター画像として撮るので、PILなどを使用してフォントサイズを個別に増幅します。

...

投稿と、開始するためのサンプル コードをありがとうございます。

#!/usr/bin/python

from selenium import webdriver

def main():
    browser = webdriver.Chrome()  # Sorry, I have to use Chrome, [chromedriver][3] is required
    browser.set_window_size(1000, 1000)    
    browser.get("https://stackoverflow.com/users/1953475/b-mr-w")

    # Fill in Your Magic Here to Make the Font Size Big!

    browser.get_screenshot_as_file('/tmp/screenshot.png')

if __name__ == '__main__':
    main()
4

1 に答える 1