0

リモート PDF ファイルにリンクしている URL が約 1000 個あり、Safari で検索できるものとそうでないものを判断する必要があります。スクリプトをループさせて Safari で URL を開いていますが、以下の最後の 2 つの手順で行き詰まっています。

誰か助けてくれませんか?ありがとう

スクリプトは次のことを行う必要があります。

各 URL について:

サファリに言う

  1. 指定された URL (この場合はリモート PDF) を開く
  2. Apple Fではなく、右クリックでポップアップする検索を使用して、文字「a」のPDFを検索します ここに画像の説明を入力

  3. 検索結果をファイルに書き込む

      set urlList to {"http://pricelist.list.com/pricelists/A/AEA_11-15-12.pdf", "http://pricelist.list.com/pricelists/A/API_1608_04-05-13.pdf", "http://pricelist.list.com/pricelists/A/Access_02-01-12.pdf", "http://pricelist.list.com/pricelists/A/Allparts_Retail_01-01-11.pdf"}
       set numURLs to (count urlList)
       repeat with i from 1 to (numURLs)
    
    set theURL to (item i of urlList)
    tell application "Safari"
        open location theURL
        activate
        --Perform search
        --Write results to file
    end tell
    tell application "System Events"
        tell process "Safari"
            click menu item "Close Other Tabs" of menu "File" of menu bar 1
        end tell
    end tell
    delay 5
    

    リピート終了

4

1 に答える 1

0

PDF をダウンロードしてシェル スクリプトを使用する方が簡単な場合があります。

brew install poppler wget parallel
cat ~/Documents/urls.txt | parallel -P8 wget
for f in *.pdf; do [[ $(pdffonts -- "$f" 2> /dev/null | wc -l) -eq 2 ]] && printf %s\\n "$f"; done

pdffonts は、フォントが埋め込まれていないスキャンされた PDF の出力を 2 行印刷します。PDF が検索可能かどうかをプログラムで判断するにはどうすればよいですか? を参照してください。.

于 2013-05-17T15:00:35.147 に答える