0

大量の画像タグを含む約3,600のhtmlファイルがあります。これらのファイルで使用されているすべてのsrc属性値をキャプチャし、それらをテキストファイルに集約して、重複を削除し、全体で一意の画像ファイル名がいくつあるかを確認できるようにしたいと思います。

私はBBEditを使用しており、正規表現と複数ファイル検索を使用してすべての画像参照(18,673)を簡単に見つけることができますが、それらを何かに置き換えたくはありません-代わりに、BBEdit検索結果からそれらをキャプチャしたいです'メモ」を作成し、別のファイルにプッシュします。

これはAppleScriptedできるものですか?それとも、同じ目的のために適切な他の手段がありますか?

4

1 に答える 1

1

あなたが解決しなければならない多くの部分があるので、あなたはそこに背の高い仕事を持っています. 手始めに、1 つの html ファイルを読み取り、すべての src 画像を A​​ppleScript リストに入れるためのアドバイスを次に示します。それ以上のことをしなければなりませんが、これは始まりです。

まず、html ファイルを通常のテキストとして AppleScript に読み込むことができます。このようなものは、1つのhtmlファイルのテキストを取得します...

set theFile to choose file
set htmlText to read theFile

テキストを AppleScript に入力したら、テキスト項目の区切り記号を使用して src 画像を取得できます。これが例です。HTMLコードがどれほど複雑であっても機能するはずです...

set htmlText to "<img src=\"smiley.gif\" alt=\"Smiley face\" height=\"42\" width=\"42\" />
<img src=\"smiley.gif\" alt=\"Smiley face\" height=\"42\" width=\"42\" />
<img src=\"smiley.gif\" alt=\"Smiley face\" height=\"42\" width=\"42\" />"

set text item delimiters to "src=\""
set a to text items of htmlText
if (count of a) is less than 2 then return

set imageList to {}
set text item delimiters to "\""
repeat with i from 2 to count of a
    set thisImage to first text item of (item i of a)
    set end of imageList to thisImage
end repeat

set text item delimiters to ""
return imageList

それが役立つことを願っています!

于 2012-03-14T21:42:12.203 に答える