0

私は今、自分のAppleScriptに取り組んでいて、ここで立ち往生しています。このスニペットをhtmlコードの例として取り上げましょう。

<body><div>Apple don't behave accordingly <a href = "http://apple.com>apple</a></div></body>

今必要なのは、htmlタグなしで単語を返すことです。すべてが含まれている角かっこを削除するか、htmlをプレーンテキストに再フォーマットする他の方法があります。

結果は次のようになります。

アップルはそれに応じて動作しませんアップル

4

3 に答える 3

1

私が抱えていた問題のために、私は余分な答えを追加すると思いました。UTF-8文字が失われないようにする場合は、次のものが必要です。

set plain_text to do shell script "echo " & quoted form of ("<!DOCTYPE HTML PUBLIC><meta charset=\"UTF-8\">" & html_string) & space & "| textutil  -convert txt  -stdin -stdout"

基本的に、<meta charset=\"UTF-8\">textutilがこれをutf-8ドキュメントとして認識できるように、メタタグを追加する必要があります。

于 2015-11-18T04:39:53.910 に答える
0
on findStrings(these_strings, search_string)
    set the foundList to {}
    repeat with this_string in these_strings
        considering case
            if the search_string contains this_string then set the end of the foundList to this_string
        end considering
    end repeat
    return the foundList
end findStrings

findStrings({"List","Of","Strings","To","find..."}, "...in String to search")
于 2011-08-25T01:47:09.753 に答える
0

textutilを使用してみませんか?

on run -- example (don't forget to escape quotes)
    removeMarkup from "<body><div>Apple don't behave accordingly <a href = \"http://apple.com\">apple</a></div></body>"
end run

to removeMarkup from someText -- strip HTML using textutil
    set someText to quoted form of ("<!DOCTYPE HTML PUBLIC>" & someText) -- fake a HTML document header
    return (do shell script "echo " & someText & " | /usr/bin/textutil -stdin -convert txt -stdout") -- strip HTML
end removeMarkup
于 2011-08-25T03:08:26.360 に答える