2

autohotkey と正規表現を使用してテキスト「XX(1119601.1)」のみを取得する必要がある HTML ファイルに次のタグがあります。終了タグはいくつかの改行の後にのみ表示されるため、タグ間のテキストを取得できませんでした。

       <dd class="call_number">
      <!-- holdings allowed -->
    XX(1119601.1)

       </dd>

これに関するヘルプは大歓迎です。

4

1 に答える 1

0
txt =
(Ltrim
    <dd class="call_number">
       <!-- holdings allowed -->
    XX(1119601.1)
    </dd>
)

RegexMatch(txt, "<dd .+?>(.*)</dd>", m)
msgbox % RegexReplace(m1, "<!.+>")

このコードは、最初にタグ内のすべてに一致し (タグ内の文字列のみを一致させるなど、もう少し具体的にすることができます)、次に Html コメントを置き換えます。

RegexReplace を使用して不要な改行を削除することもできます。

編集: 改行を自動的に削除しないように RegexMatch を変更しました。

于 2012-11-01T15:03:45.317 に答える