autohotkey と正規表現を使用してテキスト「XX(1119601.1)」のみを取得する必要がある HTML ファイルに次のタグがあります。終了タグはいくつかの改行の後にのみ表示されるため、タグ間のテキストを取得できませんでした。
<dd class="call_number">
<!-- holdings allowed -->
XX(1119601.1)
</dd>
これに関するヘルプは大歓迎です。
autohotkey と正規表現を使用してテキスト「XX(1119601.1)」のみを取得する必要がある HTML ファイルに次のタグがあります。終了タグはいくつかの改行の後にのみ表示されるため、タグ間のテキストを取得できませんでした。
<dd class="call_number">
<!-- holdings allowed -->
XX(1119601.1)
</dd>
これに関するヘルプは大歓迎です。
txt =
(Ltrim
<dd class="call_number">
<!-- holdings allowed -->
XX(1119601.1)
</dd>
)
RegexMatch(txt, "<dd .+?>(.*)</dd>", m)
msgbox % RegexReplace(m1, "<!.+>")
このコードは、最初にタグ内のすべてに一致し (タグ内の文字列のみを一致させるなど、もう少し具体的にすることができます)、次に Html コメントを置き換えます。
RegexReplace を使用して不要な改行を削除することもできます。
編集: 改行を自動的に削除しないように RegexMatch を変更しました。