4

HTML ファイル内の 2 つの HTML タグの間の文字列を取り出す Powershell スクリプトを作成しようとしています。値がどうなるかはわかりませんが、どのタグを検索する必要があるかはわかります。さらに、タグが常に行の先頭にあるとは限らないことも知っています(つまり、テキスト行の途中にある場合もあります)。最後に、タグとそれらの間の文字列が改行されないことも知っています。

変数に格納されているファイルのパスがあります

$filePath = "C:\Path\file.html"

<h6>との間の値を見つけて</h6>、それらの値を配列に格納しようとしています。

4

1 に答える 1

2

試す

$myarray = gc $filepath | 
% { [regex]::matches( $_ , '(?<=<h6>\s+)(.*?)(?=\s+</h6>)' ) } | 
select -expa value

これにより、先頭と末尾のスペースがあれば削除されます。このスペースも必要な場合\s+は、正規表現パターンから削除します

于 2013-02-14T13:21:40.110 に答える