次の形式のリンクを含むhtmlファイルがあります
<a href="http://www.google.com>Date: 25.02.2013 10:30 Name: Google</a><br>
リンク、日付、時刻、および名前を取得し、それらを CSV 形式 (リンク、日付、時刻、名前) に入れる PowerShell スクリプトを作成しようとしています。
以下はリンクを提供しますが、残りの情報は提供しません。何か不足していますか? 正規表現は機能しますが、名前を探しているときに「名前:」を削除すると便利です。
$input_path = 'C:\temp\myfile.html'
$output_file = 'C:\temp\myfile.csv'
$regex_link = '([a-zA-Z]{4})://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)’
$regex_date = '\d{2}\.\d{2}\.\d{4}'
$regex_time = '\d{2}:\d{2}'
$regex_name = 'Name:\s([\w]*)'
$myVar = select-string -Path $input_path -Pattern $regex_link, $regex_date, $regex_time, $regex_name -AllMatches| % { $_.Matches } | % { $_.Value }
$myVar