1

Webページから情報を収集しなければならない状況があります。HTMLテーブルのカプセル化されたtdタグを抽出する必要があります

この特定の状況では、このプロセスを実行するために使用できるのはPowerShellだけです。

PowerShellのみを使用してこれを行う簡単な方法はありますか?

4

2 に答える 2

2

私はあなたが主なオプションをしなければならないと思います:

  1. 正規表現を使用します。
  2. DOMを使用します。

両方を行う方法は次のとおりです。

正規表現:

$data = (new-object System.Net.WebClient).DownloadString('http://www.amazon.com')
[regex]::Matches($data, '<td.*?>(.+)</td>') | % {$_.Captures[0].Groups[1].value}

DOM:

$ie = new-object -com InternetExplorer.Application
$ie.Navigate('http://www.amazon.com')
$ie.Document.getElementsByTagName('td')
于 2012-04-27T21:53:42.863 に答える
0
$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("<app url>")
$doc = $ie.Document
$doc.getElementByID("<some id>")

詳細については、こちらをお読みください-http://msdn.microsoft.com/en-us/magazine/cc337896.aspx

お役に立てれば。

于 2012-04-27T20:37:22.763 に答える