0

一部の性犯罪者に関する情報を収集するための curl スクリプトを作成しています。以下のようなリンクを取得するスクリプトを開発しました。

http://criminaljustice.state.ny.us/cgi/internet/nsor/... (切り抜き URL)

このリンクに移動すると、このページのすべてのフィールドの下にある、犯罪者 ID:、姓などの情報を独自の変数に取得したいと考えています。私は正規表現が非常に苦手なので、ここにいます。それとも別の方法がありますか?

誰かがそれをするのを手伝ってくれますか?

4

3 に答える 3

1

正規表現は必要ありません ( Can you provide some examples of why it is hard to parse XML and HTML with a regex?参照してください)。 PHP 用の HTML パーサーを探してください。好きなパーサー?

于 2009-04-30T21:46:23.647 に答える
0

私は、RegEx がこの仕事に適したツールではないという以前のポスターに同意する傾向があります。手早く汚い表現が必要な場合は、次のようになります。

Offender Id:.*
.* [0-9]*

注: この式には改行を含める必要があります。また、解析しているソースが大幅に変更されると壊れてしまうため、これは非常に壊れやすいことに注意してください。

于 2009-04-30T21:58:08.563 に答える