3

Yahoo!でふざけています。パイプと正規表現で壁にぶつかっています。今では Perl の正規表現には慣れていますが、Yahoo! ではルールが異なるようです。パイプ。

私のパイプのスクリーンショット

私がやっていることは、ページを取得してそれをフィードに変換しようとしていることです.HTMLからリンクを取り除くための私の正規表現はうまくいきますが、<i>タグにあったものにしたいタイトルは元のテキストを出力するだけです. .

Perl とこのオンライン正規表現テスターで一致するサンプル テキスト:

<a rel="nofollow" target="_blank" HREF="http://changed.to/protect/the-guilty.html"><i>"Fee Fi Fo Fun" (イギリス人男性)</i>< /a> (この他のサイト <a rel="nofollow" target="_blank" href="http://stackoverflow.com">Nada</a> も参照してください) ここに他のテキストがあります

4

2 に答える 2

6

タイトルの正規表現:

(?i).*?<i>([^<]*).*               [ ] g  [x] s  [ ] m  [ ] i

リンクの正規表現:

(?i).*?href="([^"]*).*            [ ] g  [x] s  [ ] m  [ ] i

どういうわけか、大文字と小文字を区別しないチェックボックスが壊れているようです。幸いなことに、で置き換えることができます(?i)。これはうまく機能します。

これは、 RegExrを使用して正規表現をテストするための優れたweb2.0風のツールです。しかし、何らかの理由でまだベータ版です。;-)

于 2008-12-11T19:38:50.417 に答える
2

YP で注意すべき重要なことの 1 つは、デバッグ画面を信頼しないことです。これには、正規表現を試みるときにいくつかのタグをビューから非表示にするという小さな癖があり、混乱を招く可能性があります。非表示の HTML を公開するには、「<」を「#」などに置き換えます

于 2011-08-07T17:00:19.657 に答える