0

次の文字列があります。

'United Breaks Guitars': Did It Really Cost The Airline $180 Million? http://ow.ly/htPVk

現在、私の正規表現パターンは次のようになっています。[^A-Za-z-0-9- - / -$]

私は正規表現の専門家ではなく、このツールをいじって物事を把握してきましたが、行き詰まっています。

'"、などの文字を削除したいと思います:。これまでのところ、上記のパターンでは、強調表示された文字がサンプル文字列から削除されています。

'ユナイテッド ブレイク ギター' :は本当に航空会社に 1 億 8000 万ドルの費用がかかったのですか?http : ://ow .ly/htPVk

上記の問題は、URL から:andを削除したくないということです。.しかし、文字列がピリオドで終わる場合は削除したいと思います。また、文字を省略したり所有物として使用したりする場合に備えて、アポストロフィ'文字を保持する必要があります。

前もって感謝します。

4

1 に答える 1

2

「単語の一部」をどのように定義するかにもよりますが、URLはあまり単語ではありません。

「単語の一部」をスペース以外の文字で囲むように定義する場合は、次のように使用できます。

(?<!\S)[^\w $-]+|[^\w $-]+(?!\S)

(?!\S)はより短い言い方で(?=\s|$)あり、同じことが後読みにも当てはまります。

于 2013-02-07T03:54:34.607 に答える