1

特定の HTML タグ間のコンテンツを見つけるために正規表現を使用しています。

ただし、コンテンツは外国語である可能性があり、絶対に何でも含めることができます.

タグ間のすべてを完全にキャプチャできる正規表現を見つけようとしています。特定のケースに関する記事や Q/A を見たことがありますが、それらをすべてまとめる方法がわかりません (特に外国語の要件)。

誰にも解決策/アイデアはありますか?

4

3 に答える 3

0

<.*?>それが何であるかに関係なく、何でもつかむ必要があります。

于 2013-10-30T16:09:03.143 に答える
0

次のパターンを使用して、小なり記号以外の任意の文字に一致させることができます。[^<]

これは外国語の文字に一致しますが、タグの最初の文字には一致しません。

于 2013-10-30T16:10:05.613 に答える