さて、私はRSSフィードを持っています。すべての投稿には、複数の HTML リンクが含まれています。それらはすべて同じホスト (例: youtube.com) であり、ホストが異なるものがあります。この1つのリンクをフィルタリングしようとしています。
現時点では、最も一般的なホスト (imgur、minus、tumblr など) のルールのリストを用意しています。これは次のようになります。
(?i).*?href="(https?://[^"]*host1[^"]*).*
(?i).*?href="(https?://[^"]*host2[^"]*).*
(?i).*?href="(https?://[^"]*host3[^"]*).*
問題は、不明なホストとのリンクが常に存在することです。だから私がやりたいのは、他のすべてのリンクからホストを「ブラックリストに登録」することです(すべて同じです)。について読みまし(?!regex)
たが、うまくいかないようです:
(?i).*?href="(https?://[^"]*(?!youtube)[^"]*).*
あなたが私の問題を理解してくれることを願っています。私の(おそらく)下手な英語で申し訳ありません!