重複の可能性:
C# の正規表現を使用して HTML タグを削除する
タグを削除し、他のすべての情報を XML ファイルに保持する必要があります。正規表現を使用するとき、私はどういうわけか途方に暮れています。ファイルを 1 行ずつ読み込んでから、すべてのタグを「見つけて」「」 (空の文字列) に置き換えようとすることしか考えられませんでした。ただし、期待どおりに機能していません。
line = Regex.Replace(line, "<.*>", "");
これが期待どおりに機能しない理由を説明してもらえますか (<> 内にあるシンボルのすべての可能な組み合わせを見つけるだけでよいと思います。また、正規表現の適切な紹介をお勧めしてもらえますか。定期的によく読みます-expressions.info しかし、どういうわけか不完全で紛らわしいと思います。