私は正規表現を初めて使用します。タグを解析するための正規表現を取得するのを手伝ってもらえますか
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
すべての可能性を備えていますか?
「すべての可能性」をカバーするには、実際には HTML 5 のDetermining the character encoding rules を使用する必要があります。これらは正規表現として表現できません。
validator.nu にはオープン ソースの Java 実装があります。
正規表現の使用を主張する場合、これはおそらくメタ要素で宣言されたエンコーディングのほとんどのケースをカバーします (たとえば、XML 宣言はカバーしません)。ただし、それは汚れており、通常は正しい (常に正しいとは限らない) いくつかの仮定を行っているため、お勧めしません。
/<meta[^>]+charset=['"]?(.*?)['"]?[\/\s>]/i