この標準ドキュメントを信じる(そしてウィキペディアが同意する)場合、出力用の有効な郵便番号のフォーマットは簡単です。最後の3文字は2番目の部分であり、前のすべてが最初の部分です。
したがって、事前に埋め込まれたスペースがなく、有効な郵便番号があると仮定すると、必要なのは
def format_post_code(pc)
pc.strip.sub(/([A-Z0-9]+)([A-Z0-9]{3})/, '\1 \2')
end
最初に入力郵便番号を検証する場合は、指定した正規表現が出発点として適しているように見えます。おそらくこのようなものですか?
NORMAL_POSTCODE_RE = /^([A-PR-UWYZ][A-HK-Y0-9][A-HJKS-UW0-9]?[A-HJKS-UW0-9]?)\s*([0-9][ABD-HJLN-UW-Z]{2})$/i
GIROBANK_POSTCODE_RE = /^GIR\s*0AA$/i
def format_post_code(pc)
return pc.strip.upcase.sub(NORMAL_POSTCODE_RE, '\1 \2') if pc =~ NORMAL_POSTCODE_RE
return 'GIR 0AA' if pc =~ GIROBANK_POSTCODE_RE
end
最初の文字の「0-9」の部分を削除したことに注意してください。これは、引用した情報源によると不要と思われます。また、最初に引用したドキュメントに一致するようにアルファセットを変更しました。それはまだ完全ではありません。たとえば、「AAA ANN」形式のコードが検証されます。おそらく、より複雑なREが必要になると思います。
これでカバーできると思います(修正を容易にするために段階的に構築されています!)
A1 = "[A-PR-UWYZ]"
A2 = "[A-HK-Y]"
A34 = "[A-HJKS-UW]" # assume rule for alpha in fourth char is same as for third
A5 = "[ABD-HJLN-UW-Z]"
N = "[0-9]"
AANN = A1 + A2 + N + N # the six possible first-part combos
AANA = A1 + A2 + N + A34
ANA = A1 + N + A34
ANN = A1 + N + N
AAN = A1 + A2 + N
AN = A1 + N
PART_ONE = [AANN, AANA, ANA, ANN, AAN, AN].join('|')
PART_TWO = N + A5 + A5
NORMAL_POSTCODE_RE = Regexp.new("^(#{PART_ONE})[ ]*(#{PART_TWO})$", Regexp::IGNORECASE)