正規表現を使用してテキストの一部を抽出したいと思います。たとえば、私は住所を持っていて、番号と通りだけを返し、残りを除外したいとします。
2222 Main at King Edward Vancouver BC CA
ただし、ほとんどの場合、アドレスの形式は異なります。Lookbehind Regexを使用してみたところ、次の式が出てきました。
.*?(?=\w* \w* \w{2}$)
上記の式は上記の例をうまく処理しますが、テキストにコンマが入るとすぐに面倒になりすぎます。郵便番号は、6文字の文字列または中央にスペースがある2つの3文字の文字列などです。
後読み正規表現以外のテキストの一部を抽出するよりエレガントな方法はありますか?
他の方向への提案やポイントは大歓迎です。
ありがとう!