14

一貫性のない文字列がたくさんある列があります。'2015mmdd_AB_CD_EFG_(text)_(text)_HIJ'それらのいくつかには、抽出したい一貫したパターンを持つ部分文字列が含まれています。これは、正規表現と部分文字列コマンドのクロス オーバー ケースだと思います。

これまでの私の最善のアプローチはかなり醜いものでした

substring(col_name, '........_.._.._..._.+_.+_...')

出力が希望どおりに終了しない場合、出力は「(...)_HIJ_blablabla」のようになります。

この場合、パターン認識と部分文字列選択を効果的に組み合わせるにはどうすればよいですか?

4

1 に答える 1