次のファイルがあります。
File
----
12-3 John 121
5-1 Sam 122
ファイルはタブ( \t
)で区切られています。line:chararray
データが個々のフィールドに分割されないように、行をロードしています。
そして今、詳細 (12-3 と 5-1) を別のデータとしてプルして保存したいと考えています。
STRSPLIT
とを試してREGEX_EXTRACT_ALL
いますが、データが一致していないようです。
splitdata = FOREACH filedata {
regex = REGEX_EXTRACT_ALL(line, '^([0-9]*)\\-([0-9]*)');
split = STRSPLIT(line, '\\t', 1);
GENERATE regex, split;
};
これは、最終データを次のようにしたい方法です。
(12, 3, 12-3 John 121)
( 5, 1, 5-1 Sam 122)