私は Pig を初めて使用し、ワード カウント プログラムを作成しようとしています。
テキストから単語を取得する 1 つの方法は、次のTOKENIZE関数を使用することです。
WORDS = foreach INPUT generate flatten(TOKENIZE(text)) AS word;
しかし、私は空白でのみ分割したいのですが、TOKENIZEカンマなどでも分割します。どうすればいいですか?を使ってみSTRSPLIT(text, ' ')たSTRSPLITのですが、タプルをTOKENIZE返しているのにバッグを返しているようで、使い方がわかりませんSTRSPLIT。