私は Pig を初めて使用し、ワード カウント プログラムを作成しようとしています。
テキストから単語を取得する 1 つの方法は、次のTOKENIZE
関数を使用することです。
WORDS = foreach INPUT generate flatten(TOKENIZE(text)) AS word;
しかし、私は空白でのみ分割したいのですが、TOKENIZE
カンマなどでも分割します。どうすればいいですか?を使ってみSTRSPLIT(text, ' ')
たSTRSPLIT
のですが、タプルをTOKENIZE
返しているのにバッグを返しているようで、使い方がわかりませんSTRSPLIT
。