apache pig とテキストの使用
hahahah. my brother just didnt do anything wrong. He cheated on a test? no way!
「兄は何も悪いことをしていない」と一致させようとしています。
理想的には、「my brother just」で始まり、句読点 (文の終わり) または EOL で終わるものと一致させたいと考えています。
豚のドキュメントを見て、次に java.util.regex.Pattern へのリンクをたどると、使用できるはずだと思います
extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray);
しかし、それは最後まで一致するようです。この試合を実行するための提案はありますか? 髪を抜く準備ができました。髪を抜くということは、Python ストリーミングに切り替えることを意味します。