「それぞれ」がファイルから GBK 文字列を読み取り、GBK 文字列をファイルに書き込む場合、どうすればよいですか? それを定義する方法は?
Fields namesFields = new Fields("zid", "vid", "title", "number");
sourcePipe = new Each(sourcePipe, new Fields("line"), new Parse(namesFields), Fields.ALL);
「それぞれ」がファイルから GBK 文字列を読み取り、GBK 文字列をファイルに書き込む場合、どうすればよいですか? それを定義する方法は?
Fields namesFields = new Fields("zid", "vid", "title", "number");
sourcePipe = new Each(sourcePipe, new Fields("line"), new Parse(namesFields), Fields.ALL);
2013 年 2 月 27 日午後 11 時 24 分、チェン ドンは次のように書いています。
文字列 (形式: GBK) を読み取り、文字列 (形式: GBK) を書き込みたい場合。どのようにできるのか?
http://docs.cascading.org/cascading/2.1/javadoc/cascading/scheme/hadoop/TextLine.html
コンストラクターを charsetName パラメーターと共に使用します。
それぞれが、入力データに対して関数またはフィルターを実行するために使用されます。
のような列にデータがある場合"zid", "vid", "title", "number"
、
これらの列の 1 つでフィルターを実行できます。列のタイトルに jdk 文字列がない場合にデータをフィルター処理できます。
jdk 文字列を含むタプルが出力として出力されるようにします。
そのためには、インターフェイスを実装してクラスを拡張することにより、ユーザー定義のフィルターを作成する必要があります。filter
baseoperation