0

UDF の分散キャッシュからファイルを取得することはできますか?

さらに掘り下げる前に、この特定の質問 (StackOverflow など) に対する答えを見つけるのにかなりの時間を費やしましたが、見つけることができませんでした。

問題の主な核心は次のとおりです。すでに HDFS にあるファイルを取得し、それを Pig の分散キャッシュにコピーしてから、このファイルを Java UDF のキャッシュから読み取れるようにしたいと考えています。もう 1 つの問題は、プログラムの設計により、「EvalFunc」から拡張できないことです。これにより、問題が解決する可能性があります。

SET mapred.cache.files '$PATH_TO_FILE_ON_HDFS'Pig スクリプトと同様に指定SET mapped.create.symlink 'yes'し、ファイル パスをパラメーターとして UDF に渡し、FileSystem および FileReader クラスを使用してファイルにアクセスしようとしましたが、無駄でした。

これをさらに明確にすることができるかどうか、または関連する詳細を提供できるかどうかをお知らせください。

4

0 に答える 0