Ok、
非常に愚かな質問...
hdfsに大きなファイルがあります
/user/input/foo.txt
この場所から最初の 100 行をローカル ファイルシステムにコピーしたい...
また、データは非常に機密性が高いため、実験には少しためらいがあります。
サンプルデータを hdfs からローカル fs にコピーする正しい方法は何ですか?
Ok、
非常に愚かな質問...
hdfsに大きなファイルがあります
/user/input/foo.txt
この場所から最初の 100 行をローカル ファイルシステムにコピーしたい...
また、データは非常に機密性が高いため、実験には少しためらいがあります。
サンプルデータを hdfs からローカル fs にコピーする正しい方法は何ですか?
勝利を確実にする簡単な方法は次のとおりです。
hdfs dfs -copyToLocal /user/input/foo.txt /path/to/local/file | head -100
プログラムを使用してhead
、ファイルの先頭から数行を抽出できます。たとえば、次のようになります。
$ head /user/input/foo.txt -n100
(ここでn
、抽出する行数を決定します)、選択したファイルに出力をリダイレクトします。
$ head /user/input/foo.txt -n100 > /path/to/you/output/file