Pythonプログラムからいくつかのhadoopコマンドを実行しようとしています...
たとえば、コマンドラインからの場合は次のようにします。
bin/hadoop dfs -ls /hdfs/query/path
hdfsクエリパス内のすべてのファイルを返します。UNIXと非常によく似ています。
今、私は基本的にpythonからこれを実行しようとしています..そしてそれからいくつかの操作を実行します。
exec_str = "path/to/hadoop/bin/hadoop dfs -ls " + query_path
os.system(exec_str)
今、私はこの出力を取得して操作を実行しようとしています。たとえば..ファイルの数を数えますか?サブプロセスモジュールを調べましたが、...これらはネイティブシェルコマンドではありません。したがって、これらの概念を適用できるかどうかわからないこれを解決する方法は?