0

Hadoopストリーミングでは、特定のタスクを処理するノードのIDを取得する方法はありますか?

例えとして、このスニペットはタスクの入力ファイルの名前を示します。

#!/usr/bin/env python
import os
map_input_file = str(os.environ["map_input_file"])

os.environ["map_node_id"]のようなものを探しています。ノードへの一意のハンドルはすべて機能します...

4

1 に答える 1

1

マッパー/リデューサーのソケットモジュールを使用するだけで、データノードのホスト名を取得できます。

import socket
...
node = socket.gethostname()
于 2012-09-04T09:40:12.207 に答える