Python マッパーを使用して、DSE 3.0 クラスター (Hive 0.9) で Hive ストリーミングを実行しています。私の Python スクリプトは、Python 2.7 を必要とする statsmodels モジュールをインポートします。デフォルトは 2.7 ではないため (2.4 です)、statsmodels モジュールと同様にダウンロードしてインストールします。
ただし、単純な Hive クエリを実行すると、
hive> select transform (line) using 'python python-mapper.py' from docs;
ここで、「docs」は行 STRING を持つ Hive テーブルです。ただし、次のエラーが表示されます。
File "python-mapper.py", line 6, in ?
import statsmodels
ImportError: No module named statsmodels
そこで、Hive クエリを次のように変更しました。
hive> select transform (line) using 'python2.7 python-mapper.py' from docs;
バージョン 2.7 を呼び出します。しかし、その後、エラーが発生します
Caused by: java.io.IOException: Cannot run program "python2.7":
java.io.IOException: error=2, No such file or directory
python27 と /usr/local/bin/python2.7 も試しましたが、まだ同じエラーが発生しています。誰もこれに遭遇したことがありますか?On linux SUSE or RedHat, how do I load Python 2.7の投稿に対する 2 番目の回答を既に参照しています。どんなアドバイスでも大歓迎です!
ありがとう、AM