Hadoop の Python クライアントを検索しているときに、pydoop と hadoopy の 2 つのモジュールが見つかりました。両方とも十分に機能するように見えますが、どちらをインストールするのが他の利点よりも優れているかはわかりません。
質問する
4668 次
1 に答える
4
The most comprehensive documentation of this I think is http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/
Recently, I really think that mrjob has come out ahead as a clear frontrunner. It has a very active mailing list and it seems to be relatively stable and up to date. It also has nice integration with Amazon EMR.
于 2014-02-13T16:45:10.757 に答える