ipython - ローカルからすべてのリモートエンジンにコードをインポートする

Question

私は sklearn グリッド検索の並列化に取り組んでおり、3 つのパラメーターをスイープしていますが、ipython.parallel で動作するようにプロジェクトをリファクタリングするのに問題があります。私の現在の考え方は、次のような単純な関数を作成することです。

リッジパラメータを受け入れます
モデルをトレーニングするためのデータセットをダウンロードします
モデルをトレーニングし、スコアと結果のモデルを S3 に保存しますか?

これは、グリッド検索を並列化するアプローチとして理にかなっていますか?

その場合、ローカルマシンとリモートエンジンの間でコードを共有する方法はありますか?

たとえば、いくつかの異なるモジュールを含むソースツリーがあります。

/exploration
    /log_regression/
    /log_regression/experiments.py
    /log_regression/make_model.py
    /linear_regression/
    /linear_regression/experiments.py
    /linear_regression/make_model.py
    /linear_regression/parallel.py

StarCluster を使用して、EC2 にクラスターをデプロイし、リッジパラメーターで sklearn gridsearch を実行するプロセスを並列化したいと考えました。しかし、すべてのローカルモジュールをリモートエンジンと簡単に共有する方法が見つかりませんでした。これを行うためのパターンはありますか、またはどのように考えを再構築する必要がありますか?

score 0 · Accepted Answer

コードを複数のノードにデプロイすることが問題であり、並列処理用にコードを設計することではない場合は、ローカル (ネットワーク) のソースコード管理 (git または mercurial サーバー) を介してコードにアクセスできるようにし、スクリプトを作成することを検討してください。展開: 処理を開始する前にすべてのノードに接続し、作業環境を準備するユーティリティ。そしてもちろん、これには必要な依存関係と共にコードの最新バージョンをチェックアウトすることが含まれます。Unix ライクな OS を使用していると仮定すると、これを支援する Python ユーティリティがいくつかあります。

virtualenv、pipを介して多くのpythonライブラリにアクセスできる自己完結型のpython環境用。
paramiko、ssh接続とシェルの相互作用のスクリプト作成用
vcstools、いくつかの scm (svn、git、mercurial など) の一般的なソースコード操作を抽象化するライブラリ

また、ソースコード管理をゼロから設定する手間をかけたくない場合は、コードをgithubでホストするか、コードを公開したくない場合は、bitbucket (無料で提供されている) を使用できます。プライベートリポジトリ、および git と mercurial の選択も可能)。

ipython - ローカルからすべてのリモート エンジンにコードをインポートする

1 に答える 1

Related

Reference

ipython - ローカルからすべてのリモートエンジンにコードをインポートする