“starcluster”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

58 参照

starcluster - starcluster sshmaster ポートの指定

starcluster を使用している場合、マスターノードへの SSH 接続時にポート番号を指定することはできますか? 例えば：

starcluster

2015-03-27T13:57:38.737

0 投票する

0 に答える

112 参照

python - Starcluster、別のノードで特定のタスクを実行する方法

高度な統計データを処理し、長く複雑な計算を実行する Python アプリケーションで作業しています。

ユーザーが要求すると、非同期スレッドが作成され、計算が開始され、結果がデータベースに等間隔で保存されます。メインスレッドと同様に、データベース内の変更を探し続け、結果でユーザーを更新します。

現在、AWS と連携する MIT の Starcluster を使用するよう求められています。マスタークラスターとスレーブクラスターを作成しました。私の質問は、MPI4py を使用してノード (スレーブ) マシンで計算を実行し、マスターで他のすべてのことを実行する方法です。

私はコードを書いていませんが、負荷分散の意味でどのように機能するかを示す例を見つけました。

https://gist.github.com/brantfaircloth/2379572

ノードマシンで特定の API を呼び出してノードマシンでタスクを実行する方法はありますか?

2015-04-01T13:20:58.300

0 投票する

2 に答える

237 参照

amazon-iam - StarCluster に必要な IAM 権限

StarCluster の構成手順に従っていますが、StarCluster で使用する新しいユーザーを作成したいと考えています。私の質問は、StarCluster が動作するために必要な IAM 権限の最小セットは何ですか?

AmazonEC2FullAccessポリシーは必要ですか (これで示されます)、それともそれほど包括的でないポリシーはありますか。

amazon-iam starcluster

2015-04-28T15:22:15.070

0 投票する

1 に答える

80 参照

hadoop - MIT スタークラスターと S3

スポットインスタンスで mapreduce ジョブを実行しようとしています。StarClusters とその Hadoop プラグインを使用してインスタンスを起動します。データをアップロードしてから HDFS に入れ、結果を HDFS からコピーして戻すことに問題はありません。私の質問は、データを s3 から直接ロードし、結果を s3 にプッシュする方法はありますか? (データを s3 から HDFS に手動でダウンロードし、結果を HDFS から s3 にプッシュしたくありません。バックグラウンドで行う方法はありますか)?

標準のMIT starcluster amiを使用しています

hadoop amazon-web-services amazon-ec2 amazon-s3 starcluster

2015-05-02T00:40:02.327

0 投票する

1 に答える

534 参照

python - Starcluster に Freeimage プラグインをインストールする

Freeimage ライブラリを Starcluster クラスタにインストールして、scikit-image モジュールで使用できるようにするにはどうすればよいですか?

Starcluster を使用して AWS にクラスターをセットアップし、Freeimage ライブラリで実行できる scikit-image モジュールを使用して .jp2 イメージをロードする必要があるスクリプトを実行したいと考えています。これを行うコマンドは次のとおり skimage.io.imread("path/to/image.jp2", plugin='freeimage)です。これは、自分のマシンで実行すると機能します。

Starcluster のドキュメントに示されているように、Starcluster 構成ファイルの Python パッケージプラグインを使用して、クラスターに scikit-image をインストールしました。

また、ドキュメントの指示に従って、次のパッケージをクラスターにインストールしました

しかしskimage.io.imread("path/to/image.jp2", plugin='freeimage)、クラスターで実行すると、次のエラーメッセージが表示されます。

OS Xを使用しています。

python scikit-image freeimage starcluster

2015-06-11T19:18:15.573

0 投票する

1 に答える

20 参照

amazon-web-services - starcluster プラグイン内から master にいるかどうかを検出する

Starcluster の既存のクラスターにノードを追加しようとすると、マスターノードとセカンダリノードのどちらにいるかによって、一部のプラグインが失敗する場合があります。

プラグインに次のようなものがある場合:

でノードを追加するとき

前のフォームは機能しません。

では、マスターノードとセカンダリノードのプラグインの操作を区別するにはどうすればよいでしょうか。

プラグイン内からマスターにいるかどうかを確認するにはどうすればよいですか? リストのインデックスで試しましたnodesが、うまくいきません。

amazon-web-services amazon-ec2 starcluster

2015-11-30T14:26:00.140

0 投票する

1 に答える

878 参照

python - Sun Grid Engine、ノードごとに 1 つのジョブを強制

Sun Grid Engine を使用してジョブを分散するクラスター (starcluster) で、numpy を使用して同じジョブを何度も繰り返し実行しています。各ノードには 2 つのコアがあります (AWS では c3.large)。たとえば、5 つのノードがあり、それぞれに 2 つのコアがあるとします。

numpy の行列演算は、一度に複数のコアを使用できます。私が見つけたのは、SGE が 10 個のジョブを一度に送信し、各ジョブがコアを使用することです。これにより、ジョブの実行時間が長くなります。htop を見ると、各コアの 2 つのジョブがリソースをめぐって争っているように見えます。

ノードごとに 1 つのジョブを分散するように qsub に指示するにはどうすればよいですか。ジョブを送信すると、一度に実行されるのは 10 個ではなく 5 個だけですか?

python numpy parallel-processing sungridengine starcluster

2016-02-26T15:54:08.803

0 投票する

0 に答える

250 参照

python - ipyparallel - 'CannedFunction' オブジェクトは呼び出し可能ではありません

StarClusterと ipyparallelを使用してクラスターをセットアップしようとしています。次のコマンドを実行しようとすると、次のエラーが発生します。このようにスタックトレースが欠落しているPythonエラーを見たことはありません。

次のエラーが表示されます。

これのデバッグをどこから開始すればよいかさえわかりません。

エラーのトレースバックが実際にない理由を誰かが知っていると助かります。この種のトレースバックはこれまで見たことがありません。

マスターノードでの pip freeze からの出力は次のとおりです。

これは、唯一のスレーブノードからのピップフリーズです。

python ipython starcluster

2016-03-08T18:41:49.880

0 投票する

1 に答える

93 参照

amazon-ec2 - ノード数が 200 以上の MIT の Starcluster エラー

クラスタサイズが 200 ノードを超える場合に問題が発生した人はいますか? 試行するたびに、次のエラーが表示されます。

新しい c4 ec2 インスタンスをサポートしているため、starcluster 開発ブランチ0.95.6を使用しています。

以下は、個人情報の代わりに XXXX を使用した私の星団構成です。

amazon-ec2 starcluster

2016-08-19T14:52:19.697

問題タブ [starcluster]

Reference