問題タブ [serving]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
661 参照

gpu - gRPC - 複数のクライアントからのリクエストを蓄積する

サーバー (gRPC サービス) にリクエストを送信する複数のクライアントがあるとします。サーバーが収集できるようにしたいと思います。たとえば、8 つの要求を収集し、これらの要求を一度に処理してから、結果のみをクライアントに送り返します。GRPC機能を使用してこれを行う方法がわかりません。それが可能かどうか、または何か他のものが必要かどうかもわかりません。

コンテキスト: 私のユース ケースは、GPU 上のニューラル ネットワークの提供から来ています。この場合、入力ごとに 1 つの推論を行うよりも、複数の要求の入力をバッチ処理し、1 つの推論を行い、結果を送り返す方がはるかに効率的です。

0 投票する
0 に答える
62 参照

websphere - Websphere サーバーのサブフォルダーにある静的ファイルにアクセスできません

Websphere サーバーを使用して、サーバー マシンのローカル ストレージから画像などのファイルにアクセスする必要があります。war ファイルの WEB_INF フォルダー内に ibm-web-ext.xml ファイルを追加してみました。エラー: 404 データが見つかりません。

コードは ibm-web-ext.xml ファイルで使用されます。

0 投票する
1 に答える
218 参照

kubernetes - kubectlで作成されたkfserving githubの例からサービスを提供していますが、推測できません

Linux デスクトップに minikube クラスターと kfserving をインストールしました。次に、2 つのチュートリアル
https://github.com/kubeflow/kfserving/tree/master/docs/samples/v1beta1/custom/torchserve
https://github.com/kubeflow/kfserving/tree/master/docs/samplesに従いました。 /v1alpha2/custom/kfserving-custom-model

2 番目のチュートリアルでは、yaml ファイルの「name: custom」を「custom:」セクションから「container:」セクションに移動する必要がありました。
サービングサービスが機能していて、kubernetes のサービスのリクエストとポッドのサービングに応答していることを期待していました。
2021 年 5 月以降の最新の安定版を使用しています。

しかし、両方のチュートリアルで同じバグがあります。以下のコマンドは最初のチュートリアルのものです。モデルでdockerイメージを準備して実行すると

指図。
次のような出力が表示されます

しかし、サービスで 404 が見つからないため、予測を実行できません。
私が走るとき

新しいポッドは表示されません。
しかし、私はサービスを削除することができます

https://github.com/kubeflow/kfserving/tree/master/docs/samples/v1beta1/torchserveのような他のチュートリアルに従っていると、すべてが正常に機能し、予測を実行できました。

予測を実行できないのはなぜですか?

新しいポッドが作成されるのはなぜですか?

上記のチュートリアルが機能しない場合、docker イメージを使用して kfserving でサービスをセットアップする方法を教えてください。