CNTK を使用してモデルをトレーニングしました。このモデルをロードし、文を分類するリクエストに応答するサービスを構築しています。パフォーマンスに関して使用するのに最適な API は何ですか? https://github.com/Microsoft/CNTK/tree/master/Examples/Evaluation/CSEvalClientのように C# サービスを構築したいと考えていますが、代わりに Python でモデルをロードする Python サービスを構築することを検討しています。
いずれかのアプローチに対する推奨事項はありますか? (どのAPIがより高速であるか、積極的に維持されているか、またはあなたが考えることができる他のパラメーターに関して)。次のステップは、両方の API 呼び出しのパフォーマンスを測定する実験をセットアップすることですが、決定に役立つ予備知識があるかどうか疑問に思っていました。
ありがとうございました