私は Mircosoft Orleans をベースとしてワークフロー エンジンに取り組んでいます。これは、作業の自動分散やフェイルオーバーの処理など、多くの便利な機能を提供するためです。
私は3種類の穀物を持っています:
- ワークフロー - ワークフロー内の情報と、作業ブロックを実行する順序を保持します
- 作業ブロック - 実際に作業を行う部分
- 実行 - ワークフローの 1 回の実行
私の問題は、多数の現在の実行を実行している場合、つまり > 1000 の場合、パフォーマンスが実際に低下することです。少しプロファイリングを行い、これを粒子間で発生する通信に絞り込みました。とにかくこれ以上改善できることはありますか?
これが私のコードの概要と穀物がどのように相互作用するかです
実行グレインはループ内にあり、ワークフローから次の作業ブロックを取得し、その作業ブロックで execute を呼び出します。テスト ワークフローの 1 つの実行時間が、1 回の実行で 10 秒、1000 回以上実行すると約 5 分になる原因となっているのは、グレイン間のこの絶え間ない呼び出しです。これを改善できるか、またはソリューションを再構築する必要があります。グレイン通信を削除するには?
[StorageProvider(ProviderName = "WorkflowStore")]
[Reentrant]
[StatelessWorker]
public class Workflow : Grain<WorkflowState>, IWorkflow
{
public Task<BlockRef> GetNext(Guid currentBlockId, string connectionName)
{
//Lookup the next work block
}
}
[Reentrant]
[StatelessWorker]
public class WorkBlock : Grain<WorkBlock State>, IWorkBlock
{
public Task<string> Execute(IExecution execution)
{
//Do some work
}
}
[StorageProvider(ProviderName = "ExecutionStore")]
public class Execution : Grain<ExecutionState>, IExecution, IRemindable
{
private async Task ExecuteNext(bool skipBreakpointCheck = false)
{
if (State.NextBlock == null)
{
await FindAndSetNext(null, null);
}
...
var outputConnection = await workblock.Execute();
if (!string.IsNullOrEmpty(outputConnection))
{
await FindAndSetNext(State.NextBlock.Id, outputConnection);
ExecuteNext().Ignore();
}
}
private async Task FindAndSetNext(Guid? currentId, string outputConnection)
{
var next = currentId.HasValue ? await _flow.GetNextBlock(currentId.Value, outputConnection) : await _flow.GetNextBlock();
...
}
}