多数のデータセットをマイニングする必要があり、GPUを搭載したデスクトップを取得する方がよいのか、それともワークロードを別々のマシンに分散する方がよいのかを知りたいですか?
GPUでは、CUDAツールキットのようなものを使用して独自のコードを作成する必要があるかもしれないと思います。
正規表現検索を実行する必要のある文字列の数は数百万のオーダーであり、10kに達するさまざまなキーワードと一致する必要があるため、約500億のパターンが一致します。1つのコアなどで100万を実行できるようにワークロードを分散させたい...
どんな提案も役に立ちます。