Python で RSA を実装しようとしていますが、GPU で集中的な計算を実行したいと考えています。私は PyOpenCL で動作する独自のモジュロ累乗を正常に実装しましたが、基数と指数の両方で 6 桁の整数を上限にしています。それよりも大きい数値を指定すると、GPU がクラッシュします。
numpy で非常に大きな整数値の配列を作成し、それらを PyOpenCL コードに送信し、GPU で大きな整数を使用して乗算とモジュロ演算の両方を実行する必要があります。
誰かが以前に似たようなことをしたことがありますか? cuda と bigint をグーグルで検索しても、良い結果は得られません。:(