あなたは本当に私の一日の相棒になりました...
すでにトレーニングされたニューラルネットワークは通常のステートマシンと大差ないため、決定論的命令セット用のニューラルネットワークVMを作成する意味はありません。
このようなVMを複数の命令セットまたは不明なセットでトレーニングすることは興味深いかもしれません。ただし、そのようなトレーニングを実行することが実際的であるとは思えません。また、99%の正しいインタプリタでさえ、従来のバイトコードには何の役にも立ちません。
私が考えることができるニューラルネットワークVMの唯一の使用法は、ファジー論理構造またはAIアルゴリズムヒューリスティックを含むプログラムを実行することです。
アイデアを示すためのいくつかのばかげたスタックマシンの例:
push [x1]
push [y1] ;start coord
push [x2]
push [y2] ;end coord
pushmap [map] ;some struct
stepastar ;push the next step of A* heuristics to accumulator and update the map
pop ;do sth with is and pop
stepastar ;next step again
... ;stack top is a map
reward ;we liked the coordinate. reinforce the heuristic
stepastar
... ;stack top is a map
punish ;we didn't like the next coordinate. try something different
ここには明示的なヒューリスティックはありません。ヒューリスティックアルゴリズムを含むすべての状態を*mapに保持すると仮定します。
あなたはそれがばかげているように見え、完全に文脈に敏感ではないことがわかりますが、ニューラルネットワークはオンラインで学習しなければ価値がありません。