ヒューリスティックに、2 つの別々のソースからストリーミングされたデータを使用してニューラル ネットワークをトレーニングしています。
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --oaa 10 --nn 20 --save_resume -i /tmp/weights -f /tmp/weights
ただし、これは「--oaa を複数回渡すことはできません」というエラーが発生します。結構です、--save_resume
構成引数を保持しているので、私は改訂しました:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --save_resume -i /tmp/weights -f /tmp/weights
そしてすべてがうまくいきました。好奇心から、--save_resume
オプションなしで 2 番目のアプローチを繰り返しましたが、モデルのパフォーマンスがわずかに低下したことを除いて、すべてが機能しました。
--save_resume
重みファイルに見られる学習率と例の数を保存すると推測します。これは、出力から発生しているように見えたものであり、パフォーマンスの向上を裏付けています。他に何かありますか?
編集:少し実験した後、最初のリグレッサーを経由して渡すと-i
、「オプション '--oaa' を複数回指定することはできません」というエラーが発生することがわかりました--save_resume
。