私は textsum の実装を機能させることに取り組んでおり、最近、自分でスクレイピングしたデータをフィードしました。昨夜、38000 件の記事に対してトレーニングを開始しました。今朝平均損失を見たとき、私は約 5.2000000 でした。textsum おもちゃセットで遊んでいたとき、たとえば約 0.0000054 まですばやく下げることができましたが、これは約 20 の記事に対してのみでした。
もう少し経験のある人が、トレーニングにかかる時間についていくつかの期待を提供できることを望んでいました. 現在、これを Nvidia 980M で実行しています。先週、AWS g2.2xlarge インスタンスを試してみたかったのですが、皮肉なことに、私のローカル マシンは Grid 520 よりも高速に処理しているように見えました。P2 インスタンスと Google Cloud をまだテストしたいのですが、今のところ、ローカル マシンで作業するだけだと思います。
私が期待すべきことに関して、誰かがここで提供できるかもしれない情報はありますか? ありがとう!