1

データが多ければ多いほどよいことはわかっていますが、SyntaxNet のトレーニングに必要な妥当な量のデータはどれくらいでしょうか?

4

1 に答える 1

3

いくつかの試行錯誤に基づいて、次の最小値に到達しました。

  • コーパスのトレーニング - 18,000 トークン (それ未満でステップ 2 - タガーによる前処理 - 失敗)
  • テスト コーパス - 2,000 トークン (それ未満で、ステップ 2 - タガーによる前処理 - 失敗)
  • 開発コーパス - 2,000 トークン

    ただし、これで、NLP パイプラインのステップを実行することができただけであり、実際にはそこから使用できるものを取得できていないことに注意してください。

  • 于 2017-01-29T11:39:45.880 に答える