IBM Watson Natural Language Classifier (NLC) は、トレーニング セットのテキスト値を 1024 文字に制限しています: https://console.bluemix.net/docs/services/natural-language-classifier/using-your-data.html#training-限界。
ただし、トレーニング済みのモデルは、長さが最大 2048 文字のすべてのテキストを分類できます: https://console.bluemix.net/apidocs/natural-language-classifier#classify-a-phrase。
この違いは私にとって混乱を引き起こします: 私はトレーニング段階と本番段階の両方に同じ前処理を適用する必要があることを常に知っていました. .
私の推論は正しいですか?生産中のテキストを 1024 文字 (そうすべきだと思う) または 2048 文字 (おそらく 1024 文字では少なすぎるため) に制限する必要がありますか?
前もって感謝します!