私が見たところ、複数のトレーニング セットを新しい Watson NLC ツールにアップロードする方法はありません。個別のトレーニング セットとそれに関連する分類器を管理する必要があります。ここで何が欠けていますか?
2 に答える
推奨オプション:使用するトレーニング データのセットごとに NLC サービス インスタンスをプロビジョニングし、それぞれのツールに個別にアクセスします。
回避策:現在、1 つの NLC サービス インスタンスで複数のトレーニング セットを管理するフローは次のとおりです。
- (オプションで新たに開始) トレーニング データ ページに移動し、ゴミ アイコンをクリックして、すべてのトレーニング データを削除します。
- アップロード アイコンを使用して、トレーニング データ ページにトレーニング セットをアップロードします。
- 必要に応じてデータを操作します。テキストやクラスを追加したり、テキストにクラスのタグを付けたりします。
- 分類子を作成します。分類子を作成すると、後で分類子ページから取得できるため、基本的に現在のトレーニング データのスナップショットになります。
すべてのトレーニング データ セットをアップロードし、対応する分類器を作成するまで、必要に応じて手順 1 ~ 4 を繰り返します。
以前のトレーニング セットの作業を続けたい場合:
- トレーニング データをクリアします (上記のステップ 1)。
- 分類子のページに移動します。
- 作業したいトレーニング データを含む分類子のダウンロード アイコンをクリックします。
- トレーニング データ ページに戻り、手順 3 でダウンロードしたファイルをアップロードします。
複数のトレーニング セットを管理する最善の方法は、トレーニング セットごとに異なる NLC サービス インスタンスを使用することです。
現在のベータ版の NLC ツールは、単一のサービス インスタンス内で個別のトレーニング セットを管理することを意図していません。たとえば、クラスなしでテキストを追加すると、ツールは提案を行います。これらは、まったく異なるトレーニング セットに基づいている場合は意味をなさない最新のトレーニングされた分類子に基づいています。
@John Bufe によって提案された回避策は、Bluemix サービスの制限に達したなど、何らかの理由で使用できる NLC サービスの数に厳しい制限がある場合に機能します。月額料金はトレーニングされた分類子インスタンスに対するものであるため、NLC サービス インスタンスを追加しても全体的な価格が上昇することはないため、コストはここでは考慮されません。たとえば、4 つのサービス インスタンスがあり、それぞれに 1 つの分類子がある場合、3 つが課金され、1 つが無料で表示されます。
NLC ベータ ツールを使用してトレーニング データを管理する場合は、必要なトレーニング セットごとに個別の NLC サービスを使用することをお勧めします。