約 14,700 レコードを含むデータセットがあります。ibm watson でトレーニングしたいのですが、現在試用版を使用しています。分類子のトレーニングにかかる時間の概算は? データセットの各レコードには文が含まれ、2 番目の列にはクラス名が含まれます。
2 に答える
NLC の場合、データの種類と量によって異なります。完了するまでの決まった時間はありませんが、分類器が 1 日近くトレーニング セッションを実行しているのを見てきました。
とは言っても、通常は30分から数時間です。
Watson の会話インテントはかなり高速です (数分)。ただし、どちらも異なるモデルを使用しているため、両方をテストして結果を確認することをお勧めします。また、比較するときにそれぞれがどのようにスコアリングされているかを確認します(絶対/相対)。
オペレーティング システムが UNIX の場合、dbaccess を使用してクエリを実行すると、クエリが完了して結果が表示されるまでにかかる時間を確認できます。time コマンドを使用して、クエリ実行の開始から終了までの所要時間を報告できます。データベースに接続し、クエリを実行し、結果を出力デバイスに書き込む時間を含めます。
time コマンドは、別のコマンドまたはユーティリティを引数として使用し、そのコマンドのタイミング統計をリストするメッセージを標準エラーに書き込みます。コマンドの呼び出しから終了までの経過時間を報告します。メッセージには次の情報が含まれます。
ユーティリティーの呼び出しから終了までの経過 (実) 時間。リアルタイムは、処理の種類に基づいて 2 つのコンポーネントに分割されます。 ユーザー CPU 時間。utility が実行されるプロセスの times 関数によって返される tms_utime フィールドと tms_cutime フィールドの合計に相当します。または、ユーティリティが実行されるプロセスの times() 関数によって返される tms_stime フィールドと tms_cstime フィールドの合計に相当するシステム CPU 時間。