コーパスに 1,000 のドキュメントがあり、パイプラインで処理されるとします。
ある時点で、パイプラインがスタックしたり、例外をスローしたり、おかしな動作をしたりします。しかし、これらはすべて文書関連である可能性が非常に高いです。
そのため、パイプラインでどのドキュメントが処理されているかがわかると便利です。たとえば、Jape トランスデューサーでドキュメント名を出力するには、次のようにします。
質問する
160 次
コーパスに 1,000 のドキュメントがあり、パイプラインで処理されるとします。
ある時点で、パイプラインがスタックしたり、例外をスローしたり、おかしな動作をしたりします。しかし、これらはすべて文書関連である可能性が非常に高いです。
そのため、パイプラインでどのドキュメントが処理されているかがわかると便利です。たとえば、Jape トランスデューサーでドキュメント名を出力するには、次のようにします。