2

コーパスに 1,000 のドキュメントがあり、パイプラインで処理されるとします。
ある時点で、パイプラインがスタックしたり、例外をスローしたり、おかしな動作をしたりします。しかし、これらはすべて文書関連である可能性が非常に高いです。
そのため、パイプラインでどのドキュメントが処理されているかがわかると便利です。たとえば、Jape トランスデューサーでドキュメント名を出力するには、次のようにします。

4

1 に答える 1

2

ドキュメント処理を取得するには、次のような単純な JAPE ルールを記述できます。

Phase:  DocName
Input: Token
Options: control = once

Rule:DocName
(
 {Token}
)
-->
{
  System.out.println(doc.getName());
}

このルールをパイプラインの最初のルールとして配置します。ドキュメントに少なくとも 1 つのトークンがあることを願っています。

于 2013-05-13T13:14:54.907 に答える