2

入力文字列 (例: 'abcdefgh') があります。必要なのは、この文字列の一部 (例: 'cd') で注釈を作成することだけです。つまり、入力文字列をサブストリング化し、注釈を次のようにマークする必要があります。それ。これどうやってするの?

4

1 に答える 1

0

新しい注釈は常に、通常のルールで既存の注釈のオフセットを使用してのみ作成されます。あなたの場合、タイプの注釈で一致しANY、各注釈でカバーされているテキストに条件を適用します。条件は完全なテキストの正規表現と一致するため、条件は失敗します。

トークン内など、使用可能な最小の注釈よりも小さい注釈を作成するために、通常の UIMA Ruta ルールを使用することはできません。マッチング プロセスでは、アノテーションに依存しない単純な正規表現ルールを適用する必要があります。次に例を示します。

ANY->{"cd" -> MyType};

このルールは各注釈に一致し、ANY対象となる各テキストにインライン ルールを適用します。インライン ルールは、regex を使用した単純な正規表現ルールcdです。パターンが見つかった場合、そのタイプの新しい注釈がMyTypeそこに作成されます。

このようなことを行う場合は、一致するタイプを慎重に選択する必要があります。たとえば、別の but を使用しますANY

免責事項: 私は UIMA Ruta の開発者です

于 2016-11-07T07:35:38.907 に答える