入力文字列 (例: 'abcdefgh') があります。必要なのは、この文字列の一部 (例: 'cd') で注釈を作成することだけです。つまり、入力文字列をサブストリング化し、注釈を次のようにマークする必要があります。それ。これどうやってするの?
1 に答える
0
新しい注釈は常に、通常のルールで既存の注釈のオフセットを使用してのみ作成されます。あなたの場合、タイプの注釈で一致しANY
、各注釈でカバーされているテキストに条件を適用します。条件は完全なテキストの正規表現と一致するため、条件は失敗します。
トークン内など、使用可能な最小の注釈よりも小さい注釈を作成するために、通常の UIMA Ruta ルールを使用することはできません。マッチング プロセスでは、アノテーションに依存しない単純な正規表現ルールを適用する必要があります。次に例を示します。
ANY->{"cd" -> MyType};
このルールは各注釈に一致し、ANY
対象となる各テキストにインライン ルールを適用します。インライン ルールは、regex を使用した単純な正規表現ルールcd
です。パターンが見つかった場合、そのタイプの新しい注釈がMyType
そこに作成されます。
このようなことを行う場合は、一致するタイプを慎重に選択する必要があります。たとえば、別の but を使用しますANY
。
免責事項: 私は UIMA Ruta の開発者です
于 2016-11-07T07:35:38.907 に答える