問題タブ [ruta]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
778 参照

uima - UIMA Ruta を使用して改行間のすべての単語を一致させるにはどうすればよいですか?

強い手をありがとう!

次のようなテキストがあります

Ruta を使用して、改行間のすべての文字列に一致する注釈を作成したいと考えています。注釈で次の 3 つの一致を作成する必要があります。

次のように、改行間のすべてを一致させようとします

しかし、運がありません。誰か提案をお願いできますか?

どうもありがとうございました!

0 投票する
2 に答える
223 参照

ruta - UIMA Ruta : 文字と数字の組み合わせのスクリプト

Ruta を使い始めたばかりで、文字、数字、およびドット (.) の任意の組み合わせを見つけるルールを書きたいと思います。

(JAVA 正規表現 - ([a-z0-9.]+) )

例えば ​​-

abcd.03ef0.3abc

03a.bcd.03eeff903a.bc

0 投票する
1 に答える
556 参照

regex - UIMA RUTA : WORDLIST の正規表現

WORDLIST で正規表現を使用する方法はありますか? https://issues.apache.org/jira/browse/UIMA-3382に記載されているものと同じものを実装する必要があります。

または、それを解決する別の方法はありますか?

EDIT : WORDLIST は、テキスト項目のリストとして定義されます。同じタイプとしてマークしたい正規表現のリストがあるとしたらどうでしょう。それを行う方法はありますか?

たとえば、ドキュメント内の日付を検索したいのですが、日付にはさまざまな形式があるため、考えられるすべてのケースをカバーするには正規表現の方がより簡潔な方法です。したがって、以下の構文を使用しようとしましたが、一致するのは、特別な正規表現構文のない単一の単語がある場合のみでした。

DateFormatList の項目が正規表現として扱われるようにするには、ルールの何を変更すればよいですか?

ありがとう

0 投票する
1 に答える
397 参照

uima - UIMA Ruta テキストで区切られた地物を持つアノテーションの作成

次のように作成された注釈付きのテキストがあります。

AnnotationA とそれに最も近い AnnotationB をフィーチャーとしてアノテーションを作成したいと考えています。これをルタ語でどう表現すればいいでしょうか?

私は次の間違った方法を試しました:

ルールはドキュメント全体をカバーします。私が欲しいのは、機能として AnnotationA とそれに最も近い AnnotationB を使用した注釈です。回答ありがとうございます。

0 投票する
1 に答える
517 参照

uima - UIMA Ruta で特定のトークンを照合する方法は?

GATHERでやった

しかし、A型の未知の配列の場合はどうでしょうか?以下のように、すべての A を機能に格納するにはどうすればよいでしょうか? 機能の数も不明です。plan javaではString配列を宣言して要素を追加できるのですが、Rutaではそのような処理がないようです。

0 投票する
0 に答える
148 参照

xml - UIMA-RUTA で文字列配列の子タグにアクセスするには?

XMI ファイルからデータを取得する際に問題が発生しています。次の抜粋は、私たちがやろうとしていることの例を示しています。

最初の行に含まれる id、begin、soaf など (これらは属性) の情報を取得する方法はわかっています。これらは、次のコードを使用して取得できます。

ただし、前述のように、前の例の子タグにあるレンマ (文字列 "ser") を取得する方法を知りたいと考えています。

明らかに、私たちは を試しcgToken{REGEXP(cgToken.lemma, "ser", true) -> DO_SOME_ACTION};ましたが、lemma は cgToken の属性ではないため機能しません。さらに、単一の cgToken 内に複数の補題がある場合があります。

TypeSystem では、この機能を次のように定義しています。

ただし、Ruta のドキュメントには、配列フィールドへのアクセス方法が説明されていません。