問題タブ [uima]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
uima - アドレスのトレースに必要な Apache UIMA アノテーション
Apache UIMA を使用して非構造化ドキュメントの「アドレス」データを追跡する必要があるという要件があります。住所は、どの地域からでもかまいません。英国地理のサンプル住所の一部を以下に示します. 190 Stanley road Llanddoged Conwy LL26 6CM 227,Sankey street,Bourne,Lincolnshire,PE10 1LW
非構造化文書から住所データを識別するための可能な注釈を共有していただけると助かります。
solr - 英語を理解するためにsolrを作る
英語を理解できるはずのsolrをセットアップしようとしています。たとえば、私は会社の Web サイト (www.biginfolabs.com) をインデックスに登録しましたが、それは他の Web サイトまたは自社のデータである可能性があります。
英語のようなクエリを入力すると、Google と同じように 1 つの単語の回答が得られるはずです。クエリは次のとおりです。
- インドはどこにありますか.
- オバマの父親です。
回避策:
- solrでUIMA,Mahoutを統合(人名、都市名の抽出を行っています)。
- 「Taming Text」という本を読んでhttps://github.com/tamingtext/bookを実装しました。しかし、私が欲しいものを手に入れませんでした。
誰かがさらに移動する方法を教えてください。私たちのチームがそれを行う準備ができていることは何でもかまいません.
uima - UIMA Ruta を使用して改行間のすべての単語を一致させるにはどうすればよいですか?
強い手をありがとう!
次のようなテキストがあります
Ruta を使用して、改行間のすべての文字列に一致する注釈を作成したいと考えています。注釈で次の 3 つの一致を作成する必要があります。
次のように、改行間のすべてを一致させようとします
しかし、運がありません。誰か提案をお願いできますか?
どうもありがとうございました!
uima - CAS コンシューマーが期待どおりに機能しない
パイプラインで CAS オブジェクトを反復処理し、それらをシリアル化し、シリアル化された CAS を xml ファイルに追加することが期待される CAS コンシューマー AE があります。public class DataWriter extends JCasConsumer_ImplBase {
すべてのアノテーターの後にパイプライン内で使用していますが、CAS オブジェクトを読み取ることができませんでした (jCas.getCas() で NullPointerException を取得しています)。どうやらCASコンシューマーの正しい使い方が理解できていないようです。提案をいただければ幸いです。
uima - UIMA Ruta テキストで区切られた地物を持つアノテーションの作成
次のように作成された注釈付きのテキストがあります。
AnnotationA とそれに最も近い AnnotationB をフィーチャーとしてアノテーションを作成したいと考えています。これをルタ語でどう表現すればいいでしょうか?
私は次の間違った方法を試しました:
ルールはドキュメント全体をカバーします。私が欲しいのは、機能として AnnotationA とそれに最も近い AnnotationB を使用した注釈です。回答ありがとうございます。
uima - XmiCasDeserializer が期待どおりに動作しない
xmi ファイルにシリアル化された CAS があります。xmi ファイルを逆シリアル化しようとすると、出力は xml ファイルに想定されるプレーン テキストになります。これが私がやっていることです、
どこでこれを間違えていますか?