問題タブ [gate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
gate - 巨大なコーパスをランダムに3分割するには?
注釈付きの何千ものドキュメントのコーパス (JSerial Datastore に保持) があります。次に、ランダムに選択して、それを 3 つの小さなものに分割する必要があります。GATEで最も簡単な方法は何ですか?
実行中のコードや詳細なガイドは大歓迎です!
javascript - 年齢確認 - ダイアログ ウィンドウを閉じる
クライアントのサイトのプラットフォームとして Nation Builder を使用しており、年齢ゲートを作成する必要があります。別のページで年齢確認を行いますが、明らかにこのプラットフォームでは機能しないため、Jquery ダイアログを使用してホームページの上に表示しています。age の動作を確認するために取得したコードですが、URL リダイレクトの代わりにウィジェット UI を閉じるために微調整する必要があります。
私はプログラミングの専門家ではないので、何か助けて、それを馬鹿にしていただければ幸いです。ここにリンクがあります。http://patricialourenco.com/test.html 乾杯!
annotations - GATE アニーを使用して、段落全体 (または本文) を注釈としてタグ付けする方法を教えてください。
テキストの本文全体を注釈としてタグ付けするにはどうすればよいですか (Gate Annie)。たとえば、ツイートを分類しようとしています。ツイートをポジティブまたはネガティブなツイートに分類したいと思います。手動でタグ付けするのは時間がかかります。Jape を使用してこの活動を行うことは可能ですか? タグ付けされたツイートは機械学習に使用されます。
annotations - GATE でアノテーション (Gold Standard を使用) を保存して比較する方法
私はUIMAに非常に慣れていますが、新しい作業ではGATEを使用する必要があります
それで、GATEを習い始めました。私の質問は、タグ付けエンジン (Java ベース) のパフォーマンスを計算する方法に関するものです。
UIMA では、通常、すべてのシステム アノテーションを xmi ファイルにダンプし、Java コードを使用して人間がアノテーションを付けた (ゴールド スタンダード) アノテーションと比較して、Precision/Recall および F-score を計算します。
しかし、私はまだGATEで似たようなものを見つけるのに苦労しています. そのページのGate Annotation-Diffおよびその他の情報を調べた後、JAVA で簡単に実行できる方法があるはずだと感じました。しかし、JAVAを使用してそれを行う方法を理解できません。この質問をここに置くと思ったら、誰かがすでにこれを理解しているかもしれません。
- プログラムでシステム注釈を xmi または任意の形式のファイルに保存する方法。
- パフォーマンス計算用の 1 回限りのゴールド スタンダード データ (つまり、人間が注釈を付けたデータ) を作成する方法。
より具体的または詳細が必要な場合はお知らせください。
java - GATE によるマルチテナンシー
プロジェクトに自然言語処理モジュールを実装するために Gate を使用しています。次のステップでは、システムで複数のユーザーをサポートする必要があります。各ユーザーは異なるドメイン ワードのセットを持っています (私はそれを地名辞典に入れました)。私の知る限り、ゲートは多くの静的リソースを使用し、ゲートの複数のインスタンスを作成することは非常に困難です。Gateでマルチテナンシーを実装するアイデアはありますか?
よろしくお願いします。
PS: ゲートを使用する理由は、jape ルールがあるためです。もっとカスタマイズしやすくて、そういうルールベースの文法も持っているツールが他にあればいいなと思います。
lucene - 自然言語処理ツールの比較 (UIMA、LingPipe、Lucene、Gate、Stanford)
トークン化、文検出、さまざまなタグ付け (Name Entity Recognition、POS タグ付けなど) などの一般的なタスクを実行する自然言語処理ツールを選択したいと考えています。私の質問には2つの部分があります:
- 自然言語処理ツールを選択する基準は何ですか?
- (UIMA、LingPipe、Lucene、Gate、Stanford) の中で、これらの基準をよりよく満たしているのはどれですか?
あなたの提案は何ですか?
grammar - GATE チュートリアル Web サイトの単純な JAPE 文法が機能しない
それに伴い GATE と JAPE の文法を学んでいます。GATE と JAPE 文法を使用するのはこれが初めてです。スポーツに関する何かを識別するための文法が与えられているこのチュートリアルに従っています。この.jape
ファイルとサンプル テキストを使用しましたが、GATE は個人、組織、日付など以外は識別できません。
.jape
GATE でカスタム文法を使用する方法を知りたいですか? 誰かが手順を教えてくれれば、それは本当に素晴らしいことです。
現在、次の手順を実行しています。
GATE GUI を起動します。
ANNIE システムをデフォルトでロードします。
ステップ (2) では、ANNIE POS Tagger、トークナイザー、センテンス スプリッターなどを の下にロードします
Processing Resources
。を右クリックして
Processing Resources
、 を選択しますNew -> JAPE Transducer
。.jape
ファイルへのパスと名前を指定します。を右クリックして
Language Resources
、 を選択しますNew -> GATE Corpus
。コーパスに名前を付けます。新しく作成されたコーパスを右クリックして、 を選択します
Populate
。テキスト ファイルが存在するディレクトリを選択します。これらのファイルに対して GATE を実行します。
ノード
ANNIE
の下をダブルクリックし、ボタンをクリックします。Applications
Run This Application
ボタンをクリックしRun This Application
てすべての処理が完了したら、入力テキスト ファイルを開きます。
このファイルにはファイルにタグが書き込まれておらず.jape
、Person、Organization などの通常のタグが表示されているだけです。
私の.jape
ファイルは以下のようになります:
入力テキストファイルは次のとおりです。
他のステップが欠けているかどうか教えてください。このための段階的な手順を見つけることができません:( GATEの人々がそのようなチュートリアルを書くのに時間を費やしていたらよかったのに.