問題タブ [brat]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Named Entity Recognition ゴールド スタンダード コーパスのサンプル サイズ
私は 170 のオランダ文学小説のコーパスを持っており、これに固有表現認識を適用します。オランダ語の既存の NER タガーを評価するために、このコーパスのランダム サンプルで名前付きエンティティに手動で注釈を付けたいと思います。この目的のためにbratを使用します。手動で注釈を付けたランダム サンプルは、NER タガーの評価における「ゴールド スタンダード」として機能します。文レベルでコーパスのランダム サンプルを出力する Python スクリプトを作成しました。
私の質問は、小説あたりの文の量に関して、ランダムサンプルの理想的なサイズはどれくらいですか? 今のところ、小説ごとにランダムな 100 文を使用しましたが、これにより、ほぼ 21626 行を含むかなり大きなランダム サンプルが生成されます (手動で注釈を付けるには多くの量が必要であり、ガキの作業環境が遅くなります)。
python - ブラット注釈付きファイルを使用したアノテーター間合意の計算
3 人のアノテーターと共に、BRAT ( http://brat.nlplab.org/ ) を使用して、PERS、ORG、GPE の 3 つのカテゴリのテキストのサンプルに注釈を付けています。そのサンプルの Inter Annotator Agreement を計算したいと思います。しかし、私はそれを行う簡単な方法を見つけていないようです。この Python パッケージを試してみました: https://github.com/savkov/BratUtilsですが、失敗するようです。
注釈付きのサンプルごとに、Inter Annotator Agreement を計算したい 3 つの .ann ファイルがあります。ファイル内のデータは次のようになります。
(Python または Web ベースのツールを使用して) Inter Annotator Agreement を計算する簡単な方法はありますか?
part-of-speech - Google NL API は、注釈構文の応答でどのタグを使用しますか?
Google NL API の注釈構文メソッドを使用し、Brat を使用して応答を視覚化しています。Google NL API で使用される単語と依存関係の「タグ」または「ラベル」の正確なリストはどこにありますか。
"partOfSpeech": { "タグ": "ADJ",
"dependencyEdge": { "headTokenIndex": 9、"label": "AMOD"
caching - 注釈の編集中に BRAT でタイムラグを回避するにはどうすればよいですか?
Brat ソフトウェア ( http://brat.nlplab.org ) を使用してデータに注釈を付けています。注釈付きファイルがあり、手動で変更したい。エンティティの削除、エンティティ タイプの編集など。
変更が行われるたびに、ページが再読み込みされます。これには約 5 ~ 10 秒かかります。これは、brat が Web サーバー ( http://brat.nlplab.org/installation.html ) で動作するためです。変更が行われると、変更されたファイルがサーバーにアップロードされてからリロードされます。
私は多くの変更を行う必要があり、この遅延はイライラします. ラグを回避する方法はありますか?おそらく、ローカルキャッシュを作成し、その中にすべての変更を加えてから、サーバーにアップロードします。
これは、他の人が行うトレーニング データを作成するために必要なので、すばやく簡単に作成できるようにしたいと考えています。
windows - BRAT を実行するには、どの Cygwin パッケージをインストールする必要がありますか?
Windows 7 SP1 x64 Ultimate で Cygwin を使用してBRATを実行しています。そのために、Cygwin で実行します。
その時点で、BRAT はhttp://127.0.0.1:8001の Web ブラウザからアクセスできるようになりました。
すべての Cygwin パッケージをインストールすると正常に動作しますが、最小限の Cygwin インストールのみを実行するとうまくいきません。
BRAT を実行するには、どの Cygwin パッケージをインストールする必要がありますか?
Python 2をインストールする必要があることは知っています:
ただし、http://127.0.0.1:8001/にアクセスすると、次のようになります。