問題タブ [named-entity-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 名前付きエンティティ認識 (NER) に焦点を当てていますか?
特定の分野 (例: 野球) の名前付きエンティティを認識したい。StanfordNER、LingPipe、AlchemyAPI などの利用可能なツールがあることを知っており、それらを使って少しテストを行いました。しかし、先に述べたように、私が望んでいるのは分野固有のものです。これはどのように可能ですか?
text - テキスト分類の機能としての名前付きエンティティ?
既存のテキスト分類 (教師あり) 手法では、テキスト内の名前付きエンティティ (NE) をトレーニングとテストの機能と見なさないのはなぜですか? NE を特徴として使用することで、精度を向上させることができると思いますか?
html - OpenNLPはトレーニングの一部としてHTMLタグを使用できますか?
プレーンテキストに変換されたhtmlドキュメントを使用してTokenNameFinderのトレーニングセットを作成していますが、精度が低く、トレーニングの一部としてHTMLタグを使用したいと思います。太字の単語や、余白のサイズが異なる文のように。OpenNLPはこれらのタグを受け入れて使用し、ルールを作成しますか?これらのタグを使用して精度を向上させる別の方法はありますか?
java - スタンフォード NER: エンティティの個別のリストを抽出しますか?
次のコードを使用して、名前付きエンティティで注釈が付けられた文字列を取得できます。
ファイル内の個別のエンティティ(PERSON、ORGANIZATION、LOCATIOIN)リストを取得できるように呼び出すメソッドがあるかどうか疑問に思っています。そのようにして、取得した文字列を上記のメソッドで解析してエンティティを取得する必要はありませんリスト?
nltk - nltkを使用して日付を名前付きエンティティとして認識しますか?
NLTK Named Entity Taggerを使用して、さまざまな名前付きエンティティを識別しようとしています。Pythonを使用した自然言語処理の本では、一般的に使用される名前付きエンティティのリストを提供しています(表7.4、興味がある場合は表7.4)。これはNLTKの名前付きエンティティタガーで実行できるという印象を受けました。
ただし、タガーを実行した場合、人や組織のように、日付や時刻をまったく取得していないようです。NLTK名前付きエンティティタガーはこれらの日付/時刻のケースを処理しませんか、それとも特定の日付/時刻形式のみを取得しますか?これらのケースを処理しない場合、誰かが処理するシステムを知っていますか?それとも、私自身の唯一の解決策を作成していますか?
ありがとう!
annotations - 半自動注釈ツール - RDF トリプレットの検索方法
私は医療テキスト用の半自動注釈ツールを開発していますが、注釈用の RDF トリプレットを見つけるのに完全に迷っています。
現在、NLP ベースのアプローチを使用しようとしています。私はすでにスタンフォード NER と OpenNLP を調査しましたが、どちらも病名を抽出するためのモデルを持っていません。
私の質問は次のとおりです: * 病名を抽出するための新しい NER モデルを作成するにはどうすればよいですか? OpenNLP または Standford NER から何か助けを得ることができますか? * NLP 以外に、テキストから RDF トリプレットを抽出するための別のアプローチはありますか?
どんな助けでも大歓迎です!ありがとう。
nlp - 固有表現認識のための言語に依存しないツール
言語に依存しない名前付きエンティティ認識用のライブラリがあるかどうか誰かが知っていますか?
ありがとう
named-entity-recognition - Stanford NER を使用して複数のファイルに NE をタグ付けする
スタンフォード NER を使用して、複数のファイルで名前エンティティにタグを付けたいと考えています。ドキュメントでは-testFiles
、コンマで区切られたテストファイルのリストでオプションを使用できると言われていますが、私の場合は次のように機能しません:
ただし、1つのファイルのみを入力すると機能します。
システムには、すべての複数ファイルのインライン評価 (FOR P、R) もありますか? 複数のファイルがある場合、どのように機能するのだろうか。
前もって感謝します。
カダカ
nlp - エンティティのセンチメント分析 (エンティティレベルのセンチメント分析)
過去 1 年間、ドキュメント レベルのセンチメント分析に取り組んできました。ドキュメント レベルのセンチメント分析では、ドキュメント全体のセンチメントが提供されます。例 - 「 Nokia is good but vodafone sucks big time 」というテキストは、エンティティ Nokia と Vodafone にとらわれないため、負の極性が関連付けられます。Nokia には肯定的だが Vodafone には否定的など、エンティティ レベルのセンチメントを取得するにはどうすればよいでしょうか? このような問題を解決する研究論文はありますか?
python - オランダ語での NLTK 名前付きエンティティの認識
オランダ語のテキストから名前付きエンティティを抽出しようとしています。nltk-trainerを使用して、conll2002 オランダ語コーパスでタガーとチャンカーをトレーニングしました。ただし、チャンカーからの parse メソッドは名前付きエンティティを検出していません。これが私のコードです:
そして、このプログラムの出力:
クリスティアーネが名前付き実体として検出されることを期待していました。何か助けはありますか?