Javaプログラム内でGATEhttp: //gate.ac.uk/を使用して、named-entityを抽出できますか?はいの場合、例を挙げたり、いくつかの情報源に案内していただけますか。ありがとうございました
2 に答える
あなたの質問は、実際には2つの質問です。GATEを使用して名前付きエンティティを見つける方法と、GATEをアプリケーションに埋め込む方法です。
固有表現抽出または分類は巨大な研究分野であり、検索する固有表現抽出に応じて、さまざまなアプローチが最も効果的です。GATEは、英語のテキストで名前付きエンティティのいくつかのカテゴリを検索するための非常に基本的な地名集リストとルールベースのアプローチを提供します:ANNIE。ANNIEによって検出されたカテゴリがあなたにとって興味深いものである場合、開始する1つの方法は、ANNIEによってすでに提供されているものを理解して改善することかもしれません。ANNIEパイプラインは、ドキュメント内に個人、組織などの注釈を作成します。これらの注釈にアクセスし、それらの注釈の機能やテキストで必要なことをすべて実行するPRを使用または作成するだけで済みます。GATEのマニュアルをご覧くださいhttp://gate.ac.uk/sale/tao/split.htmlANNIEについて説明し、GATEを埋め込む方法(GUIを実行せずにJavaプログラムから直接GATEを使用する方法)に関するドキュメントもあります。
固有表現抽出NERに使用できるCREOLEプラグインのリストを次に示します。
- Tagger_Measurement
- Tagger_Number
あなたが医療NERに興味を持っているなら、あなたは使うことができます:
- Tagger_MetaMap:病気、症候群、手順などの医療エンティティを検索します
これらの外部プラグインもあります:
- AnatomyDiseaseProcedureFinderPR https://github.com/philgooch/AnatomyDiseaseProcedureFinderPR
- ClinicalMeasurements https://github.com/philgooch/ClinicalMeasurements