java - OpenNLP 抽出文法

Question

私は現在、チャンキングに使用する文法を見つけて理解しようとしているopennlpソースコードを調べています。これは、最も簡単な作業の 1 つではありません。私はチャンカーモデルと関連するクラスを調べ始めましたが、あまり進んでいません..

誰もこれを検索したことがありますか？もしそうなら、私を道に導く提案やアイデアはありますか?

score 1 · Accepted Answer

実際、Apache OpenNLPにバンドルされているアルゴリズムは、統計的アプローチを使用した機械学習テクノロジーに基づいています。モデルには文法はありませんが、トレーニングデータから抽出されたパラメーターがあります。

アルゴリズムの詳細については、Jurafsky＆Martinの本「SpeechandLanguageProcessing」のセクション6.7をお勧めします。

探しているのが文法アプローチである場合は、ContraintGrammar形式を試してください。VISLのWebサイトには、いくつかの出版物が掲載されています。

1 に答える 1