形態学的実現ツール (できれば Java のツール) を知っている人はいますか? 私はプロジェクトに取り組んでおり、男性/女性 - 単数形/複数形 - 一人称/三人称の場合を提供する正しい動詞「to be」を実現する必要があり、そのような入力に関して正しい動詞「to be」を生成します。SimpleNLG は、形態学的実現を含む理想的なソフトウェアですが、英語とフランス語のみに対応しています。たとえば、特徴が男性の一人称単数の場合、結果は「I」になり、特徴が複数の三人称男性の場合、結果は次のようになります。 "彼ら"。
1 に答える
C ライブラリであるFOMAをチェックアウトできます (Windows 用のスタンドアロン実行可能ファイルとしても利用できます)。これは、有限状態変換器を利用するKimmo Koskenniemiの計算モデルに基づいています。これはxfstのオープン ソース バージョンです。ここでクイッククラッシュコースを見ることができます.
fomaの使い方はとても簡単です。github のこのレポは、サンプルとして役立つ可能性があります (spanish.lexc
およびspanish.foma
ファイルを確認してください)。foma を起動して 2 つのスクリプトを同じディレクトリに配置すると、ファイルをロードして形態素リアライザーをテストできます。
foma[0]: ソース spanish.foma
ファイル 'spanish.foma' を開いています。
定義済みワード: 1.6 kB。2 ステート、64 アーク、サイクリック。
定義されたクリーンアップ: 276 バイト。1 ステート、2 アーク、サイクリック。
ルート...5、A...2、N...2、V1...65、V2...65、V3...65
レキシコンの作成中...
決定中...
最小化中...
完了!
7.9キロバイト。289 の州、441 のアーク、199 のパス。
定義済みレキシコン: 7.9 kB。289 の州、441 のアーク、199 のパス。9.2キロバイト。290 州、505 アーク、サイクリック。
さて、FOMAのいいところは双方向であること。形態学的形態の認識と解析を同時に行うことができます。上に適用するとフォームを分析しますが、下に適用するとリアライザーとして機能します。
foma[1]: up
apply up> leo
leo+N+Sg
leo+A+Sg
leir+V+3C+PresenteIndicativo+1P+Sg
leer+V+2C+PresenteIndicativo+1P+Sg
lear+V+1C+PresenteIndicativo+1P+Sg
未来の場合、トランスデューサーをリアライザーとして使用する方法の例を次に示します。
foma[1]: down
apply down> estar+V+1C+PresenteIndicativo+3P+Sg
esta
lexc スクリプトの開始時に自分でタグを定義することを忘れないでください。そのため、そのリポジトリ内の既存のスクリプトを簡単に変更または拡張できます。ドキュメントを実際に読んでみると、すぐにコツがつかめます。とても便利で使いやすいです。幸運を!