より大きなプロジェクトの一環として、言語Aから言語Bへの機械翻訳を実装したいと考えています。この言語セットを自動的に機械翻訳するツールがなく、利用可能な言語 B のコーパスが非常に少ないため、次のことを試みています。
1.言語Aの文が与えられた場合、ツールを使用して言語A PoS (品詞) タグのセットを取得します。
2.私が PoS タグ付けに使用しているツール (Freeling) は解析ツリーを返さないので、一連のタグから独自の解析ツリーを構築することを考えました。
3.解析ツリーが完成したら、それをレベルごとにトラバースし (ルートから開始)、言語Bの文法規則に従って要素を並べ替えます。
いくつかの調査を行った後、Earley 解析 (言語Bの文法は時間の経過とともに変化する可能性があるため、任意の言語を解析する能力に注目したため、特定の基準を常に満たすとは保証できません) について知りました。 ただし、私の最終的な目標は構造転送を行うことであるため、ボトムアップパーサーを使用して要素をルールに一致させて並べ替えようとすることでパフォーマンスが向上するかどうか、または間違った道を進んでいるかどうかはわかりません私の解決策は完全に間違っています。