2

まだ実装されていない別の言語でスタンフォード パーサーを使用したいと考えています。

私はウェブサイトを見ましたが、それを助けることができるものは何も見つかりませんでした.

私がしなければならないことは、新しい言語PCFG.serを「ただ」作成することだと思いますが、それを行うには?

また、フランス語とスペイン語がリリースされるかどうか知っている人はいますか?

4

1 に答える 1

5

いくつかのことが必要です:

  • パーサーで使用される確率が計算されるツリーバンク (手動で解析されたツリーのセット) が必要です。
  • 言語固有のファイル (xLanguagePack、xTreebankParserParams など) が必要で、言語、treebank エンコーディング、および解析オプションに関する事項を指定します。
  • 次に、ツリーバンクでパーサーをトレーニングして、文法ファイルを生成します (ディストリビューションの makeSerialized.csh を参照してください)。
  • テキストをトークンに分割するには、言語固有のトークナイザーが必要になる場合があります
  • スタンフォード依存関係の出力が必要な場合は、依存関係を定義するルールベースのレイヤーもあります

2011 年から、スタンフォード パーサーを使用したフランス語モデルの配布を開始しました。そして2015年からはスペイン語モデルの配信を開始。

于 2011-09-30T03:06:03.000 に答える