1

left3wordsleft5wordsbidirectional、などの標準の arch オプション以外bi5wordsに、残りのオプションは何を意味しますか? そして、それらにはどのような議論が必要ですか?

ドキュメントがどこにも見つからないようです!

4

1 に答える 1

2

申し訳ありませんが、アーチ オプションは現在、ソース コードにのみ記載されています :-(.

ExtractorFrames および ExtractorFramesRare クラスを参照してください。

最初にすべきことは、分散タガーで使用されているアーキテクチャ オプションを確認することです。これらは、models サブディレクトリの *.props ファイルにあります。

簡単に言えば:

  • 「ジェネリック」は、単語とタグ機能の適切な基本セットを提供します (現在、前、次の単語機能、前のタグと前の 2 つのタグ、前のタグと現在の単語、現在の単語と前の単語の結合)。始めるには良い場所です。
  • 英語と中国語の既知の適切な構成 (双方向、sighan2005、naacl2003unknowns) を提供するために、多数のエクストラクターをオンにするさまざまなオプションがあります。
  • 多くの場合パラメーターを伴うその他のオプションは、一緒に混合できる賢明な方法で一連の機能を有効にします。これは、配布されている中国語およびアラビア語のタグ付けの定義で確認できます。たとえば、suffix(6) は、長さが 6 までのすべての語尾部分文字列を機能として含みます。
于 2010-08-03T18:22:55.490 に答える