おはよう、
私は自分のアプリケーションにスタンフォードの品詞を使用していますが、多くのテキストファイルを解析する必要があります(20ファイルに達する可能性があります)。しかし、スタンフォードには時間がかかることに気づきました(30分以上かかることもあります)。問題は、スタンフォードが必要のない場合でも、構文ツリーを自動的に構築することです。誰かが以前にこの問題に直面したことがありますか?スタンフォードの解析時間を短縮するにはどうすればよいですか?
よろしくお願いします。
おはよう、
私は自分のアプリケーションにスタンフォードの品詞を使用していますが、多くのテキストファイルを解析する必要があります(20ファイルに達する可能性があります)。しかし、スタンフォードには時間がかかることに気づきました(30分以上かかることもあります)。問題は、スタンフォードが必要のない場合でも、構文ツリーを自動的に構築することです。誰かが以前にこの問題に直面したことがありますか?スタンフォードの解析時間を短縮するにはどうすればよいですか?
よろしくお願いします。
構文解析ツリーではなく、品詞のみが必要な場合は、(シーケンス モデル) 品詞タガー ( Stanford POS Taggerなど) を実行する必要があります。これは桁違いに高速です)。Stanford Parser FAQを参照してください。(高速なタグ付けが必要な場合 left3words-wsj-0-18.tagger
は、Stanford POS Tagger のモデルを使用してください。)