私はStanford NLP Classifierを使用しており、ダウンロード ファイルでスタンフォードが提供するサンプル ファイルである ClassifierDemo.java を使用して、コマンド ラインを使用してプログラムで実行する方法をほとんど知っています。また、プログラムが入力として受け取る構成/プロパティファイルに必要なすべてのパラメーターを設定することについてもかなりの知識があります。この知識があれば、次のシナリオに対応できるのではないかと思います。
スタンフォード nlp 分類器が、ステミング、レンマタイゼーション、pos tagger、NER、正規表現に基づく単語の分割、トークン化、特徴ベクトルの構築、個々の特徴ごとの重みの割り当てなどの操作を行うことを知っています。これらすべての操作をいじるパイプラインの方法を探しています。つまり、最終的な出力が生成されるまで、1 つのステップの出力を次のステップへの入力として供給します。また、スタンフォード分類子の pdf 配布資料と wiki ページで十分な説明を見つけることができず、プロパティ/構成ファイルで printTo を個人的に操作しようとしましたが、それでも私のニーズには十分ではありません。
要するに、個々の操作のそれぞれの後に出力を取得し、同じファイルを次の操作への入力として再度供給する必要があるような、パイプラインの作業方法を探しています。Java ドキュメントはパッケージと共に提供されますが、現在のダウンロードにはスタンフォードから提供されるソース コードはありません。また、レンマタイゼーション、ステミング、pos tagger、NER、正規表現に基づく単語の分割、トークン化、特徴ベクトルの構築、個々の特徴への重みの割り当て、クラス モデルの構築などの各操作の後に出力を生成することは可能ですか?等..