現在マレットを使っていて、データのインポートに関しては、APIやオンラインの説明に従って、インポートファイルやインポートディレクトリでいいのですが、infer-topicsの部分になると、新しいドキュメント同じ alphabet を使用していることを確認するために、「input-pipe」オプションを使用してインポートする必要があります。
コマンド ラインでは簡単ですが、API を検索したところ、それらをリンクできるコードはどこにあるのだろうか? 既存の train-samples mallet に従って、新しいドキュメント ファイルを mallet 形式に変換するということですか?
ありがとう。