わかりました Windows でいくつかのドキュメントを分類するために Mallet を使用しようとしています
私はLinuxでそれを達成しました。Windows(ターゲット環境)で仕事をすることはできません
データを .mallet ファイルにインポートしました。
次に、この入力データを使用して分類器を作成しました。
-rw-r--r-- 1 henry henry 15197116 Feb 23 15:56 nntp.classifier
と
07/03/2014 21:28 15,197,116 nntp.classifier
ただし、Linuxで実行すると:
bin/mallet classify-dir --input ./testfolder --output - --classifier nntp.classifier
テストフォルダー内のファイルを繰り返し処理し、それぞれがどのクラスを考えているかをダンプします。
しかし、Windows で同じコマンドを実行すると:
bin\mallet classify-dir --input ./testfolder --output - --classifier nntp.classifier
コマンドリストをダンプするだけです:
Mallet 2.0 commands:
import-dir load the contents of a directory into mallet instances (one per file)
import-file load a single file into mallet instances (one per line)
import-svmlight load a single SVMLight format data file into mallet instances (one per line)
train-classifier train a classifier from Mallet data files
train-topics train a topic model from Mallet data files
infer-topics use a trained topic model to infer topics for new documents
estimate-topics estimate the probability of new documents given a trained model
hlda train a topic model using Hierarchical LDA
prune remove features based on frequency or information gain
split divide data into testing, training, and validation portions
Include --help with any option for more information
私が気づいたこと:私は
f bin/mallet classify-dir --help
Linux で実行するとヘルプ ファイル、つまり各コマンドの説明が表示されますが、Windows で同じことを行っbin\mallet classify-dir --help
ても同じ結果は得られません。上記のコマンド リストだけです... (コマンドとして jump を入力すると、同じことが行われます) )
一方、前のコマンドの 1 つである egbin/mallet import-dir --help
とbin\mallet import-dir --help
は、同じ完全なヘルプ ファイル出力を生成します。