問題タブ [mallet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text - 木槌と語幹
私はテキスト分類タスクにマレットを使用していますが、マレットがテキストに単語ステミング アルゴリズムを適用しているようです。この機能を使用しないように mallet を構成するにはどうすればよいですか?
import - mallet "import file" 使用パイプ
現在マレットを使っていて、データのインポートに関しては、APIやオンラインの説明に従って、インポートファイルやインポートディレクトリでいいのですが、infer-topicsの部分になると、新しいドキュメント同じ alphabet を使用していることを確認するために、「input-pipe」オプションを使用してインポートする必要があります。
コマンド ラインでは簡単ですが、API を検索したところ、それらをリンクできるコードはどこにあるのだろうか? 既存の train-samples mallet に従って、新しいドキュメント ファイルを mallet 形式に変換するということですか?
ありがとう。
java - MALLET: crf ベースの編集距離を実装するには?
MALLETに実装されていると思われる編集距離アルゴリズムを追跡しようとしています。
here (by Andrew McCallum et al)で説明されているように、CRF 編集距離アルゴリズムを使用したいと考えています。著者は、ここで FST クラスに Mallet が含まれていることを確認しています。
このモデルは、Mallet の有限状態変換器クラスの一部として実装されています。
ただし、FST チュートリアル ページ ( NER タガーが表示されます) もテスト ケースも、少なくとも私にはわかりませんが、何の役にも立ちません。
質問:
- Mallet の編集距離 CRF アルゴリズムの実装はどこにありますか?
- どのように使用できますか?
machine-learning - ビン/マレット トレイン トピックは、インスタンスごとに異なる結果を取得します
コマンド bin\mallet train-topics --input input.tutorial.mallet --num-topics 40 --num-iterations 100 --optimize-interval 50 --optimize-burn-in 200 --output- を実行しているときstate input.gz --output-topic-keys inputkeys.txt --output-doc-topics input-proportion.txt
コマンドを実行するたびに異なる結果が得られます。
出力:
0 AJAY_DASARI 19 0.062051649928263994 39 0.03263988522238164 35 0.03263988522238164 33 0.03263988522238164 32 0.03263988522238164 23 0.03263988522238164 ............... 1 BALVINDERSINGH 21 0.06297779395704405 36 0.04805242082271569 22 0.04805242082271569 35 0.03312704768838733 32 0.03312704768838733 31 0.03312704768838733 30 0.03312704768838733 26 0.03312704768838733 24 0.03312704768838733 15 0.03312704768838733 13 ......
コマンドを使用するたびに同じ結果を得る方法
mallet - ヘルプコマンドでもマレットが機能しない
マレット モミ トピック モデリングを使用する予定で、Linux を使用しています。私はマレットをインストールしましたが(アリではありません)、システムにJavaがあります。そのため、マレットにコマンドを使用したいときに機能しません。機能する唯一のコマンドは、コマンドのリストを提供するbin/malletです。次のように入力します: bin/mallet import-dir --help 次のエラーが表示されます:
どんな助けでも本当に感謝します。