問題タブ [crf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - マレットでのCRFの整数値機能の処理
マレットでSimpleTaggerクラスを使い始めたところです。私の印象では、バイナリ機能を期待しています。私が実装したいモデルには正の整数値の機能があり、これをマレットでどのように実装するのか疑問に思います。また、モデルが意味をなすためには、非バイナリ機能を正規化する必要があると聞きました。これを行う方法についての提案をいただければ幸いです。
ps。はい、専用のマレットメールリストがあることは知っていますが、サブスクリプションが承認されてそこに投稿できるようになるまで、もう1日近く待っています。私はただ急いでいます。
metadata - 名前付きエンティティの認識に条件付きランダム フィールドを使用する
条件付き確率場とは?Conditional Random Fieldは、構造化テキストまたは非構造化テキスト内の人物、組織、または場所として固有名を正確にどのように識別しますか?
例: この製品は、StackOverFlow Inc. によって注文されました。
StackOverFlow Inc. を組織として識別するために、Conditional Random Field は何をしますか?
machine-learning - Mallet CRF SimpleTagger パフォーマンス チューニング
Java ライブラリ Mallet の SimpleTagger クラスを Conditional Random Fields (CRF) に使用したことがある方への質問です。使用可能な最大数の CPU に対してマルチスレッド オプションを既に使用しているとします (これがその場合です)。どこから始めればよいでしょうか?また、より高速に実行する必要がある場合は、どのようなことを試せばよいでしょうか?
関連する質問として、トレーニング プロセスを高速化する、確率的勾配降下法に似た方法があるかどうかという質問があります。
私がやりたいトレーニングのタイプは単純です。
(機能は、自分のコードでデータに対して行った処理の出力です。)
Mallet 以外の CRF 分類子をほぼ機能させるのに問題がありましたが、もう一度バックトラックして他の実装の 1 つを再検討するか、新しい実装を試す必要があるかもしれません。
java - Mallet: 各予測に対する機能の寄与
CRF を使用して Mallet で NER システムを開発しています。
各予測の機能の寄与を収集できるかどうか知っていますか? CRF モデルの正確な動作を知り、理解する必要があります。
助言がありますか?
ありがとう。
乾杯、ウクライナ
c++ - C ++で事実上サポートされている条件付き確率場パッケージとは何ですか?
私が見つけたいくつかのパッケージは、1年以上更新されていません。C ++用の標準CRFパッケージは何でしょうか?
python - NLTK で CRF を使用するにはどうすればよいですか?
NLTK のような HMM タガーには、CRF タガーもあるようです。しかし、チュートリアルやヘルプが見つかりません。どうすればいいですか?
pos-tagger - マレットCRFSimpleTaggerフレーズ/マルチワード
私はマレットの初心者です。マレットシンプルタガー/CRFを使用してフレーズを試しています。マレットサイトでドキュメントを検索し、ユーザーアーカイブも調べましたが、何の役にも立ちませんでした。
簡単なタグ付けのために木槌をトレーニングしてみましたが、それはうまく機能します。私のデータは次のようになります(トレーニング間には異なるセットであることを示す改行があることに注意してください)
サンプルトレーニングデータ:
私が抱えている問題は、都市名が複数の単語である場合です、と言います
上記のトレーニングデータでは、「新規」はストップワードの質問であることに注意してください。
- Simple taggerの場合、上記の表現は問題ありませんか?そうでない場合、どのように私は薬局を表すのですか?
- SimpleTagger/CRFが前の「n」の単語を使用してタグに到達できるようにデータを表現する方法がない場合はどうでしょうか。つまり、私の入力のチャンクのようなもの
java - MALLET: crf ベースの編集距離を実装するには?
MALLETに実装されていると思われる編集距離アルゴリズムを追跡しようとしています。
here (by Andrew McCallum et al)で説明されているように、CRF 編集距離アルゴリズムを使用したいと考えています。著者は、ここで FST クラスに Mallet が含まれていることを確認しています。
このモデルは、Mallet の有限状態変換器クラスの一部として実装されています。
ただし、FST チュートリアル ページ ( NER タガーが表示されます) もテスト ケースも、少なくとも私にはわかりませんが、何の役にも立ちません。
質問:
- Mallet の編集距離 CRF アルゴリズムの実装はどこにありますか?
- どのように使用できますか?
mallet - コマンド ラインから GenericAcrfTui を使用してテスト セットのラベルを表示するにはどうすればよいですか?
Mallet の GenericAcrfTui を使用してデータのトレーニングとテストを行っています。そのため、CRF トレーニングを行うために、Mallet のグラフィカル モデル (GRMM) を使用しています。トレーニング セットとテスト セットの両方の機能を作成し、コマンド ラインから GenericAcrfTui を実行したいと考えていました。実行すると、各ラベルの F スコアと精度測定値が返されますが、各行の実際のラベルは返されません。私はこのようなことをします:
これは、Mallet の例で示した例です。ただし、ラベルを取得するためのスイッチはないようです。どうやってそれをするのですか?