問題タブ [python-crfsuite]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 文の境界なしで CRF をトレーニングする
HTML ドキュメント内のテキストの一部にタグを付ける必要があります。ただし、ほとんどの場合、日付、会社名、住所などの形式のテキストで構成されています。CRF (sklearn-crfsuite) を使用する予定です。
私の問題は、データセットを文に分割するのが難しいことです。すべてを単一のシーケンスとして扱い、文の境界なしで CRF モデルをトレーニングできますか? CRFSuite または sklearn-crfsuite のチュートリアルでは、これについて説明していません。
文の分割なしではできない場合、そのようなテキストを文に分割する方法についてのヒントはありますか?
python - CRF (sklearn-crfsuite) モデル トレーニングの機能として単語埋め込みを使用する方法
単語埋め込み機能を使用して CRF モデルをトレーニングする NER モデルを開発したいと考えています。単語埋め込み機能がなくてもコードは完全に機能しますが、CRF トレーニングの機能として埋め込みを挿入すると、エラー メッセージが表示されます。これが私のコードのスニペットの一部です:
CRF モデルをトレーニングしたいときに、次のエラー メッセージが表示されました。
TypeError: only size-1 arrays can be converted to Python scalars
単語埋め込みベクトルを使用して CRF モデルをトレーニングする方法を誰かに教えてもらえますか?