問題タブ [python-crfsuite]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
349 参照

machine-learning - 文の境界なしで CRF をトレーニングする

HTML ドキュメント内のテキストの一部にタグを付ける必要があります。ただし、ほとんどの場合、日付、会社名、住所などの形式のテキストで構成されています。CRF (sklearn-crfsuite) を使用する予定です。

私の問題は、データセットを文に分割するのが難しいことです。すべてを単一のシーケンスとして扱い、文の境界なしで CRF モデルをトレーニングできますか? CRFSuite または sklearn-crfsuite のチュートリアルでは、これについて説明していません。

文の分割なしではできない場合、そのようなテキストを文に分割する方法についてのヒントはありますか?

データは次のようなものです:(実際のデータを共有することはできません) ここに画像の説明を入力

0 投票する
1 に答える
2330 参照

python - CRF (sklearn-crfsuite) モデル トレーニングの機能として単語埋め込みを使用する方法

単語埋め込み機能を使用して CRF モデルをトレーニングする NER モデルを開発したいと考えています。単語埋め込み機能がなくてもコードは完全に機能しますが、CRF トレーニングの機能として埋め込みを挿入すると、エラー メッセージが表示されます。これが私のコードのスニペットの一部です:

CRF モデルをトレーニングしたいときに、次のエラー メッセージが表示されました。

TypeError: only size-1 arrays can be converted to Python scalars

単語埋め込みベクトルを使用して CRF モデルをトレーニングする方法を誰かに教えてもらえますか?