問題タブ [crf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
611 参照

python - Python CRFsuite で並列化は可能ですか?

Python CRFSuite ( https://github.com/tpeng/python-crfsuite ) を並列化することは可能ですか? CRF++ は並列化をサポートしていると思うので、CRFsuite でも並列化を有効にするフックがいくつかあるはずです。

0 投票する
0 に答える
1466 参照

python - anaconda への python-crfsuite のインストール

からpythoncrfsuiteパッケージをダウンロードしました

https://pypi.python.org/pypi/python-crfsuite

そしてそれを経由してインストールしました

コマンドで、システムに完全にインストールされました。ただし、pycrfsuite をインポートするたびに、spyder で使用できません。この次のエラーが表示されます。同じ問題に対する適切な解決策を教えてください。

それにもかかわらず、__init_.py を含むフォルダーに _pycrfsuite.cpp という名前のファイルがあります。

0 投票する
1 に答える
24507 参照

python - TypeError: NLTK の str ではなく、Unicode でなければなりません

私はpython2.7、nltk 3.2.1、およびpython-crfsuite 0.8.4を使用しています。私はこのページをフォローしています: http://www.nltk.org/api/nltk.tag.html?highlight=stanford#nltk.tag.stanford.NERTagger for nltk.tag.crf モジュール。

まず、これを実行するだけです

これもやってみた

しかし、次のエラーが表示されます。

0 投票する
1 に答える
80 参照

nlp - CRFモデルの作成に時間がかかりすぎる

CRF モデルを作成するために、このリンクをたどっています。モデルの作成には次のコマンドを使用しています。

モデルは正常に作成されましたが、トレーニング データが非常に多く、時間がかかりすぎています。システムで何が起こっているかを注意深く観察すると。コンピューターのコアを 1 つだけ使用しています。

コンピューターの多くのコアを使用する方法でこのコマンドを実行できますか? シングルスレッドとして実装されているようです。マルチスレッドのサポートはありますか? はいの場合は、親切に共有してください。

0 投票する
2 に答える
556 参照

machine-learning - CRF (Conditional Random Fields) を使用して文全体にラベルを付けることはできますか?

機械学習を使用して文にラベルを付けようとしています (各文には単一のラベルが付いています。文は互いに独立していると想定しています)。この場合、線形 CRF モデルで問題ないと思いましたが、いくつか質問があります。

私はCRF++を使用してみました (私が見た他の実装には類似した形式があるようです)。文を入力として使用しますが、出力ラベルは各トークンに割り当てられます。文全体に単一のラベルを使用する方法は? (私が考えたハックは、テスト データのドットのみに重要なラベルを割り当て、それを文全体の出力ラベルとして扱うことです。)

異なる長さの文はどのように使用できますか? トレーニング構成では、現在のトークンを分析するときにどのトークンを考慮するかを指定する必要があります。しかし、文には多数または少数のトークンが含まれる可能性があり、情報全体を利用するために、文のすべてのトークンを (多かれ少なかれ) 使用したいと考えています。

この質問から、私がやろうとしていることは可能だと思われます (シーケンス全体の単一ラベル) が、そのためのトレーニング データをフォーマットする方法がわかりません。

0 投票する
0 に答える
145 参照

java - 独自の機能関数を Mallet CRF に組み込む方法は?

私は独自の CRF モデルを実装しています。Mallet の CRF トレーナーを使用して、実装した特徴関数の重みを取得したいと考えています。

特徴関数を Mallet の CRF に渡して、最適な重みを検索するにはどうすればよいですか?

0 投票する
1 に答える
559 参照

mallet - Mallet Java API を使用してデータをインポートする方法

私は Mallet を初めて使用し、その CRF 機能を使用して名前付きエンティティ認識を実行しようとしています。Web サイトで Java を使用してデータをインポートする方法を示す例があることは知っていますが、それはプレーン テキスト (トレーニング セット形式ではない) を扱っています。これで、トレーニング データを次の形式で利用できるようになりました (Web サイトに示されている正確な形式)。最初の列は単語、2 番目の列はラベルです。

注: レンダリングされた出力には表示されませんが、これはタブで区切られているようです

だから今私は立ち往生しています。上記のデータを Mallet API を使用してトレーニング セットとしてインポートするにはどうすればよいですか?

コマンドラインでそれを行う方法は知っていますが、JAVA をコーディングして、将来 API を使用してさらに機能を追加できるようにしたいと考えています。

0 投票する
1 に答える
3298 参照

tensorflow - テンソルフローで文レベルの対数尤度を実装するには?

Collobert et al.で説明されているように、文レベルの対数尤度を実装したいと考えています 。、p。14.

遷移スコアを計算するには、CRF を使用できますが、テンソルフローに統合する方法がわかりません。遷移スコアを計算するためにtf.contrib.crf.CrfForwardRnnCellを使用することを考えまし たが、このクラスは新しいアルファ値を含む [batch_size, num_tags] 行列値のペアを返します。 .

テンソルフローでCRFを使用する方法の例はありますか? ありがとうございました!