0

トレーニング データ (train.txt) で CRF++ を実行しているときに、次のエラーが発生しました。

C:\Users\2012\Desktop\CRF_Software_Package\CRF++-0.58>crf_learn template train.d
ata model
CRF++: Yet Another CRF Tool Kit
Copyright (C) 2005-2013 Taku Kudo, All rights reserved.

reading training data: tagger.cpp(393) [feature_index_->buildFeatures(this)]
0.00 s

私のトレーニング データには Unicode 文字が含まれており、データはメモ帳を使用して保存されます (encoding= Unicode big indian)

テンプレートの問題か、トレーニング データの形式の問題かはわかりません。トレーニング データの形式を確認するにはどうすればよいですか?

4

4 に答える 4

0

私は同じ問題を抱えていました.ファイルはUTF-8であり、テンプレートファイルとトレーニングファイルは間違いなく正しい形式です. その理由は、CRFPP が入力ファイルに最大 1024 列を想定しているためです。そんな時に適切なエラーメッセージを出力してくれると良いのですが。

于 2016-02-16T09:42:23.610 に答える
0

問題は Unicode エンコーディングではなく、テンプレート ファイルにあります。

この類似の Q: CRF+0.58 トレイン NE モデルの使用に失敗しました

于 2017-05-08T17:50:10.707 に答える