1

jcrfsuiteの例にあるPOSタグ付けの例から私が理解していることから。トレーニング ファイルはタブ区切りで、最初のトークンはラベルです。しかし、BigCluster| を取得できません。もの。トレーニング ファイルでトークンを指定する方法を教えてください。

以下の例:

o BigCluster | 00 BigCluster | 0000 BigCluster | 000000 BigCluster | 00000000 BigCluster | 0000000000 BigCluster | 0000000000 BigCluster | 000000000000 BigCluster | 00000000000000 |V 1gramSuff|i 1gramPref|前の単語| prevcurr||i nextword|predict nextword|predict currnext|i|predict Word|I Lower|i Xxdshape|X charclass|1, first-shortcap prevnext||predict t=0

テスト ファイル形式:

! BigCluster | 01 BigCluster | 0110 BigCluster | 011011 Bigcluster | 01101100 Bigcluster | 0110110011 Bigcluster | 011011001100 Bigcluster | 01101100110000 Bigcluster | 01101100110000 nextbigcluster | 10001000の| 1000100万bigの| mnn 4gramSuff|mmnn 5gramSuff|mmmmnn 6gramSuff|ammmnn 7gramSuff|aammmnn 8gramSuff|aaammmmnn 9gramSuff|daaammmmnn 1gramPref|d 2gramPref|da 3gramPref|daa 4gramPref|daaa 5gramPref|daaam 6gramPref|daaamm 7gramPref|daaammm 8grammnnwordPref|daaammnwordPref|daaammnn単語 prevcurr||daammmmn nextword|。次の単語|。現在の次|だああむん|。Word|Daaammmnn Lower|daaammmmnn Xxdshape|Xxxxxxxxx charclass|1,2,2,2,2,2,2,2,2, first-initcap prevnext||. t=0

4

2 に答える 2

1

ラベルの後に指定されるのは、feature-name と feature-value のリストです。表形式ではなく疎な表現です。

BigCluster は機能の 1 つにすぎず、特定の例にのみ関連しています。ゼロからトレーニングする場合は、独自の機能を作成する必要があります。

于 2017-06-05T12:48:04.107 に答える