jcrfsuiteの例にあるPOSタグ付けの例から私が理解していることから。トレーニング ファイルはタブ区切りで、最初のトークンはラベルです。しかし、BigCluster| を取得できません。もの。トレーニング ファイルでトークンを指定する方法を教えてください。
以下の例:
o BigCluster | 00 BigCluster | 0000 BigCluster | 000000 BigCluster | 00000000 BigCluster | 0000000000 BigCluster | 0000000000 BigCluster | 000000000000 BigCluster | 00000000000000 |V 1gramSuff|i 1gramPref|前の単語| prevcurr||i nextword|predict nextword|predict currnext|i|predict Word|I Lower|i Xxdshape|X charclass|1, first-shortcap prevnext||predict t=0
テスト ファイル形式:
! BigCluster | 01 BigCluster | 0110 BigCluster | 011011 Bigcluster | 01101100 Bigcluster | 0110110011 Bigcluster | 011011001100 Bigcluster | 01101100110000 Bigcluster | 01101100110000 nextbigcluster | 10001000の| 1000100万bigの| mnn 4gramSuff|mmnn 5gramSuff|mmmmnn 6gramSuff|ammmnn 7gramSuff|aammmnn 8gramSuff|aaammmmnn 9gramSuff|daaammmmnn 1gramPref|d 2gramPref|da 3gramPref|daa 4gramPref|daaa 5gramPref|daaam 6gramPref|daaamm 7gramPref|daaammm 8grammnnwordPref|daaammnwordPref|daaammnn単語 prevcurr||daammmmn nextword|。次の単語|。現在の次|だああむん|。Word|Daaammmnn Lower|daaammmmnn Xxdshape|Xxxxxxxxx charclass|1,2,2,2,2,2,2,2,2, first-initcap prevnext||. t=0