Python で CRF POS Tagger を使用して、英語の PTB サンプル コーパスをトレーニングしていますが、結果は非常に良好です。
ここで、CRF を使用して大規模なベトナム語コーパスをトレーニングしたいと考えています。適切な名前、日時、番号などのベトナム語の機能をこのタガーに追加する必要があります...何日も試しましたが、その方法がわかりません。私はすでにデータのフォーマットを知っていたので問題ありません。
私はPythonが初めてです。したがって、詳細な回答は役に立ちます。ありがとう。