「 IgnoreNumbers() ~> 」など、すべての種類の数値を無視するコマンドがscalaにありますか?
私は scala 初心者ですが、実際、この言語で使用する必要があるスクリプトは 1 つだけです。
助けてくれてありがとう!
ここからのトークナイザー用ですhttp://nlp.stanford.edu/software/tmt/tmt-0.4/examples/example-1-dataset.scala :
val tokenizer = {
SimpleEnglishTokenizer() ~> // Remove punctuation
CaseFolder() ~> // Lowercase everything
WordsAndNumbersOnlyFilter() ~> // Ignore non-words and non-numbers
MinimumLengthFilter(3) // Take terms with >=3 characters
}