0

OpenNLP (Java) は、「2010 年 1 月 10 日」または「2010 年 1 月 10 日」という形式の日付を識別できません。OpenNLP トークナイザーを使用する前に、テキスト内のすべての「,」を空の文字列「」に置き換えました。これは、「2010 年 1 月 10 日」という形式の日付に対して正常に機能します。そこで、「th,」を「,」に置き換えてみましたが、うまくいきませんでした。上記のフォームの日付が OpenNLP で識別されるようにするにはどうすればよいでしょうか?

前もって感謝します

4

1 に答える 1

0

For an explanation of date finding and format, this newer post works well. It talks about the models recognizing dates within the context of the tokens around it since it is a statistical model.

For the th case above, as the comment says if you want to replace both the th and the , then you have to apply both replaces, or better yet do a single replace of th, with empty string.

于 2014-03-13T16:34:07.420 に答える