日付文字列を認識できる必要があります。月と日付を区別できないかどうかは関係ありません(例:12/12/10)。文字列をDateオブジェクトに変換するのではなく、日付として分類する必要があります。したがって、これは実際には解析の問題ではなく分類です。
次のようなテキストがあります。
「 blablablabla 12 Jan 09 bla bla bla 01/04/10 blablabla」
内の各日付文字列の開始境界と終了境界を認識できる必要があります。
これを実行できるJavaライブラリを誰かが知っているかどうか疑問に思いました。私のgoogle-fuは今のところ何も思い付いていません。
更新:日付を表すための可能な限り幅広い方法のセットを認識できる必要があります。もちろん、単純な解決策は、考えられるすべての形式に対してifステートメントを記述することかもしれませんが、訓練されたモデルを使用したパターン認識アプローチは、理想的には私が求めているものです。