正規表現を介して日付を一致させています。一部の人にとってはかなりうまく機能していますが、他の人にとっては単に機能していませんが、その理由はわかりません.
ドイツ語のRubyでこれを行っています:
def extract_dates
months = ["Januar", "Februar", "Maerz", "April", "Mai", "Juni", "Juli", "August", "September", "Oktober", "November", "Dezember"]
days = ["Montag", "Dienstag", "Mittwoch", "Donnerstag", "Freitag", "Samstag", "Sonntag"]
self.content.scan(/([0-9]{1,2}\.\s?[#{months.join("|")}]\s?[0-9]{4})/)
end
ランダムに選択したhttp://de.wikipedia.org/wiki/Inkunabelのテキストでテストしました。戻り値:
=> ["18. Juli 1471", "11. Februar 1486", "14. August 1473", "1. Januar 1501", "8. Januar 2008", "23. Mai 2006"]
そして、一致は正しいですが"31. Dezember 1500"
、私の目的では一致する必要がありますが、そうではありません。なぜ一致しないの"31. Dezember 1500"
ですか?