私が使用するscan(/\p{graph}+/)
と動作します:
"ich gehe nach Köln am 12.09.2012".scan(/\p{graph}+/)
=> ["ich", "gehe", "nach", "Köln", "am", "12.09.2012"]
しかし、「 」のような入力エラーがある場合Köln.am
、出力は間違っています。
"ich gehe nach Köln.am 12.09.2012".scan(/\p{graph}+/)
=> ["ich", "gehe", "nach", "Köln.am", "12.09.2012"]
を使用するscan(/\p{alnum}+/)
と、日付が正しくありません:
"ich gehe nach Köln.am 12.09.2012".scan(/\p{alnum}+/)
=> ["ich", "gehe", "nach", "Köln", "am", "12", "09", "2012"]
誰かが別の解決策を知っていますか?