ユニコードのサポートが必要ないくつかのサイトをスクレイピングしようとしています。たとえば、この本のタイトルを取得しようとしていますが、ごちゃごちゃした文字が返されます。
(-> "http://www.brill.nl/publications/evliya-celebis-book-travels"
java.net.URL. enlive/html-resource
(enlive/select [:h1#page-title]) first :content)
アラビア語のサイトをスクレイピングしようとすると、?????? が返されます。あらゆる所に。
(enlive/html-resource (java.net.URL. "http://www.aljazeera.net/portal"))
Unicode サポートを有効にする方法がわかりません。