ウィキペディアの 5 ページをフェッチし、html ソース コード内の部分文字列を検索する小さな Java アプリケーションを作成しています。ライブラリ org.apache.commons.lang3.StringUtils を使用しています。ただし、ウィキペディアの記事は大きくなる可能性があり、StringUtils には制限があるようです。
String html;
try {
html = Jsoup.connect("http://en.wikipedia.org/wiki/Canada").get().html();
} catch(IOException e) {
html = "";
}
String trimmedHtml = substringBetween(html, "<html>", "</html>");
System.out.println(html); // prints the whole source code fine
System.out.println(trimmedHtml); // prints null
null
コンソールに が出力されるのはなぜtrimmedHtml
ですか? 出力は (ほぼ) と同じ大きさになるはずですhtml
。文字列出力または のパラメータの最大長はありますsubstringBetween()
か?