1

ウィキペディアの 5 ページをフェッチし、html ソース コード内の部分文字列を検索する小さな Java アプリケーションを作成しています。ライブラリ org.apache.commons.lang3.StringUtils を使用しています。ただし、ウィキペディアの記事は大きくなる可能性があり、StringUtils には制限があるようです。

String html;

try {
    html = Jsoup.connect("http://en.wikipedia.org/wiki/Canada").get().html();
} catch(IOException e) {
    html = "";
}

String trimmedHtml = substringBetween(html, "<html>", "</html>");

System.out.println(html); // prints the whole source code fine
System.out.println(trimmedHtml); // prints null

nullコンソールに が出力されるのはなぜtrimmedHtmlですか? 出力は (ほぼ) と同じ大きさになるはずですhtml。文字列出力または のパラメータの最大長はありますsubstringBetween()か?

4

1 に答える 1