var page = UrlFetchApp.fetch(contestURL);
var doc = XmlService.parse(page);
上記のコードを使用すると解析エラーが発生しますが、XmlService クラスを非推奨の Xml クラスに置き換え、寛大なフラグを設定すると、html が適切に解析されます。
var page = UrlFetchApp.fetch(contestURL);
var doc = Xml.parse(page, true);
この問題は主に、html の JavaScript 部分に CDATA がないために発生し、パーサーは次のエラーを表示します。
The entity name must immediately follow the '&' in the entity reference.
<script>(.*?)</script>
using regexをすべて削除しても、<br>
タグが閉じられていないため、まだ問題が発生します。HTMLをDOMツリーに解析するきれいな方法はありますか?