デーバナーガリー語を含む HTML コード
<html>
<head>
<title>TODO</title>
<meta charset="UTF-8">
</head>
<body>
मंत्री मुख्यमंत्री
</body>
<script src="jquery-1.11.0.min.js"></script>
<script src="xregexp_20.js"></script>
<script src="addons/unicode/unicode-base.js"></script>
<script src="addons/unicode/unicode-scripts.js"></script>
<script src="my.js"></script>
</html>
私のJavaScriptコード
var html = document.getElementsByTagName("html")[0];
var fullpage_content = html.innerHTML;
var regex = RegExp("मंत्री", "g");
var count = fullpage_content.match(regex);
console.log("count in page : " + count+ ", " + count.length);
//use of word boundry ,not supported by devanagari characters
regex = RegExp("\\bमंत्री\\b", "g");
count = fullpage_content.match(regex);
console.log("count in page : " + count);
regex = XRegExp("मंत्री");
var match = XRegExp.matchChain(fullpage_content, [regex]);
console.log("count in page : " + match + ", " + match.length);
//xregex do not support word boundry \\b
regex = XRegExp("\\bमंत्री\\b");
match = XRegExp.matchChain(fullpage_content, [regex]);
console.log("count in page : " + match + ", " + match.length);
js の出力 (Chrome 上)
ページ数 : 2, 2
ページ内のカウント: null
ページ数 : 2, 2
ページ内のカウント: , 0
全語検索は答えとして1つを与えるはずですが、regexpとXRegExpの両方が失敗しています。助けが必要です。