このようなウェブページで
<div>text text</div> |text text 55.555555 |44.444444 | <div>text <b>name</b></div>
このような配列を取得する必要があります
{ [55.555555 , 44.444444, "name"] , [ ... , ... , ... ], ... }
-座標を見つける部分を実現するために正規表現を使用したいのですが、この部分の書き方がわかりません。
return all text parts which match this expression
いくつかのアイデア/機能を手伝ってもらえますか?
アップデート
ここでnativeTreeWalker関数がすべてのテキストノード/SO を取得することがわかり、この関数を変更して2つの数値と1つのテキストを検索しました。これはほとんど機能しますが、まだバグがあり、小数点なしで1234..のような偶数を返します。
function nativeTreeWalker() {
var walker = document.createTreeWalker(
document.body,
NodeFilter.SHOW_TEXT,
null,
false
);
var node;
var textNodes = [];
var name = false;
var elem = null;
while(node = walker.nextNode()) {
if (name){ elem.push(node.nodeValue); textNodes.push(elem); console.log(elem); name = false; }
else { elem = null; }
elem = node.nodeValue.match(/\d{2}.\d+/g);
if (elem!=null){ name=true; }
}
}
nativeTreeWalker()