0

この Web サイトからコンテンツを抽出したい: https://it.projektwerk.com/de/projects/

例えば、私は XPath 式を持っています.//*[@id='content_0']/H3/A

これは有効な XPath 式です。たとえば、FirePath を使用してコンテンツを取得できます。ただし、javax.xml.xpathクラスを使用して検索することはできません。私はこのようにやっています:

XPath xpath = XPathFactory.newInstance().newXPath();
XPathExpression expr = xpath.compile(exprString);
Node node = expr.evaluate(doc, XPathConstants.NODE);

しかしnode、常にnull

同じ構文の他の式を持つ他の Web サイトがあり、それが機能しているため、これはわかりません (例: .//*[@id='p_p_id']/DIV/DIV/DIV/DIV[3]/A/H3/SPAN)

誰かが助けてくれることを願っています。

4

1 に答える 1