この Web サイトからコンテンツを抽出したい: https://it.projektwerk.com/de/projects/
例えば、私は XPath 式を持っています.//*[@id='content_0']/H3/A
:
これは有効な XPath 式です。たとえば、FirePath を使用してコンテンツを取得できます。ただし、javax.xml.xpath
クラスを使用して検索することはできません。私はこのようにやっています:
XPath xpath = XPathFactory.newInstance().newXPath();
XPathExpression expr = xpath.compile(exprString);
Node node = expr.evaluate(doc, XPathConstants.NODE);
しかしnode
、常にnull
。
同じ構文の他の式を持つ他の Web サイトがあり、それが機能しているため、これはわかりません (例: .//*[@id='p_p_id']/DIV/DIV/DIV/DIV[3]/A/H3/SPAN
)
誰かが助けてくれることを願っています。