html - Xpathはテキストを選択し、箇条書きのリストをhtmlに与える

Question

OK Web スクレイピングを試みます。サイト、段落、クラスの一部を選択する方法を知っています...テキストを選択して抽出し、HTML の間に配置することは可能ですか。

例：

This is first paragraph.
This is second paragraph.

箇条書きリストのように取得したい。

<ul>
    <li>This is first paragraph</li>
    <li>This is second paragraph.</li>
</ul>

またはdivで

<div id="first">This is first paragraph</div> 
<div id="second">This is second paragraph.</div>

score 0 · Accepted Answer

関数tokenizeを使用してから、xsl：for-each;を使用してみてください。それはあなたにとって大丈夫なはずです。

score 0 · Accepted Answer

XPath で dom 要素を作成することはできませんが、何らかの文字列操作を行うことはできます。

たとえば、例を選択する XPath 式が '//p[1]' と '//p[2]' の場合、次のようなリストを作成できます。

concat(
"<ul>",
   "<li>", //p[1],  "</li>",
   "<li>", //p[2], "</li>",
"</ul>")

(段落テキストに < や & などの特殊文字が含まれていないと仮定します)

XPath の拡張のような XQuery もあり、次のように記述できます。

<ul>
    <li>{//p[1]}</li>
    <li>{//p[2]}</li>
</ul>

そのhtmlを作成します。

2 に答える 2