0

OK Web スクレイピングを試みます。サイト、段落、クラスの一部を選択する方法を知っています...テキストを選択して抽出し、HTML の間に配置することは可能ですか。

例:

This is first paragraph.
This is second paragraph.

箇条書きリストのように取得したい。

<ul>
    <li>This is first paragraph</li>
    <li>This is second paragraph.</li>
</ul>

またはdivで

<div id="first">This is first paragraph</div> 
<div id="second">This is second paragraph.</div>
4

2 に答える 2

0

関数tokenizeを使用してから、xsl:for-each;を使用してみてください。それはあなたにとって大丈夫なはずです。

http://www.w3schools.com/xpath/xpath_functions.asp#stringおよびhttp://www.xml.com/lpt/a/1205を確認してください

于 2012-11-15T17:53:08.633 に答える
0

XPath で dom 要素を作成することはできませんが、何らかの文字列操作を行うことはできます。

たとえば、例を選択する XPath 式が '//p[1]' と '//p[2]' の場合、次のようなリストを作成できます。

concat(
"<ul>",
   "<li>", //p[1],  "</li>",
   "<li>", //p[2], "</li>",
"</ul>")

(段落テキストに < や & などの特殊文字が含まれていないと仮定します)

XPath の拡張のような XQuery もあり、次のように記述できます。

<ul>
    <li>{//p[1]}</li>
    <li>{//p[2]}</li>
</ul>

そのhtmlを作成します。

于 2012-11-15T17:48:26.990 に答える