0

次のhtmlスニペットがあります

       <span class='ocr_line' id='line_11' title="bbox 0 482 377 539">
<span class='ocrx_word' id='word_34' title="bbox 0 484 51 539"><em>WORD1</em></span> 
<span class='ocrx_word' id='word_35' title="bbox 56 482 119 528">WORD2</span> 
<span class='ocrx_word' id='word_35' title="bbox 56 482 119 528"><em></em></span> 
<span class='ocrx_word' id='word_36' title="bbox 137 483 171 528"><strong><em>WORD3</em></strong></span> 
<span class='ocrx_word' id='word_37' title="bbox 176 482 244 528"><h1>WORD4</h1></span> 
</span> 

xpath クエリ文字列で bbox 文字列と単語 1 ~ 4 のノード コンテンツを取得したいと考えています。<em>単語がs とsでネストされていて、<strong>空でもある可能性があるため、問題が発生しています。ありがとう。

4

1 に答える 1

0

これはおそらく://@title | //text()

于 2013-03-27T19:00:39.070 に答える