1

「|」演算子を使用してWebページの複数のノード/divを選択するxpath式があります。

これは次の式です。

hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract()

しかし、結果を出力すると、最初の式の出力の間にコンマが表示されます

//div[@class="cat"]/p

と2番目

//div[@class="entry"]

好き:

'Lorem ipsum', 'Ipsum Lorem'

カンマを取り除く方法はありますか?

好き:

'Lorem ipsum Ipsum lorem'

または、このdivとこのdivの両方を選択するxpath式を記述するためのより良い方法はおそらくありますか。

アプリケーションの残りの部分はPythonで書かれていますが、これは質問に関連しているとは思いません。どんな助けでも大歓迎です!

4

1 に答える 1

1

を使用しjoin()ます。

" ".join(hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract())
于 2012-07-20T17:52:14.177 に答える