“beautifulsoup”の関連問題_Stack Overflow日本語サイト

0 投票する

11 に答える

60606 参照

python - BeautifulSoup を使用してタグを削除しますが、その内容は保持します

現在、私は次のようなコードを持っています:

無効なタグ内のコンテンツを破棄したくない場合を除きます。タグを取り除き、soup.renderContents() を呼び出すときにコンテンツを保持するにはどうすればよいですか?

python beautifulsoup

2009-11-19T19:19:28.420

0 投票する

4 に答える

1489 参照

python - Python と BeautifulSoup、「a」が見つからない

これはHTMLコードの一部です（おいしいから）：

class="inlinesave action" であるすべてのリンクを見つけようとしています。コードは次のとおりです。

しかし、何も見つかりません！

何かご意見は？

ありがとう

2009-11-25T12:51:12.103

0 投票する

3 に答える

178 参照

html - HTMLページで小さなWebフォームをデザインする方法

Web フォームを設計すると、Web フォームが Web ページよりも非常に小さいことがわかります。これは、フォームには 2 つのフィールド (2 つのテキストボックスと 2 つのラベル) しかないためです。それから彼は美しく見えます。

html beautifulsoup

anirudha Gupta

2009-11-28T09:11:05.753

0 投票する

4 に答える

9133 参照

python - このXPath式をBeautifulSoupに変換するにはどうすればよいですか？

前の質問に答えて、何人かの人々は私が私のプロジェクトにBeautifulSoupを使うことを提案しました。私は彼らのドキュメントに苦労していて、それを解析することはできません。この式をBeautifulSoup式に変換できるはずのセクションを誰かに教えてもらえますか？

上記の式はScrapyからのものです。そこからリンクを取得するために正規表現re('\.a\w+')を適用しようとしています。td class altRow

他のチュートリアルやドキュメントへのポインタもいただければ幸いです。何も見つかりませんでした。

ご協力いただきありがとうございます。

編集： 私はこのページを見ています：

それでも、ページのソースを見ると、次のようになっています"/cabel"。

何らかの理由で、検索結果はBeautifulSoupには表示されませんが、hxs.select('//td[@class="altRow"][2]/a/@href').re('/.a\w+')「/ cabel」をキャッチするため、XPathには表示されます。

編集： cobbal：それはまだ機能していません。しかし、私がこれを検索すると：

2番目の文字「a」を含むすべてのリンクを返しますが、弁護士名は返しません。したがって、何らかの理由で、これらのリンク（ "/ cabel"など）はBeautifulSoupに表示されません。理由がわかりません。

python xpath beautifulsoup

2009-11-29T05:36:20.560

0 投票する

3 に答える

4445 参照

python - Beautifulsoupはテーブルで価値を得る

http://www.co.jefferson.co.us/ats/displaygeneral.do?sch=000104をスクレイプして、「所有者名」を取得しようとしています。私が持っているものは機能しますが、本当に醜く、最高ではありません。確かに、もっと良い方法を探しています。これが私が持っているものです：