“beautifulsoup”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

6299 参照

python - BeautifulSoupで特定の子要素を選択します

私はBeautifulSoupを読んで、かなり重いhtmlページをスクリーンスクレイピングしています。BeautifulSoupのドキュメントを調べてみると、子要素を選択する簡単な方法が見つからないようです。

与えられたhtml：

オブジェクトが一番上にあるので、「欲しいコンテンツ」を簡単に取得できる方法が必要です。BeautifulSoupに来るのは簡単だと思いました。topobj.nodes[1].nodes[0].stringのようなものです。代わりに、テキストノードやコメントなどとともに要素を返す変数と関数のみが表示されます。

私は何かが足りないのですか？または、.find（）を使用して長い形式に頼る必要がありますか、さらに悪いことに、.contents変数のリスト補完を使用する必要がありますか。

その理由は、Webページの空白が同じであるとは思わないので、それを無視して要素のみをトラバースしたいからです。

2009-10-15T11:12:42.223

0 投票する

1 に答える

600 参照

python - Pamie と python-win32 の質問 pamie3 が機能しない

現在、いくつかの Web スクレイピングスクリプトを作成しています。そして、私は私のスクリプトを使用するために PAMIE を選択しました。実際、Pythonとプログラミングは初めてです。だから、私がPAMIEを使っているかどうかはわかりません.win32-pythonに関連するスクリプトを作成すると本当に役に立ちます。わかりました私の問題は、スクリプトを作成しているときに、2つの問題に遭遇したことです。まず、スクリプトを Beautifulsoup と PAMIE と連携させたいと思います。または、ネイティブの Internet Explorer インターフェイスを一緒に使用できる場合も問題ありません。

しかし、それは私にはうまくいきません。私はPAMIE3バージョンを使用しています.PAMIE 2bバージョンに変更しても動作しませんでした.

私の 2 番目の問題は、スクリプトを作成しているときに、通常の IE インターフェイスが必要になる場合があることです。PAMIE の IE インターフェイスを通常の IE インターフェイス (InternetExplorer.Application) に変更することはできますか? 新しい IE ウィンドウを開いて通常の IE インターフェイスで作業するのではなく、現在の PAMIE の IE ウィンドウで作業を続けたい。下手な英語でごめんなさいポール

python winapi beautifulsoup pamie

2009-10-23T07:23:45.243

0 投票する

1 に答える

1918 参照

python - Jython を使用した BeautifulSoup

Jython (2.5.1) で BeautifulSoup (3.1.0.1) を実行しようとしたところ、CPython よりもはるかに遅いことに驚きました。ページ ( http://www.fixprotocol.org/specifications/fields/5000-5999 ) を CPython で解析すると、1 秒弱 (正確には 0.844 秒) かかりました。Jython では 564 秒かかりました。これはほぼ 700 倍です。

誰でもこの結果を確認できますか? Jython が CPython より 700 倍遅く実行されるのは合理的ではないようです。おそらく、私の設定に何か問題があります。

[編集]これをテストするために使用したコードは次のとおりです（当然、上記のHTMLファイルをダウンロードしました）：

python jython beautifulsoup

2009-11-02T13:22:53.220

0 投票する

2 に答える

7241 参照