問題タブ [bs4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4812 参照

python - bs4とBeautifulSoupによるインポートエラー

beautifulsoup互換性のあるものを使用しようとしlxmlていますが、エラーが発生します。

bs4インストールしました。この問題を修正するにはどうすればよいですか?

0 投票する
1 に答える
2324 参照

python - Python/BeautifulSoup - 間でテキストを抽出するにはどうすればよいですか
  • タグ
  • 次のhtmlコードがあります

    <li><dl>タグの間のテキストを抽出するにはどうすればよいですか。

    私はこれを試しました:

    これは印刷されます

    私は最初の行だけが欲しいです。

    0 投票する
    2 に答える
    174 参照

    python - Python および BS4 - 一定時間後に読み取りを停止する

    初めての Python 3 ユーザーで、コツをつかみ始めています。演習として、 http://rateyourmusic.com/customchartからテーブル (BeautifulSoup4 を使用) を読み取り、ランク、アーティスト、アルバム、および年を辞書に変換しようとしています。次に、辞書をMySQLデータベースに入れたいと思います。テーブルからすべての情報を取得して変数に入れ、それを辞書に入れることができましたが、少し問題があります。表の最後のエントリは広告であるため、その上の他の表の行には従いません。テーブルの最初の 100 行のみを読み取りたい。広告行を読み込もうとするとエラーが発生します。

    これが私のコードです。どんな助けでも素晴らしいでしょう。また、私のコードにエラーがある場合や、どうすればもっとうまくやれたか教えてください。

    辞書を印刷していて、すべて問題ないように見えますが、すべてを印刷した後にエラーが発生します。

    0 投票する
    3 に答える
    2271 参照

    python - BeautifulSoup: div タブの子を取得する方法

    これが私のコードです。

    このWebサイトからデータをスクレイピングしたいのですが、そのdivにはクラスがないため、その方法がわかりません.divタグの子を見つけることができることがわかりましたが、それも機能していないので試していますすべてのタグを取得します。

    0 投票する
    1 に答える
    96 参照

    python - BeautifulSoup 4 でのクラスの解析

    基本的に、html テーブル内の要素にアクセスしたいと思います。

    これが私のコードです:

    まったく何も得られません...[]

    同じ td でこのアプローチを試しましたが、今回はローカル テキスト ファイルで試してみましたが、うまくいくようです。私は何を間違っていますか?

    0 投票する
    1 に答える
    59 参照

    python - ウェブサイトのブロックをクロールする方法

    htmlの部分はこんな感じで、

    フォーマットとして取得する方法、例えば:

    これまでのところ、すべてのテキストを取得するために bs4 を使用することしか知りません: