問題タブ [bs4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
83 参照

python - Beautifulsoup によって返された HTML の解析

ここでいくつかのhtmlを解析しようとしていて、美しいスープを使用しています

ある時点で、次のように特定の div タグを検索します。

返される出力は次のとおりです。

私が興味を持っているのは括弧内の数字なので、このデータをさらに処理する必要があります。これに「re」正規表現を使用してみましたが、返されるオブジェクトは文字列として表されないため、機能しません。

0 投票する
3 に答える
4763 参照

python - BS4 および BeautifulSoup のエラー: /var/mail/BeautifulSoup を読み取れません

From Beautiful import Beautiful はすぐに「from: can't read /var/mail/BeautifulSoup」というエラーで応答します。BS4でも試してみましたが同じ結果でした。synaptic パッケージを使用して、BS4 と BeautifulSoup をアンインストールして再インストールしました。同じ結果です。完全に削除しようとしましたが、同じ結果になりました。Terminal を使用したところ、BS4 と BeautifulSoup がインストールされていませんでした。

Python 2.7.6 の使用

質問を確認しましたが、回答は 2 つしかなく、役に立ちませんでした。

助言がありますか?

0 投票する
1 に答える
668 参照

python - Python と Beautiful Soup で HTML を解析すると、jsl タグが表示されない

ちょっとした背景 (私はプログラミングの超初心者なので、ご容赦ください):

Googleマップからduration_in_traffic番号を取得しようとしています(APIがあることは知っていますが、このデータは「Maps for Business」に制限されているため、これが最も簡単なルートだと思いました)。

Beautiful Soup を使用してすべての<div>タグを検索すると、ほとんど何も表示されません。要素をもう少し詳しく調べると、ページの大部分が次のようなタグの下にネストされているように見えます。

これは、javascript とページの動的な性質に関係していると思いますが、Beautiful Soup を使用してこの jsl タグの下の部門にアクセスする方法はありますか?

0 投票する
2 に答える
1244 参照

python - インポートbs4に関するpython 2.7.10の問題

bs4 を正常にインストールしましたが、インポートすると、コマンド ラインに次のように表示されました。

Google で検索しましたが、解決策が見つかりませんでした。専門家がこの問題について助けてくれますか?

どうもありがとう !

私のシステム情報: PC OS: Windows 7 64bit Python バージョン: 2.7.10

0 投票する
1 に答える
4787 参照

python - CSV ファイルへの書き込み: ValueError: 閉じたファイルに対する I/O 操作

コードはカードから個々のイベントをスクレイピングしますが、このエラーが発生し続けます:

C:\Python27\python.exe C:/Users/James/PycharmProjects/scraperscrappy /scrapy.py トレースバック (最新の呼び出しが最後): ファイル "C:/Users/James/PycharmProjects/scraperscrappy/scrapy.py"、31 行目、writer.writerow(c) の ValueError: 閉じたファイルに対する I/O 操作

私はpyCharmを使用しています。

プロセスは終了コード 1 で終了しました Python はその場で csv ファイルを作成しますが、プロジェクト内で csv ファイルを作成しようとしましたが、それでも同じメッセージが表示されました。問題は 31 行目の zip の後の文字列にある可能性があります。どんな助けでも感謝します。

0 投票する
3 に答える
3575 参照

python - HTML5 data-* タグからの BeautifulSoup4 データ抽出

次のタグから内部テキスト24,000.00だけを抽出したい:

データを抽出したいページには、このような類似のタグがたくさんあります。

私はこれをやろうとしています:

しかし、出力が来ています:None

Bs4 doc使用する必要があるhtml5data-*タグのことから学びました:

私はここでは非常に初心者なので、この方法を使用して結果を出すことはまだできません。

0 投票する
0 に答える
118 参照

python - Beautiful Soup Python ループの繰り返しが完了しない

コードには 2 つの問題があります。1 つ目は、データがフィールド ヘッダーの下に適切に表示されないことです。2 つ目は、ループが html からデータの一部しか取得していないことです。コードは、すべて 1 つのページにある 14 のイベントを抽出しようとしますHTML コードは、ページ内のすべてのイベントで同一です (つまり、HTML が何度も繰り返されるだけです)。最初の問題は、結果のデータとフィールドの見出しにあります 。 SP,時間/秒,時間,距離,トレーナー,コメント

1,Bernies Toughguy,3,7/4F,3.63,23.91,(トレーナー: MN Fenwick),"コメント: EP,SnLd

2,Gentle Kewell,2,7/2,3.70,24.01 (1 1/4),(トレーナー: JM Liles),コメント: MidToRls,RanOn

3,Tintreach Harry,5,3/1,3.72,24.17(2),(トレーナー: ACB Green),"Comment: BmpRnUp&2,Crd 1/4"

4,Colorado Teegan,4,7/1,3.74,24.33 (2),(トレーナー: MN Fenwick),"Comment: Wide,EvCh"

5,Premarket Honey,6,6/1,3.68,24.51 (2 1/4),(トレーナー:ACB Green),"Comment: SAw,Crd2"

6,Malbay Roxy,1,7/2,3.81,24.57 (3/4),(トレーナー: MN Fenwick),"Comment: EP,SnLd"

ここで、各データは各フィールド (太字) の見出しの下に正しく配置されています。つまり、Finishing Position Dogname などです。ただし、プログラムを実行すると、次のようになります。

ヒレ,グレイハウンド,トラップ,SP,時間/秒,時間/距離, (トレーナー: MN Fenwick),"Comment: EP,SnLd"

1,Bernies Toughguy,3,7/4F,3.63,23.91,(トレーナー: JM Liles),"Comment: MidToRls,RanOn"

2,Gentle Kewell,2,7/2,3.70,24.01 (1 1/4),(トレーナー: ACB Green),コメント: "BmpRnUp& 1/4"

3,Tintreach Harry,5,3/1,3.72,24.17(2),(トレーナー:ACB Green),"Comment:"BmpRnUp&2,Crd 1/4"

4,Colorado Teegan,4,7/1,3.74,24.33 (2),(トレーナー: MN Fenwick),"Comment: Wide,EvCh"

5,Premarket Honey,6,6/1,3.68,24.51 (2 1/4),(トレーナー: JM Liles),"Comment: SAw,Crd2"

6,Malbay Roxy,1,7/2,3.81,24.57 (3/4),(トレーナー: BD O'sullivan),"Comment: EP,SnLd"

フィールド名を格納する必要がある最初の行で、フィールド名の一部を取得していますが、最後のいくつかはトレーナーの名前とコメントに置き換えられていることに注意してください (イタリック体)。さまざまな分野のデータをアップします。

2 番目の問題は、ループの繰り返しに関係している可能性があります。既に述べたように、ページ上の HTML は非常に均一ですが、何らかの理由でプログラムを実行すると、6 番目のイベントで 5 番目の参加者 (Avenue Bound) でデータが停止します。 (The 11.51) カードで、実際にはカードに 14 のイベントがあるため、残りのイベントでループが失敗しているため、ループが壊れているように見えますが、HTML に明確な理由が見当たりません。以下はコードです。私はコードの多くのバリエーションを試しましたが、それをクラックすることはできません.ループ内の反復回数を決定するためにコードを含める必要があるかもしれないと思いましたが、PythonループはCループとは異なり、これは初めてです.何かを見つけます。どんな助けでも大歓迎です。

0 投票する
1 に答える
117 参照

python - Python がインポート bs4 で機能しなくなった

実行しようとすると、「python.exe が動作を停止しました」というダイアログ ボックスが表示されます

Python のバージョンは次のとおりです。

この問題の根本原因を調査するには、どのような手順を実行できますか?

PS - Beautifulsoup パッケージを再インストールしようとしましたが、問題は解決しません