問題タブ [bs4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Beautifulsoup によって返された HTML の解析
ここでいくつかのhtmlを解析しようとしていて、美しいスープを使用しています
ある時点で、次のように特定の div タグを検索します。
返される出力は次のとおりです。
私が興味を持っているのは括弧内の数字なので、このデータをさらに処理する必要があります。これに「re」正規表現を使用してみましたが、返されるオブジェクトは文字列として表されないため、機能しません。
python - BS4 および BeautifulSoup のエラー: /var/mail/BeautifulSoup を読み取れません
From Beautiful import Beautiful はすぐに「from: can't read /var/mail/BeautifulSoup」というエラーで応答します。BS4でも試してみましたが同じ結果でした。synaptic パッケージを使用して、BS4 と BeautifulSoup をアンインストールして再インストールしました。同じ結果です。完全に削除しようとしましたが、同じ結果になりました。Terminal を使用したところ、BS4 と BeautifulSoup がインストールされていませんでした。
Python 2.7.6 の使用
質問を確認しましたが、回答は 2 つしかなく、役に立ちませんでした。
助言がありますか?
python - Python と Beautiful Soup で HTML を解析すると、jsl タグが表示されない
ちょっとした背景 (私はプログラミングの超初心者なので、ご容赦ください):
Googleマップからduration_in_traffic番号を取得しようとしています(APIがあることは知っていますが、このデータは「Maps for Business」に制限されているため、これが最も簡単なルートだと思いました)。
Beautiful Soup を使用してすべての<div>
タグを検索すると、ほとんど何も表示されません。要素をもう少し詳しく調べると、ページの大部分が次のようなタグの下にネストされているように見えます。
これは、javascript とページの動的な性質に関係していると思いますが、Beautiful Soup を使用してこの jsl タグの下の部門にアクセスする方法はありますか?
python - インポートbs4に関するpython 2.7.10の問題
bs4 を正常にインストールしましたが、インポートすると、コマンド ラインに次のように表示されました。
Google で検索しましたが、解決策が見つかりませんでした。専門家がこの問題について助けてくれますか?
どうもありがとう !
私のシステム情報: PC OS: Windows 7 64bit Python バージョン: 2.7.10
python - CSV ファイルへの書き込み: ValueError: 閉じたファイルに対する I/O 操作
コードはカードから個々のイベントをスクレイピングしますが、このエラーが発生し続けます:
C:\Python27\python.exe C:/Users/James/PycharmProjects/scraperscrappy /scrapy.py トレースバック (最新の呼び出しが最後): ファイル "C:/Users/James/PycharmProjects/scraperscrappy/scrapy.py"、31 行目、writer.writerow(c) の ValueError: 閉じたファイルに対する I/O 操作
私はpyCharmを使用しています。
プロセスは終了コード 1 で終了しました Python はその場で csv ファイルを作成しますが、プロジェクト内で csv ファイルを作成しようとしましたが、それでも同じメッセージが表示されました。問題は 31 行目の zip の後の文字列にある可能性があります。どんな助けでも感謝します。
python - HTML5 data-* タグからの BeautifulSoup4 データ抽出
次のタグから内部テキスト24,000.00だけを抽出したい:
データを抽出したいページには、このような類似のタグがたくさんあります。
私はこれをやろうとしています:
しかし、出力が来ています:None
Bs4 doc
使用する必要があるhtml5data-*
タグのことから学びました:
私はここでは非常に初心者なので、この方法を使用して結果を出すことはまだできません。
python - Beautiful Soup Python ループの繰り返しが完了しない
コードには 2 つの問題があります。1 つ目は、データがフィールド ヘッダーの下に適切に表示されないことです。2 つ目は、ループが html からデータの一部しか取得していないことです。コードは、すべて 1 つのページにある 14 のイベントを抽出しようとしますHTML コードは、ページ内のすべてのイベントで同一です (つまり、HTML が何度も繰り返されるだけです)。最初の問題は、結果のデータとフィールドの見出しにあります 。 SP,時間/秒,時間,距離,トレーナー,コメント
1,Bernies Toughguy,3,7/4F,3.63,23.91,(トレーナー: MN Fenwick),"コメント: EP,SnLd
2,Gentle Kewell,2,7/2,3.70,24.01 (1 1/4),(トレーナー: JM Liles),コメント: MidToRls,RanOn
3,Tintreach Harry,5,3/1,3.72,24.17(2),(トレーナー: ACB Green),"Comment: BmpRnUp&2,Crd 1/4"
4,Colorado Teegan,4,7/1,3.74,24.33 (2),(トレーナー: MN Fenwick),"Comment: Wide,EvCh"
5,Premarket Honey,6,6/1,3.68,24.51 (2 1/4),(トレーナー:ACB Green),"Comment: SAw,Crd2"
6,Malbay Roxy,1,7/2,3.81,24.57 (3/4),(トレーナー: MN Fenwick),"Comment: EP,SnLd"
ここで、各データは各フィールド (太字) の見出しの下に正しく配置されています。つまり、Finishing Position Dogname などです。ただし、プログラムを実行すると、次のようになります。
ヒレ,グレイハウンド,トラップ,SP,時間/秒,時間/距離, (トレーナー: MN Fenwick),"Comment: EP,SnLd"
1,Bernies Toughguy,3,7/4F,3.63,23.91,(トレーナー: JM Liles),"Comment: MidToRls,RanOn"
2,Gentle Kewell,2,7/2,3.70,24.01 (1 1/4),(トレーナー: ACB Green),コメント: "BmpRnUp& 1/4"
3,Tintreach Harry,5,3/1,3.72,24.17(2),(トレーナー:ACB Green),"Comment:"BmpRnUp&2,Crd 1/4"
4,Colorado Teegan,4,7/1,3.74,24.33 (2),(トレーナー: MN Fenwick),"Comment: Wide,EvCh"
5,Premarket Honey,6,6/1,3.68,24.51 (2 1/4),(トレーナー: JM Liles),"Comment: SAw,Crd2"
6,Malbay Roxy,1,7/2,3.81,24.57 (3/4),(トレーナー: BD O'sullivan),"Comment: EP,SnLd"
フィールド名を格納する必要がある最初の行で、フィールド名の一部を取得していますが、最後のいくつかはトレーナーの名前とコメントに置き換えられていることに注意してください (イタリック体)。さまざまな分野のデータをアップします。
2 番目の問題は、ループの繰り返しに関係している可能性があります。既に述べたように、ページ上の HTML は非常に均一ですが、何らかの理由でプログラムを実行すると、6 番目のイベントで 5 番目の参加者 (Avenue Bound) でデータが停止します。 (The 11.51) カードで、実際にはカードに 14 のイベントがあるため、残りのイベントでループが失敗しているため、ループが壊れているように見えますが、HTML に明確な理由が見当たりません。以下はコードです。私はコードの多くのバリエーションを試しましたが、それをクラックすることはできません.ループ内の反復回数を決定するためにコードを含める必要があるかもしれないと思いましたが、PythonループはCループとは異なり、これは初めてです.何かを見つけます。どんな助けでも大歓迎です。
python - Python がインポート bs4 で機能しなくなった
実行しようとすると、「python.exe が動作を停止しました」というダイアログ ボックスが表示されます
Python のバージョンは次のとおりです。
この問題の根本原因を調査するには、どのような手順を実行できますか?
PS - Beautifulsoup パッケージを再インストールしようとしましたが、問題は解決しません