問題タブ [beautifulsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - XML タグの小文字への変換に関する BeautifulSoup の動作を変更できますか?
XML で記述された構成ファイルを解析するコードに取り組んでいます。ここで、XML タグは大文字と小文字が混在し、大文字と小文字が区別されます。Beautiful Soup はデフォルトで XML タグを小文字に変換するようですが、この動作を変更したいと思います。
この件について質問したのは私が初めてではありません [こちらを参照]。しかし、私はその質問に対する答えを理解できず、BeautifulSoup-3.1.0.1 では BeautifulSoup.py に " encodedName
" または " Tag.__str__
"のインスタンスが含まれていないようです。
php - hpricot や PHP 用の美しいスープのようなものはありますか?
重複の可能性:
PHP 用の堅牢で成熟した HTML パーサー
PHPでhtmlドキュメントのサーバー側を解析および変更する良い方法を探しています。美しいスープと hpricot は非常に優れたツールのように見えますが、php では使用できません。PHPでこれを行うことができる良いライブラリはありますか? Tidy は部分的に私が探しているもののように見えますが、tidy でセレクターなどを使用できるようには見えません。
python - PythonでBeautifulSoupを使用して「'ResultSet'に属性'findAll'がない」というメッセージが表示されるのはなぜですか?
だから私はゆっくりとPythonを学び、オンラインゲームのハイスコアページからデータを引き出す簡単な関数を作ろうとしています。これは私が1つの関数に書き直した他の誰かのコードです(これは問題である可能性があります)が、このエラーが発生します。コードは次のとおりです。
前もって感謝します。
python - 美しいスープでネストされた要素を取得する方法
td でいくつかの href を取得するために必要な構文に苦労しています。テーブル、tr、および td 要素には、クラスまたは ID はありません。
この例でアンカーをつかみたいとしたら、何が必要ですか?
< tr > < td > < a >...
ありがとう
python - HTML 行の CSV への解析
まず、html 行は次のようになります。
実際の html を表示しますが、それをブロックする方法がわかりません。恥ずかしい
BeautifulSoup (Python) またはその他の推奨される画面スクレイピング/解析方法を使用して、同じディレクトリにある約 1200 の .htm ファイルを CSV 形式で出力したいと考えています。これは最終的に SQL データベースに入ります。各ディレクトリは 1 年を表しており、私は少なくとも 5 年を計画しています。
glob
私はいくつかのアドバイスからこれを行うための最良の方法としてふざけてきました。これは私がこれまでに持っていて、立ち往生しているものです。
これは醜いことはわかっていますが、このようなことを試みるのは初めてです。何千ものファイルを手動でコピーして Excel に貼り付ける必要がないことに気付いた後、この 1 つの問題に到達するまでに数か月かかりました。また、フラストレーションからコンピューターを繰り返しキックできることにも気付きましたが、それでも動作します (お勧めしません)。CSV ファイルを作成するために次に何をすべきかを知る必要があります。助けてください。そうしないと、モニターがついにハンマーで殴られてしまいます。
python - このエラーの修正または例外の作成方法
任意の Web ページから画像の URL を取得するコードを作成しています。コードは Python であり、BeutifulSoup と httplib2 を使用しています。コードを実行すると、次のエラーが表示されます。
誰かがエラーの修正または例外の作成方法を説明してくれます
python - 単純な python / Beautiful Soup 型の質問
Beautiful Soupを使用して抽出されたハイパーリンクの href 属性を使用して、単純な文字列操作を実行しようとしています。
私が得るのは次のとおりです。
何でもhref
通常の文字列に変換するにはどうすればよいですか?