問題タブ [html5lib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
768 参照

python - conda envでpandas.read_html()関数を使用すると、エラー「html5libが見つかりません」

現在のコード:

'flavor' arg = 'bs4' または 'html5lib' を設定しながら、pandas.read_html() 関数を使用してページから html を抽出しようとしています。次のエラーが表示されます: ImportError: html5lib が見つかりません。インストールしてください。

しかし、確かにenvにbs4とhtml5libがインストールされています。conda list コマンドを実行した後:

pandas 関数でパッケージが認識されない理由がわかりません。同じ問題に対処する他の投稿が複数ありますが、解決策はどれもうまくいきませんでした.

例、次のようないくつかの投稿: Python: ImportError: lxml not found, please install it and

上記の回答は、pip3 を使用してパッケージをインストールすることを示唆しています。これらのコマンドを実行すると、次の情報が得られます。

同様の問題へのヘルプや参照は大歓迎です!

ありがとうございました!

0 投票する
2 に答える
195 参照

python - BeautifulSoup を使用して複数の URL をスクレイピングする

Web サイトをスクレイピングしようとしていますが、一度に複数の URL を挿入できるようにコードを完成させることができませんでした。現在、コードは一度に 1 つの URL で機能します。

現在のコードは次のとおりです。

このようなものを挿入できるように、誰かが変更を手伝ってくれませんか?

0 投票する
3 に答える
89 参照

python - 同じhtml属性と値で異なるコンテンツをスクレイピングする方法は?

Web ページから大量のデータをスクレイピングできますが、まったく同じ属性と値を持つサブセクションから特定のコンテンツを抽出するのに苦労しています。html は次のとおりです。

そのhtmlを参照として使用すると、次のようになります。

したがって、理想的な結果は次のとおりです。Specialty_1 = 人間関係の問題。Specialty_2 = うつ病; Specialty_3 = スピリチュアリティ

問題_1 = ADHD; Issue_2 = アルコール使用。Issue_3 = 怒りの管理

ありとあらゆる助けをいただければ幸いです!