0

現在、BeautifulSoup4 を使用して日本語の Web サイトをクロールしています。日本語の文字のデコードに問題があります。「~」と「ー」のみ四角形の文字として返されます。この問題を解決する方法を知っている人はいますか? ウェブサイトは「utf-8」でエンコードされています。

解析用のコードは次のとおりです。

response = requests.get(url)
soup = BeautifulSoup(resonse.text, 'html.parser')

前もって感謝します。

4

0 に答える 0