私は今、中国語の文字に関する問題に遭遇しました。Beautifulsoup を使用してデータを抽出し、抽出したデータの名前を使用してフォルダーを作成したいと考えています。データの好み:
<A href="love">星座(1824)</A>
「星座(1824)」を抽出したいので、好きです
soup.find('a',href='love')
しかし、コンソールでは、それが出てきます:
ÐÇ×ù(1824)
ソースの先頭に「# - -coding:utf-8 - -」を使用しています。それは何らかのエンコーディングの問題であるに違いありません。英語以外でのPythonの動作について、誰かが良い資料を提供できますか?
「星座(1824)」という名前のフォルダを作成したい:
if not os.path.exists(dir_name):
os.mkdir('./pic/'+dir_name)
「ÐÇ×ù(1824)」という名前のフォルダが存在するのを見つけたとき、なぜそれがまだ出てくるのか:
OSError: [Errno 17] File exists: './vguagua_pic/\xc3\x90\xc3\x87\xc3\x97\xc3\xb9(1824)'
どうも