私はpythonモジュールrequests
を使用していくつかのAPIからデータを取得していますが、それらはすべて辞書に変換されたjsonデータを返します。私がやりたいことは、これらの辞書からいくつかの情報を取得し、それらすべてをstemming
およびstring.translate()
モジュールを使用できる Python 文字列に変換するか、すべてをこれらのモジュールが認識できるデータに変換することです。UTF-8 データではこれを行うことができず、頭を悩ませています。これに対する解決策はありますか? dict を反復処理して ASCII に変換できますか?
奇妙なことは、ASCII 文字列を他の関数の UTF データと比較していて、(if ASCII-word is in UTF dict: do something)
完全に機能することです。ASCII 値は常に UTF-8 データと一致します。このエンコーディングについてはまったく理解できません