文字列内のすべての非ASCIIまたは非Unicode文字を検索し、それらをASCIIまたはUnicodeの同等のものに置き換えるPython用の包括的な文字置換モジュールはありますか? エンコードまたはデコード中の「無視」引数のこの快適さは正気ではありませんが、同様に「?」も同様です。翻訳されていないキャラクターがいたすべての場所で。
厄介な文字を見つけて、要求された標準に準拠させるモジュールを探しています。現存するアルファベットとエンコーディングの量がこれをやや不可能にしていることは理解していますが、誰かがそれを試したことはありますか? 初歩的な解決策でさえ、現状よりも優れています。
これが意味するデータ転送の簡素化は非常に大きいです。