「%E6%B1%82%E5%8A%A9」のような文字列があります。
私の質問は、それが「UTF-8」によってエンコードされているかどうかをどうやって知ることができるかということです。また、GBK(またはGB2312)エンコーディングのようです。
ありがとうございました。
これはUTF-8エンコーディングではなく、パーセントまたはURLエンコーディングと呼ばれます。
URLDecoderAPIを使用してJavaでデコードできます。
バイトストリームのエンコーディングを100%の精度で検出する方法はありませんが、それでも非常に効果的な知識に基づいた推測を行うことができるライブラリがあります。それらの中で私はjuniversalchardetをお勧めします。