これはプログラミングに関する質問ではないかもしれませんが、Google で答えを見つけることができませんでした。
現在、テキストマイニングタスクとデータクリーニングを行っています。私は、判読可能な形式ではない謎の文字に出くわすことがよくあります。
これらの文字は次β
のとおり%
です。
これらはすべて特定のパターンで始まるため、Excel で読み取れないエンコーディングを表していると思います。
それらを変換する方法はありますか?これらの文字を削除する必要があるかどうかを判断するには、これらの文字の正確な意味を知る必要があります。