このトピックについては複数の議論があったことは知っていますが、そのうちの 1 つに次のようなものがあります: HTML エンコーディングの問題 - 「 」ではなく「Â」文字が表示される
私はそれに従いましたが、「メタ文字セット」タグをhtmlに追加せずにこれを解決したいのですが、実際にはヘッダーからすべてのタグを削除しています(Nokogiriにはいくつかの問題があります)。出力からこれらのÂを削除するために使用できる正規表現はありますか? 出力を「csv」に投げていますが、csv ファイルでこれらの Â を確認できます。
ありがとう!