perl を使用して HTML の特殊記号を削除しようとしています。この HTML::Strip, Encode qw( _utf8_on); を使用してみました。
use Encode qw( _utf8_on );
_utf8_on($string);
print "$string\n\n";
Output: Clearance Subject Male control 5 1-a 21 31â ±â2 74
use HTML::Strip;
my $hs = HTML::Strip->new();
my $clean_text = $hs->parse($string);
print "$clean_text\n";
Ouput: Clearance Subject Male control 5 1-a 21 31â ñâ2 74
Expected output: Clearance Subject Male control 5 1-a 21 31±2 74
これで誰かが私を助けることができますか?
前もって感謝します