スクリーン スクレイピングを使用して Excel スプレッドシートにデータを入力するパイプ区切りのテキスト ファイルをユーザーから受け取ったので、データがごちゃごちゃしています。ランダムでいっぱいで^M (carriage returns)
、<96> (windows en dash)
インポートが不完全になります。
を試しましたdos2unix
が、変換に問題があるというエラーが表示されます。^M
このサイトで見つけたこのソリューションを使用して、すべてを削除しました。
tr -d '\r' < infile > outfile
<96>
文字は残ります。'/r'
これらのダッシュに匹敵するものは何ですか? それとも、より良い解決策がありますか?可能であれば、実際には「悪い」ダッシュを「良い」ダッシュに置き換えたいと思います。