ZDT 形式の語彙リストを操作しようとしていますTraditional Characters \t Simplified Characters \t Pinyin \t English \n
。行の先頭にある繁体字を削除したいので、それらを削除しようとしましたsed 's/^[^\t]*\t//g' input.txt > output.txt
が、一部の行では英語のセクションのどこかまですべてが削除され、他の行では目的の結果に近づきません。行はまったく削除されず、パターンを理解できません。
ここでテストしたところ、Sublime Text 2 も期待どおりに動作するので、RegEx は正しいと思います。ここで何が問題なのですか?
編集: http://pastebin.com/fRemVPyT
の
始まりinput.txt
http://pastebin.com/EJkszFNF
の
始まりoutput.txt