regex - sed はテキストの異なる部分を削除します

Question

ZDT 形式の語彙リストを操作しようとしていますTraditional Characters \t Simplified Characters \t Pinyin \t English \n。行の先頭にある繁体字を削除したいので、それらを削除しようとしましたsed 's/^[^\t]*\t//g' input.txt > output.txtが、一部の行では英語のセクションのどこかまですべてが削除され、他の行では目的の結果に近づきません。行はまったく削除されず、パターンを理解できません。

ここでテストしたところ、Sublime Text 2 も期待どおりに動作するので、RegEx は正しいと思います。ここで何が問題なのですか？

編集: http://pastebin.com/fRemVPyT
の始まりinput.txt http://pastebin.com/EJkszFNF
の始まりoutput.txt

score 2 · Accepted Answer

すべてのsedバージョンが好きというわけではありません\t。リテラルのタブ文字を使用してみてください。bash次のようなタブを含む変数を作成できます。

export TAB=$'\t'

多分このように：

sed "s/^[^$TAB]*$TAB//g" input.txt > output.txt

regex - sed はテキストの異なる部分を削除します

1 に答える 1

Related

Reference