次のようなファイルがあります。
ASDFGHJ|ASDFEW|ASFEWFEWAFEWASDFWE FEWFDWAEWA FEWDWDFEW|EWFEW|ASKOKJE
IOJIKNH|ASFDFEFW|ASKDFJEO JEWIOFJS IEWOFJEO SJFIEWOF WE|WEFEW|ASFEWAS
このファイルはキリル文字で書かれており、データベースがバイト数 (対文字数) について不平を言っているため、このファイルに問題があります。たとえば、最初のフィールドが 10 バイトを超えているか、2 番目のフィールドが 30 バイトを超えているかなどを確認したいと考えています。
私はさまざまなことを試してきました: awc、wc ... wc -c でバイトを数えることはできますが、X より大きいフィールドを持つ行だけを取得するにはどうすればよいですか?
何か案が?