postgresデータベースにロードする必要のあるデータを含むテキストファイルが提供されています。
ファイルは、チルダ(〜)で区切られたフィールドを持つレコード(1行に1つ)で構造化されています。残念ながら、フィールドコンテンツにチルダが含まれることがあります。
ファイルは整理されたCSVでなく、チルダはエスケープされないため、レコードに含まれるフィールドが多すぎて、データベースが例外をスローし、ロードを停止します。
レコードがどのように表示されるかを知っています(テキスト、整数、浮動小数点フィールド)。
誰かが長すぎるレコードを修正する方法についての提案がありますか?私はperでコーディングしていますが、python、javascript、プレーン英語での提案に満足しています。