2.5 GBを超える非常に大きな CSV ファイルがあり、SQL Server 2005 にインポートするColumn delimiter not found
と、特定の行 (82,449) にエラー メッセージ " " が表示されます。
問題は、その列のテキスト内の二重引用符にあります。この例では、誰かが " Transferred money to ""MIKE"", Thnks
" と書いたメモ フィールドです。
ファイルが非常に大きいため、Notepad++ で開いて変更を加えることができず、VIM を見つけました。
私は VIM に非常に慣れていないので、チュートリアル ドキュメントを確認しました。このドキュメントでは、ファイルを変更する方法を教えてくれました。82,449 G
その行を見つけてl
、その場所にx
、二重引用符を付けます。
を使用してファイルを保存すると、ファイル:saveas c:\Test VIM\Test.csv
の一部のようです。元のファイルは 2.6GB で、新しく保存されたファイルは 1.1GB です。元のファイルには 9,389,222 行あり、新しく保存されたファイルには 3,751,878 行あります。保存する前にコマンドを使用しG
てファイルの最後に到達しようとしましたが、サイズがかなり大きくなりましたが、それでもファイル全体は保存されませんでした。を使用する前G
は、ファイルはわずか 230 MB でした。
ファイル全体を保存しない理由について何か考えはありますか?