1

以下の形式のデータがあります。

<a>        <b>       <c>>       NULL                    NULL                      
<d>        <e>       <f<>      '1999-10-10',           '2000-10-10'
<g<>       <h>       <i>>      '300-12-12 BC',         '300-01-01 BC'
<m>        <l>       <k<,>j>    NULL                    NULL
<g>        <k>       "o,l"      NULL                    NULL

ここで、a,b,c,d,e,f,g,h,i,j,k,l,m には任意の文字を含めることができます。たとえば、',/,$,#,*,&,^, %,;,:,},{,],[, スペース,>,< など

コンマを使用してこのデータをpostgresにインポートして、4つの列を分離しようとしました(.csvファイルを作成して)。ただし、このアプローチは正しくないため、

      third column contains the value (<k<,>j>) and "o,'" with a comma.

私のデータに存在するパターンは、1 番目と 2 番目の列であり、山かっこ (<>) 内にデータが含まれています。3 番目の列には、引用符または山括弧内にデータが含まれています。4 番目と 5 番目の列には、NULL または日付が含まれています。

約 3 テラバイトのデータがあるので、このデータを postgres に効率的にインポートする方法はありますか? 私はpostgresの初心者なので、助けてください

4

1 に答える 1