大きな postgresql テーブルからデータをインポートしたいと思います。スペースを節約するために、テキスト値を係数に自動的に変換したいと思います。
たとえば、データセットには多くの文字列変数 (「男性」、「女性」など) があり、これらを要因としてインポートできれば、次のようなコマンドを使用してデータ セットを読み込むことができます。
df <- dbGetQuery(con, "select id, gender from large.table"))
(#, "Male") のような行を受け取る代わりに、メモリを節約できるように (#, 0) のような行が必要です。
選択したデータベースで以下のクエリを試し、「性別」列を文字列と等しくすると、df_large のサイズがはるかに大きくなることがわかります。
df <- dbGetQuery(con, "select id, gender from large.table"))
df_large <- df$gender
print(object.size(df_large), units="Kb")
df_small <- factor(df$gender)
print(object.size(df_small), units="Kb")