この質問には、concat の実装に関する洞察が必要だと思います。
たとえば、30 個のファイルがあり、それぞれが 1G で、最大 32 G のメモリしか使用できないとします。「list_of_pieces」と呼ばれるデータフレームのリストにファイルをロードしました。この list_of_pieces のサイズは ~ 30G ですよね?
「pd.concat(list_of_pieces)」を実行すると、concat はヒープに別の 30G (または 10G 15G) を割り当てていくつかの操作を実行しますか、それとも新しいメモリを割り当てずに「その場で」連結を実行しますか?
誰もこれを知っていますか?
ありがとう!