0

大きなデータセットを 5 つのファイルに分割しています (それぞれに 15000 の属性があり、最初のファイルにはヘッダー (属性名) と 9999 のレコードが含まれ、他の 4 つのファイルには 10000 のレコードが含まれています)。

textscan を使用して、マージする必要がある 5 つのセル配列を作成しましたが、このアプローチが適切かどうか、または 5 つのファイルすべてを単一のセル配列に直接読み取る方がよいかどうかわかりません。とにかく、誰かが複数のセル配列を単一のセル配列にマージする方法、または複数のテキストファイルを単一のセル配列に読み取る方法を示していただければ幸いです。

ありがとうございました!

4

2 に答える 2

2

Java マジックを実行したい場合を除き、複数のファイルを 1 つの配列に直接読み込むことはできません。

ただし、セル配列を取得したら、それらを簡単に組み合わせることができます。各セル配列に同じ数の列があると仮定すると、次のように連結できます。

finalCell = [cell1;cell2;cell3;cell4;cell5];
于 2010-08-11T15:14:20.633 に答える
0

ジョナスの答えを拡張すると、メモリが懸念される場合は、ファイルを読み取るときにそれらを組み合わせて、5 x 15000 x 10000 + 1 15000 x 50000 セル配列を避けることができます。

finalCell = textscan(fid_1,'フォーマット');

finalCell = [finalCell; textscan(fid_2,'フォーマット')];

finalCell = [finalCell; textscan(fid_3,'フォーマット')];

finalCell = [finalCell; textscan(fid_4,'フォーマット')];

finalCell = [finalCell; textscan(fid_5,'フォーマット')];

よろしくお願いします、

アダム

于 2010-08-12T22:07:43.170 に答える