ドキュメントを正規化する次のコードがあります。私のドキュメントには、SmallShuffledTrainingData
CSV を正規化する次のメソッドが含まれています。
static void Normalize()
{
Console.WriteLine("Normalizing...");
var analyst = new EncogAnalyst();
var wizard = new AnalystWizard(analyst);
wizard.Wizard(SmallShuffledTrainingData, true, AnalystFileFormat.DecpntComma);
// customer id
analyst.Script.Normalize.NormalizedFields[0].Action = Encog.Util.Arrayutil.NormalizationAction.PassThrough;
var norm = new AnalystNormalizeCSV();
norm.Analyze(SmallShuffledTrainingData, true, CSVFormat.English, analyst);
norm.ProduceOutputHeaders = true;
norm.Normalize(SmallShuffledTrainingDataNormalized);
analyst.Save(AnalystFile);
}
非常に長い時間がかかるため、1つの列のみを正規化しようとしています。
私のドキュメントには 332k 行と 25 列があります。
ますます小さなドキュメントに分割する以外に、正規化プロセスを高速化する方法はありますか?
分解した場合、正規化では特定の列の最高値と最低値を見つけるためにすべてのレコードを確認する必要があるため、それらを 1 つのドキュメントに結合するにはどうすればよいでしょうか?