現在、Python を使用してプログラムを実行しており、正確な時間の複雑さを推定したいと考えています。
しかし、ストリームを使用するため、つまり HDFS ファイル システムから入力を直接読み取るため、その複雑さについてはかなり混乱しています。
例: 完全な入力ファイルを格納するためにローカル メモリが使用されている場合、私のプログラムの複雑さは O(n2) です。しかし、ストリーミングを介して実行した後、実際には O(n2) の元の複雑さよりもはるかに短い時間で済みます。HDFSファイルシステムから直接入力を読み取る場合、正確な見積もりが必要です。つまり、どのくらいの時間が短縮されますか?
助けてください。