現在.N
、ファイル内の一意の行数を見つけるために使用していますby= ... .
たとえば。col1
とcol2
のデータ テーブル内の一意の行数を見つけるにはdt
、クエリは次のようになります。
dt[, .N, by="col1,col2"]
非常に大きなファイルの場合、これには非常に長い時間がかかる場合があります。テーブルがソートされている場合、これを行うより速い方法はありますか? 基本的に、カウンターを設定し、一意の行が検出されるたびに単一のエントリを使用して、各行が表示される回数で更新できます。for ループは永遠にかかるため、使用できません。