何十万もの値を含むファイルが渡されましたが、.CSV ファイルの形式に一貫性がありません。構造は次のようになります。
A,B,C,D
E,F
,H,I,J,K,L,M,N,O
P,Q,R,S
等々。
私がする必要があるのは、a) 一意の値をリストし、b) 同じ値のインスタンスをカウントすることだけです。R、Excel、または推奨されるその他のツールでこれを実行してください。
通常、Google ドキュメントの =UNIQUE 関数や =COUNT 関数などを使用しますが、スプレッドシートが大きすぎて読み込めません。奇妙なことに、まったく同等のものを Excel で見つけたこともありません。
どんな助けでも感謝します。