userID、wordID、ctの3種類の情報を含むCSVがあります
(基本的に、14kの異なるツイープ、使用する単語ごとに異なる行、その単語のカウントを含む)
少なくとも2000の異なるwordIDを持つuserIDに対してのみ、このファイルをフィルタリングできるようにしたいと思います。
ファイルを調べてuserIDごとにwordIDをカウントする方法は理解していますが、これを「実際に頻繁に使用されるuserIDに対してのみ'userID、wordID、ct'を配置する」と組み合わせる方法がわかりません。
どんな助けでも大歓迎です。