ブラジルの高校に在籍している人々をリストする ffbase パッケージを使用して、大きなデータセット (最大 600 万行) を R にインポートしました。原則として、Id(学籍番号)とUniversity(機関名)の2つの列があります。
この例では Group という名前の列を作成して、各大学をその教育グループに関連付けたいと思います。
Id University Group
000001 Anhanguera Kroton
000002 Unopar Kroton
000003 Anhembi Laureate
000004 FMU Laureate
PS: 私のデータセットには教育グループに関する情報はありませんが、どのグループが各大学に対応するかについて必要な情報はあります。このようにして、この詳細をデータに添付する必要があります。
PS2: University 列のクラスは ff_vector です。
あなたの貢献に感謝します。