現在、110,000 人の寄付者のリストを Excel で作成しています。彼らが私たちに提供する情報の 1 つは、彼らの職業です。このリストを要約して、私が定義する 10 または 20 のカテゴリにまとめたいと思います。
通常、私はこれを 1 行ずつ処理するだけですが、1 年分のデータに対してこれを行う必要があるため、1,000,000 行以上の行を 1 行ずつ処理する時間は実際にはありません。
10 または 20 のカテゴリを定義して、そこから python に分類させる方法はありますか?
アップデート:
データの形式が正しくありません。人々は、オンラインまたは紙切れで自分でフィールドに入力し、それをデータ処理会社に郵送します。ばらつきが大きい。CEO、最高経営責任者、事務局、リストは続きます。
SORT UNIQ コマンドを使用したところ、リストに約 13,000 の異なる職業があることがわかりました。