国、製品コード、年の3つのカテゴリに階層的にインデックス付けされた約3,700万のデータポイントのかなり大きなデータセットを使用しています。国変数(国名)は、次のような項目で構成されるかなり乱雑なデータです。「オーストラリア」を表す「オーストラリア」。文字と単語を照合し、country_namesの既知のリストから最良の推測と信頼区間を返す単純なguess_country()を作成しました。データの長さと階層の性質を考えると、Series:countryに.map()を使用することは非常に非効率的です。[guess_country関数は約2ms/リクエストかかります]
私の質問は次のとおりです。シリーズを取得し、一意の値のみでマップを実行する、より効率的な.map()はありますか?(繰り返される国名がたくさんあるとすると)