データフレームに 6 つの列があります。そのうちの 2 つは、約 3K の一意の値を持っています。get_dummies()
データフレーム全体またはこれらの 2 つの列の 1 つだけで使用すると、返されるのは 3k の値を持つまったく同じ列です。get_dummies
より大きな列のダミー化に失敗します。一部の列はワンホット エンコードされますが、大きな列はエンコードされません。
get_dummies は、カーディナリティが小さいセットでのみ機能するのだろうか。
これはここでも議論されていると思います: Python(pandas) スクリプトのヘルプが必要