問題タブ [subsampling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - カテゴリに比例して df からランダムなサブサンプルを引き出す
私はこのようなデータフレームを持っています
降伏:
(実際のデータ フレームには 1000 行以上あります)
カテゴリを数えると、次のようになります。
n各中間カテゴリが比例して表されるように、行のランダムなサブサンプルを描画したいと思います。たとえば、13 のカテゴリのうち 3 つ (~23%) が「内科」です。したがって、サブサンプルの約 23% がこのカテゴリを持つ必要があります。各患者が 1 つのカテゴリを持っている場合、これはそれほど難しくありませんが、残念ながら複数のカテゴリを持つことができます (たとえば、患者 3 は 3 つのカテゴリを持っています)。これどうやってするの?