Rが名から性別を推測するためのパッケージまたは方法があるかどうか知りたいです。
テストとして米国議会で実行することを考えています。
いくつかのヨーロッパ言語で機能するには、これが必要です。
CRAN にはそのようなパッケージはありません。
CRAN には性別パッケージがありますが、英語の名前でのみ機能します。
ジェンダー化パッケージによって解決された問題。私の自己回答のリンクを参照してください。
フィンランドの名前に関するこの議論に続いて、オンラインデータベースを調べて複数の言語の名前から性別を判断する素晴らしいgenderizeRパッケージに出くわしました.
解決しました!
実装のアイデアに応じて、plyr
パッケージ チュートリアルには適切なデータ セットがあります。
赤ちゃんの名前 1880 年から 2008 年までの、米国の男女の赤ちゃんの名前のトップ 1000。258,000 レコード (1000 * 2 * 129)。