問題タブ [categorical-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1684 参照

r - カテゴリ データの単純ベイズ分類

統計とデータマイニングは初めてです。ここの例に従いましたが、完璧に機能しました。ここで、この方法をデータセットに適用したいと思いますが、これはカテゴリデータのみで構成されています。

R は次のエラーを返します。

私の質問は、そのメソッドをカテゴリ データ セットに適用するには、どのような変換を行う必要があるかということです。

コードスニペット

0 投票する
1 に答える
2899 参照

r - ロジスティック回帰プロットでのカテゴリ データの視覚化

従属変数としてバイナリ データに基づくロジスティック回帰のプロットを作成しようとしています (直接休暇 = 0 または 1)。独立変数は、連続データ (危険キューの持続時間)、カウント データ (危険キュー提示の時間)、およびカテゴリ データ (治療: スクロースまたはオクトパミン) です。

これまでのところ、データ セット全体に対して 1 つの適合線を持つ 2 つのグラフ (以下) を作成できました。

ここに画像の説明を入力 ここに画像の説明を入力

しかし、私の研究の目的は、両方の治療法の違いを示すことでした. 両方のカテゴリ、つまりスクロースとオクトパミンの勾配と切片の値が必要であることはわかっていますが、Anova()データセット全体に対して 1 つの値しか提供しません。したがって、2 つの適合線 (処理ごとに 1 つ) を使用して両方のグラフを作成したいと思います。これを行うことは可能ですか?

0 投票する
1 に答える
846 参照

r - Rでカテゴリ変数をイベントカウント変数に変換する

私は、270,000 をはるかに超える観測値と、この議論 (PartyCode) で関心のある変数の多数の欠損値を持つ国際的な毎日のデータ (年変数を作成しました) を扱っています。データは次のようになります。

そして、このデータを国年形式の年次データに変更したいと思います。

私の質問は多面的です:

1) カテゴリの PartyCode 変数から値を抽出して、上記で必要な (各カテゴリの) カウント変数を生成するにはどうすればよいですか?

特に、このデータセットには、カテゴリ変数 PartyCode の欠損値が多数含まれています。

0 投票する
1 に答える
1411 参照

python-2.7 - sklearn 0.14 で OneHotEncoder を使用して選択機能をカテゴリに指定する

Python で sklearn 0.14 モジュールを使用して決定木を作成しています。OneHotEncoder を使用して、いくつかの機能をカテゴリ機能に変換したいと考えていました。ドキュメントによると、どの機能を変換する必要があるかを示すインデックスの配列を提供できるはずです。ただし、次のコードを試してください。

次のエラーが表示されます。

代わりに、配列 [0, 1] を categorical_features に提供すると、正しく機能し、両方の機能が適切に変換されます。'all' を categorical_features に使用すると、同じ正しい動作が発生します。ただし、最初の機能ではなく、2 番目の機能のみを変換したいと考えています。一度に 1 つの機能を変換することで手動でこれを行うことができることは理解していますが、後でさらに多くの機能を使用するため、OneHotEncoder のすべての美しさを使用したいと考えていました。

0 投票する
4 に答える
33547 参照

python - パンダで複数の値を持つ列からダミーを作成する

次の問題を処理するためのpythonicな方法を探しています。

このpandas.get_dummies()方法は、データフレームのカテゴリ列からダミーを作成するのに最適です。たとえば、列に の値がある場合、 は 2 つのダミー変数を作成し['A', 'B']get_dummies()それに応じて 0 または 1 を割り当てます。

今、私はこの状況を処理する必要があります。単一の列、それを「ラベル」と呼びましょう。値は次のようになり['A', 'B', 'C', 'D', 'A*C', 'C*D']ます。get_dummies()は 6 つのダミーを作成しますが、行に複数の 1 が含まれるように、4 つだけが必要です。

これをpythonicな方法で処理する方法はありますか? それを取得するための段階的なアルゴリズムしか考えられませんでしたが、それには get_dummies() は含まれません。ありがとう

編集され、より明確になることを願っています!

0 投票する
2 に答える
10334 参照

r - カテゴリ データを含むラスター マップの凡例

4 つの異なる値 ( 1 ) を含むラスターを、 2などのカテゴリを説明するカテゴリ テキストの凡例と、カラー ボックスを使用してプロットしたいと考えています。

次のような凡例を使用してみました:

しかし、表示された色に 1 つの値を関連付ける方法がわかりません。「プロット」で表示された色を取得して凡例で使用する方法はありますか?

初期ラスター

凡例付きラスター