問題タブ [categorical-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1353 参照

multivariate-testing - FactoMineR を使用した R による多因子分析 (MFA)

FactoMineR の MFA で問題が発生しました。私は、トマト植物で測定された物理的、化学的、微生物学的な連続変数を含むデータセットを使用しています。これは、2 つの異なる処理から 3 つの時点で取得されたものです。私はこのように私のデータを収容しました:

変数をカテゴリ (最初の 2 つ) に分割し、その後、残りの 16 は連続です。ただし、2 つのカテゴリ変数を別々に扱いたいと思います。そこで、次のコードを書きました。

しかし、うまくいかないようです。したがって、私は次のことを試しました:

そしてこの他の:

しかし、私は同じ問題を抱え続けました(「便利なグループ定義ではありません」)。最初の 2 つのカテゴリ グループを別々に保持するためにできることはありますか? モデルを適切に実行する方法についてアドバイスをいただければ幸いです。

幸運をお祈りしています、

エマ

0 投票する
1 に答える
2031 参照

r - 適合ワイブル分布 (fitdistr) を geom_bar (ggplot2) カテゴリカル プロットに追加する

ggplot2 の国勢調査データから、年齢対人口規模 (性別別) の棒グラフを作成しました。同様に、fitdistrplus パッケージの「fitdist」関数を使用して、正規化された (すべての年齢ビンで観測された最大人口による) 人口データのワイブル パラメーターを導き出しました。

私がやりたいことは、プロットされたデータを線プロットとして分布に重ねることです。私が試してみました

さらに、その他の多数の (失敗した) 戦略。

提供できるヘルプをいただければ幸いです。以下に追加された構文を見つけてください。

データ構造

0 投票する
3 に答える
2901 参照

r - ラスター属性テーブルを直接使用してラスターの凡例を作成し、ラスターに表示されるクラスの凡例のみを表示する方法は?

ラスター属性テーブル情報を利用して、ラスター1などのラスターの凡例を作成し、ラスターに表示されているクラスのみ凡例を表示したいと考えています。何を取得したいかを説明する例を作成します。

1/ ラスターを構築する

2/ ラスター属性テーブルを追加する

3/ ラスターをプロットするFig 1

legend =rat$legendパラメータを、ratser 属性テーブルにリンクされたラスタのプロパティに置き換えたいと思います。levels()などを使用してさまざまな組み合わせを試しc(levels(r)[[1]][1])ましたが、凡例パラメーターで使用できない文字ではなく、リストを生成します。

4/ ラスターをクロップして、2 クラスのみの部分にプロットします (ここでは、右下の範囲の 4 ピクセル)2

この 2 番目の図では、ラスター2に表示されるクラスの凡例のみを自動的に表示したいと思います。

凡例付きラスター

凡例付きのトリミングされたラスター


以下は、Roman 4によって提案された解決策です。 ローマンが提案した解決策

0 投票する
1 に答える
204 参照

r - 似たような旅のパターンを特定し、R でこれらをグループにまとめる方法は?

似たような旅をまとめるために、1000 以上の車の旅を互いに比較する方法を見つけようとしています。(できればRで)

以下の例では、各行は特定の日の 1 人の移動です。

各列は、車が停止したポイントを表します。時間は考慮されず、旅が行われた順序のみが考慮されます。例: stop1、stop2、stop3 ... stop10

すべての旅程に 10 回の停車地があるわけではないため、データには NA が含まれます。

例: マトリックス (row.names は一意の人物を表します):

クラスタリングは初めてですが、別のタイプ (Kmeans、階層) を調べました。

ヒートマップと平行座標を使用してみましたが、探しているビジュアルが得られませんでした。つまり、1000 以上のジャーニーを持つグループを確認するのは簡単ではなく、似ている可能性のあるジャーニーではうまく機能しないと思います。他の。

誰かがこれに似たデータをクラスター化した場所の例を提供し、それを説明して、初心者にとって明確になるように助けてくれることを願っていますか?

どうもありがとう

0 投票する
2 に答える
6615 参照

r - データマイニング手順のためにデータを分類するにはどうすればよいですか?

関数を使用して、データマイニング手順を実行していaprioriます。この関数は、値ではなくテキストのみのカテゴリ データでのみ機能します。5 つのカテゴリ変数があり、数値はなくテキストのみであるため、データセットはこれらの要件を満たしています (したがって、変数「性別」は「女性」と「男性」に分類されます)。

関数を試してみるとapriori()、次のエラーが表示されます。

エラーasMethod(object):

私のデータはカテゴリーに見えますが、R はそれを理解していません。apriori 関数が機能するように、たとえば as.factor 関数を使用してデータを適切に分類するにはどうすればよいですか?

0 投票する
1 に答える
12682 参照

r - すべての観測値の名前とパーセンテージを示す各ボックスにラベルが付いたモザイク プロット

モザイク プロット (R パッケージ vcd、 http ://cran.r-project.org/web/packages/vcd/vignettes/residual-shadings.pdf などを参照) を作成し、プロット内にラベルを付けたいと思います。ラベルは、さまざまな要因の組み合わせ、またはいくつかのカスタム ラベルと、このカテゴリの組み合わせにおける合計観測値のパーセンテージのいずれかを表示する必要があります (例: http://i.usatoday.net/communitymanager/_photos/technology-live/2011/07を参照)。 /28/nielsen0728x-large.jpg (これは完全なモザイク プロットではありませんが)。ここで labeling_values 関数のようなものが役割を果たすのではないかと思いますが、うまく機能させることができません。

非統計学者にとってわかりやすい方法でカテゴリ データを使用して 2 つの変数を表す別の方法も歓迎され、受け入れられる解決策です。

0 投票する
1 に答える
399 参照

r - R - descr パッケージからの修正されたモザイク プロット

db2 つのカテゴリ変数を持つデータフレームがあります: varA4 つのレベル ( 01、)、22つのレベル ( 、) があります。のレベル 0 の値がありません:3varByesnovarBvarA

CrossTableパッケージを使用して分割表を作成し、関数を使用しdescrてモザイク プロットを作成しました。plot

私はこのプロットを得ました:

モザイク プロット

プロットからレベル 0 を削除したいと思います。また、プロットの左側に 0 から 1 のスケールで 1 つ、右側に 1 から 0 のスケールで 2 つの y 軸を追加したいと思います。

私たちを手伝ってくれますか?

0 投票する
0 に答える
793 参照

r - RのsoftImputeを使用して欠損データを代入する

欠損値を代入しようとしていますが、カテゴリ変数の処理に問題があります。コマンドsoftImputeは欠損値を計算しますが、分析には不適切なカテゴリ変数も返します。欠損値については、次のことを行いました

ただし、カテゴリ変数を見ると、小数点になっています

もともとは

カテゴリ変数の欠損値を代入する特定の方法はありますか? カテゴリ変数の欠損値を扱う他の提案も大いに役立ちます。