問題タブ [factors]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - N 個のカテゴリを持つカテゴリ因子を N 個のバイナリ列に再コード化する
元のデータ フレーム:
新しいデータ フレーム:
小さなデータセットの場合はこれで問題ありませんが、はるかに大きなデータセットの場合は遅くなります。
ループを使用せずにこれを行う方法を知っている人はいますか?
r - 因子の各レベルからの代表的なオブザベーションが分割にあることを確認するにはどうすればよいですか?
データセットをトレーニング セットとテスト セットに分割する小さな関数を作成しました。ただし、因子変数を扱うときに問題が発生しています。コードのモデル検証フェーズで、モデルが因子の各レベルからの表現を持たないデータセットに基づいて構築されている場合、エラーが発生します。この partition() 関数を修正して、因子変数のすべてのレベルから少なくとも 1 つのオブザベーションを含めるにはどうすればよいですか?
編集- 「caret」パッケージと createDataPartition() を使用した新しい関数:
r - ベクトルになるための書式設定要素
私はRで作業しており、因子変数の1つであるサービスに関連するさまざまな変数で相関を実行したいと考えています。どうすればいいのか本当にわかりません。私は融解と転置を見てきましたが、これらの関数のどちらも私が必要とする形式を与えてくれません。因子ベクトルを個々のベクトル (サービスの各レベルに対応する) に分割し、何らかの方法で 1 つの数値変数 (sumofcases など) を取得して、新しく作成されたサービス ベクトルの観測値になるようにする必要があると考えています。したがって、サービスの 1 つのレベルは入院であり、別のレベルはケース管理です。次に、「入院」と呼ばれる 1 つのベクトルと「ケース管理」と呼ばれる別のベクトルがあり、各列の観測値は「sumofcases」の対応する値になります。次に、2 つのサービス ベクトル間の相関を実行できます。これにより、多数のデータフレームが作成されます (機能する場合は問題ありません)。
サンプルデータは次のとおりです。
そして、私はそれを次のようにしたい:
因子のレベル間の相関を実行できる相関関数の内部に何かがある可能性もあると思いましたが、これまでのところ何も見つかりませんでした.
@トーマス、あなたの答えに応えて:
これは間違いなく正しい方向に進んでいると思いますが、不均一な因子レベルにどう対処すればよいでしょうか?
私はこのコードを実行しました:
次のエラーが発生しました:
実行中の出力dput(head(MIC))
:
次のコードを実行すると、cor 関数の NA が得られます。
出力:
python - 最大値未満のすべての因数積の列挙
いくつかの最大値までの、いくつかの整数因子のすべての可能な積を列挙したい:
P((2, 3, 11), 10)
戻り(2, 3, 4, 6, 8, 9)
ます。P((5, 7, 13), 30)
戻り(5, 7, 13, 25)
ます。
これは、枝が最大に達すると成長を停止するツリー トラバーサルのように見えますが、枝の数の境界が何であるかはわかりません。この問題に推奨されるアルゴリズムまたはイディオムは何ですか? 私がこれまでに見た中で最も近いのは です。これはitertools.product()
、出力セットごとに固定数の用語を設定しているようです (例: 2)。
コンテキストとして、n と互いに素な数値を調べようとしています。この場合、n 自体が上限であり、因子のリストは n のものです。上記の質問を少し一般化しようとしました。
java - 「UI残念ながら停止」と表示されます
このコードにはエラーは含まれていませんが、実行すると「残念ながら停止しました」と表示されます。コードは、数の因数を見つけるためのものです。私はそれが簡単であることを知っていますが、私はアンドロイド技術に慣れていないので、助けが必要です.
logcat は次のとおりです。
r - Rで複数の要素によって行列の列に関数を適用する方法は?
これは簡単な質問で、tapply、apply、by などで簡単に解決できると思います。しかし、私はまだ比較的新しいので、アドバイスを求めたいと思います。
問題:
たとえば、5列のデータフレームがあります。たとえば、列 4 と 5 は要因です。列 5 の各因子について、列 5 の各グループの列 1:3 に対して関数を実行したいと考えています。これは、原則として簡単に実行できます。ただし、出力を素敵なテーブルとして表示したいので、これをエレガントな方法で行う方法を学びたいので、ここで質問したいと思います。
例:
さて、コマンド
の各因子レベルに基づいて合計が得られますがy
、これはほとんど私が望むものです。追加の 2 つの手順が必要ですf
。これはほとんど自明です。上記のコマンドを簡単にラップすることができlapply
、これを除いて、必要なものを取得できます。結果を含むテーブルを生成し、それを使用してヒートマップを生成することさえできます。
したがって、これを行い、対応する出力を持つマトリックスを生成する簡単でエレガントな方法はありますか? これは、データ サイエンティストにとって日常的な作業のように思えます。そのため、既存の組み込みソリューションがあると思われます...
どんなに小さなことでも、助けやヒントをありがとう!
r - 出力 R データフレーム係数
データフレームの各行をループし、テストを実行してから、行からいくつかのデータを追加したいと考えています。問題は、列が因子データ型の場合、行から情報を追加すると得られる出力が台無しになることです。
出力:
私が望むのは、各レベルを出力するのではなく、出力「Bowling Green」だけであることは明らかです。それで、私は試しました
上記のコードは目的の出力を提供しますが、目的の効果を完全に得るためにビルドすると失敗します。
出力:
つまり、因子の数を教えてくれているようです
python - パンダで階乗データフレームを作成する方法は?
考えられる要因のすべての組み合わせを使用してパンダデータフレームを作成するにはどうすればよいですか?
これは私が目指しているものです:
因子の数が非常に少ない場合、これは手動で行うことができますが、数が増えるにつれて、これを構築するためにもう少し自動化された方法を使用することが実用的になります。
r - 総計: 因子にとって意味のない合計
私は単純であるべきことを試みています。何が起こっているのかについてのヒントは大歓迎です。
いくつかの自治体からの国の輸入を含む大きなデータ フレームがあります。一部の国では、2 つのエントリがあります。各自治体からの輸入を合計し、国ごとに一意の行を作成したいと考えています。機能を利用していaggregate
ます。例(データフレームの小さな部分を含めます):
基本的に頑張ってます
しかし、私はメッセージを受け取ります:
を強制的df
に数値にしたり、文字を文字として宣言したりしようとしましたが、何も役に立たないようです。