問題タブ [subset]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 複数の ggplot ファセットに含まれるデータのサブセット
私は人口とその人口のサンプルを持っています。ggplot2 とそのファセット オプションを使用してそれらを比較するいくつかのプロットを作成しましたが、サンプルを独自のファセットに配置すると、母集団プロットが (わずかではありますが) 歪むことに気付きました。すべてのレコードが人口プロットにあり、サンプリングされたレコードだけが 2 番目のプロットにあるように、プロットをファセットする方法はありますか?
c# - LINQ を使用して DataTable からサブセットを選択する方法は?
私はLINQが初めてです。私は次のDataTableを持っています
名前と日付は主複合キーです。
各日付のすべての名前を選択し、新しいコレクションを繰り返して次の日付を選択したいと考えています。
私のLinq式は間違っています
r - 順序ベクトルの値を使用してRデータフレームのサブセットを取得する
myCorVector
1から-1までの値の範囲を含む相関スコアのベクトルがあります。
ベクトルmyCorVector
には、データフレームの各行のスコアがありますmyDataFrame
。
を指定して、データフレームの行を並べ替えることができますmyDataFrame[order(myCorVector),]
。
私がやりたいのは、データフレームを並べ替えることですが、値が0未満の行のサブセットを取得しmyDataFrame
ますmyCorVector
。
に適用するsubset()
とmyCorVector
、によって返されるインデックスは、order()
の有効な行インデックスに関連付けられなくなりますmyDataFrame
。
for
ループオーバーを必要としない、これを行うための迅速かつ/またはエレガントな方法はありますmyCorVector
か?
r - 時間データのサブセットをプロットするにはどうすればよいですか?
入力データがあり、CODEという列に4または5のエントリがある行のみを表示するためにサブセット化します。次に、特定の種を見ることができるように、このデータをサブセット化しました。次に、DATE列のエントリが、係数(デフォルト)ではなく、日付として読み取られるようにしました。次に、2つの列を互いにプロットします。
データは1992年から2007年までのもので、1年ごとにプロットしたいと思います。私はこれをたくさんの種に対して行うつもりですが、それを行う方法がわかりません。x軸を制限したり、1年だけのサブセットを作成したりするなど、さまざまなことを試しましたが、理解できていません。私は次のアイデアのいくつかを試しました:
上記の場合、以下のように空のデータフレームが生成されますが、条件付き引数を作成する試みはどれも成功していません。
一度に1年だけをプロットする方法、または各年のサブセットを作成する方法についてのアイデアはありますか?
algorithm - 特定のサブセットがセットのコレクションに存在するかどうかを照会するためのデータ構造
単語ゲーム ソルバーのデータ構造を構築しようとしています。
{A、A、D、E、I、L、P、T、V、Y} の形式の約 150,000 セットを保存する必要があります。(これらは正規化された英単語、つまりソートされた文字です。これは、同じ文字を 2 回含むことができるマルチセットであることに注意してください。)
次の種類のクエリに対する yes/no の回答を効率的に取得する必要があります: 指定されたサブセットを持つセットはありますか? たとえば、{D、E、I、L、L、P} のセットを含む既知の単語はありますか?
要件:
- クエリは高速でなければならない
- データ構造は、妥当な容量 (50 MB 未満など) に収まる必要があります。
- データ構造はリアルタイムで構築する必要はありません。それは事前に計算されています。
このニーズに適したデータ構造はありますか? これは、ターゲット セットが実際にはマルチセットであるという点で、StackOverflowの他の セット マッチングの質問とは少し異なります。
c# - インデックスC#を使用して配列のサブセットを返します
fromIndexとtoIndexを指定してC#配列のサブセットを返すための最良の方法は何ですか?
明らかにループを使用できますが、他のアプローチはありますか?
これは、私が入力しようとしているメソッドシグネチャです。
FixedSizeListの内部実装は
r - データフレームに名前で列をドロップする方法
大きなデータセットがあり、特定の列を読み取るか、他のすべての列を削除したいと思います。
興味のない列を選択します。
そして、私が次のようなことをしたいよりも:
不要な列をすべて削除します。これは最適なソリューションですか?
r - R:サブセット使用時のdcastエラー-行サイズが異なる
サブセット引数を指定してdcastを使用すると、元のデータフレームのdcastとサブセットデータフレームのdcastの行が一致しない場合、次のエラーが発生します。
data.frame(...、check.names = FALSE)のエラー:引数は行数が異なることを意味します:2、3
mtcarsデータセットでエラーを再現しました。以下は複製されたコードです。
最後のdcastは、drop = FALSE条件をスキップすることでエラーを回避できることを示していますが、目的の出力は次のとおりです。
どんな助けでも素晴らしいでしょう!:)
ありがとう
r - data.frame のサブセット内の数値の出現を計算する
次のようなRのデータフレームがあります。実際、私の実際の「df」データフレームは、ここにあるものよりもはるかに大きいですが、誰も混乱させたくないので、可能な限り単純化しようとしています。
これがデータフレームです。
基本的に私がやりたいことは、各列(a、b、c、d、e)および各IDグループ(1、2、3)の数字の出現を取得することです(この後者のグループ化については、私の列「id」を参照してください')。
したがって、列 'a' と ID 番号 '1' (後者については列 'id' を参照) の場合、コードは次のようになります。
私の結果を簡単に説明すると、列 'a' (および列 'id' に番号 '1' を持つレコードのみ) で、番号 '1' が 3 回発生し、番号 '3' が 7 回発生したと言えます。
繰り返しますが、別の例を示します。列 'a' および ID 番号 '2' の場合 (後者のグループ化については、列 'id' を再度参照してください):
もう一度少し説明しましょう: 列 'a' で、列 'id' に番号 '2' を持つ観測のみに関して) 番号 '1' が 4 回発生し、番号 '2' が 3 回発生し、番号 '2' が 3 回発生したと言えます。 「3」が 3 回発生しました。
これが私がやりたいことです。カスタム定義されたサブセットごとに数値の出現を計算します (そして、これらの値をデータ フレームに収集します)。難しい作業ではないことはわかっていますが、問題は、入力「df」データフレームを定期的に変更する必要があるため、行と列の総数が時間の経過とともに変化する可能性があることです...
これまでに行ったことは、次のように「df」データフレームを列で分離したことです。
したがって、df.2 は df$a を参照し、df.3 は df$b に等しく、df.4 は df$c に等しくなります。しかし、私は今本当に立ち往生しており、先に進む方法がわかりません…</ p>
この問題を解決する適切な「自動的な」方法はありますか?