問題タブ [tidyverse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 別のデータ フレームを使用して、不足しているデータをグループごとに補完して埋める
グループごとに欠損値を補完するにはどうすればよいですか?
推奨事項とランクを含む df があり、少なくとも 4 つない場合はデフォルトの推奨事項を挿入する必要があります。
入力例:
完全/塗りつぶしでやろうとしましたが、グループを尊重せず、ランク範囲外の値もカットします。
望ましい出力:
r - readr::read_csv の末尾の区切り文字を無視する
を使用して末尾の区切り文字を含む CSV ファイルを読み取るreadr::read_csv
と、欠落している列名が入力されたという警告が表示されます。この警告を再現するための短いサンプル CSV ファイルの内容を次に示します (次のスニペットを というファイルに保存しますexample.csv
)。
各行の終わりにある末尾のコンマに注意してください。このファイルをロードすると
次の警告が表示されます。
3列のみを明示的にロードしたい場合でも
それでも警告メッセージが表示されます。
これは予想される動作read_csv
ですか、それとも指定したものを除くすべての列を無視することになっていることを伝える方法はありますか? または、末尾の区切り文字が削除/無視されるように、この (明らかに不正な) CSV を整理する別の方法はありますか?
r - dplyr::mutate 内で purrr::map を使用して、異なる開始パラメータをモデルに適用します
ggplot2 メーリング リストで誰かの質問に答えようとしているのですが、わかりません: https://groups.google.com/forum/#!topic/ggplot2/YgCqQX8JbPM
OP は、nls モデルのデータのサブセットに異なる開始パラメーターを適用したいと考えています。私の考えでは、彼は dplyr と purrr を読むべきだったのですが、数時間自分自身を試してみた後、私は壁にぶつかりました。それがバグなのか、それとも私の経験不足なのかは不明です。
このバグに関連しているように感じますが、これはしばらくの間修正されています... https://github.com/hadley/dplyr/issues/1447
私が知る限り、ネストされた tibble のスコープ内で変数を探していますが、mutate 呼び出しのスコープ内にしたいのです。これを回避する方法があるかどうかはわかりません。
r - リスト列データ フレームの各行に異なるモデルを適合させる
tidyverse の list-columns データ構造を使用して、データ フレームの行によって異なるさまざまなモデル式を適合させる最良の方法は何ですか?
In R for Data Science で、Hadley は list-columns データ構造を使用して多くのモデルを簡単に適合させる方法の素晴らしい例を示しています ( http://r4ds.had.co.nz/many-models.html#gapminder )。式がわずかに異なる多くのモデルを適合させる方法を見つけようとしています。彼の元の例から改作された以下の例では、各大陸に異なるモデルを適合させる最良の方法は何ですか?
by_continent を反復処理することでそれを実行できることはわかっています (すべての大陸の各モデルを推定するため、効率的ではありません:
しかし、ベースRのループに戻らずにこれを行うことは可能ですか(そして、必要のないモデルのフィッティングを回避します)?
私が試したのは次のようなものです:
しかし、機能する est_model 関数を思い付くことができないようです。機能しないこの関数 (h/t: https://gist.github.com/multidis/8138757 ) を試しました:
(確かに、これは不自然な例です。私の実際のケースは、データの主要な独立変数が欠落している観測がかなりあるということです。そのため、1 つのモデルを完全な観測のすべての変数に適合させ、別のモデルを完全な観測の変数のサブセットのみに適合させたいと考えています。残りの観察。)
アップデート
動作する est_model 関数を思いつきました (ただし、おそらく効率的ではありません)。
r - ティブルにリストがある列で繰り越された最後のオブジェクト
リストを含む列の要素を前の値で埋めるのに役立つ関数を探しています。
列「LotsOfLists」には、結合のために NULL になっているリストがいくつかあります。NULL を最後のリストに置き換えたい。繰り越された最後のオブジェクトで NA を埋める動物園パッケージの na.locf() と同様に機能するようにしたいと思いますが、リストである列に対して機能するものは何も見つかりませんでした。
編集:
元の質問には回答がありましたが、列に data.frames がある場合、回答が機能しないことが判明しました。誰でもdata.framesの解決策を見つけることができますか?
r - tidyverse を使用したデータ フレームの拡張
これが私がやろうとしていることの例です:
hello
の開始値と終了値はデータに依存するため、それぞれの行数id
は動的であることに注意してください。expand
おそらくtidyrからの解決策を探していますが、苦労しています。
r - ティブル内のリスト列: リスト列を別のリスト列にリンクできますか?
これは私の最初の投稿です。ばかげているように聞こえたり、探している答えが既に存在する場合はご容赦ください。
私の主な問題は次のとおりです。4 つの列 (文字列、2 つのデータ列、および文字列の各レベルの距離行列を含む列) を含むティブルを作成し、を使用する関数を作成しようとしています。従属変数として 4 列目からの距離行列と、2 列目からのいくつかの独立変数。問題は、従属変数が見つからないことを R が警告し続けることです。
私が使用したパッケージは次のとおりです。
私の IV を含む tibble は次のようになります。
私はそれを入れ子にします:
そして、これがどのように見えるかです:
続いて、生の有無データを含む別のティブルを作成します。
次に、そのティブルもネストします。
そして、それは次のようになります:
IV を含む Tibble と結合するために、データ列の名前を変更します。
次のステップとして、行列を計算する関数を作成します。
rr ティブルは次のようになります。
そして、2 つの tibble を結合します。
ティブルは次のようになります。
そして、適用したい関数は次のようになります。
次のコードで計算しようとすると:
my_tibble <- my_tibble %>% mutate(mrm = map(IVs,mrm_model))
、
次のエラー メッセージが表示されます。
Error in mutate_impl(.data, dots) : object 'Dist.matrix' not found
.
なぜこれがポップアップし続けるのか分かりますか?
$ 記号を使用して関数を「修正」しようとすると、次のようになります。
mrm_model <- function(df){ecodist::MRM(my_tibble$Dist.matrix~dist(Area),data = (df))}
、
次の警告が表示されます。
Error in mutate_impl(.data, dots) :
invalid type (list) for variable 'my_tibble$Dist.matrix'
.
私はこの種のデータ操作のまったくの初心者なので、明らかに頭がいっぱいです。得られるすべての助けに大いに感謝します。
r - map と purrr を使用して listcolumn 内で NA を割り当てます
listcolumn l の 2 未満のすべての値を NA に設定したいと思います。map を使用して purrr-world 内でこれを行うにはどうすればよいですか?
エラーをスローします。
アップデート:
追加の列が表示されますが、listcolumn の各要素に 2 つの数値と 1 つの NA が含まれているわけではありません
更新 II: Replace は私の友人であり、トリックを実行します。