問題タブ [lapply]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
923 参照

r - スノークラスターでのリストの配布

スノーパッケージのparXapply()関数は、データが1つのリストまたは行列にのみ含まれている場合に非常にうまく機能しますが、この場合、4つの異なるタイプの行列で関数を実行する必要があります。

たとえば、これは私が今持っているものです:

私が抱えている問題は、行列が非常に大きいことであり、完全なリストでparLapply()を呼び出すには、すべてのデータを各クラスターノードに転送する必要があると思われます。これには非常に時間がかかり、クラスターのパフォーマンスが低下する可能性があります。

myfun()を呼び出す前にリストを分割し、処理のために関連する行列のみを各ノードに送信するにはどうすればよいですか?

0 投票する
1 に答える
113 参照

r - ファイル名を使用してデータを月ごとに平均化する

多くのファイルを読み込んでこれらのファイルを処理する必要があることに関係する R 関連の質問があります。各ファイルは、異なるステーションで異なる時間に行われたオゾンの測定値です。データはテーブル形式であり、次を使用してデータを読み取ることができます。

これにより、処理したいすべてのファイルのデータ フレームが得られます。たとえば、ファイルの名前は次のとおりです。

"fiji" は駅の名前で、日付は YMD 形式です。データ フレームを平均して、このステーションの月間平均を取得したいと考えています (一度に作業する必要があるのは 1 つのステーションだけなので、実際には data と呼ばれるデータ フレームを平均して 12 セットの平均データを生成したいだけです)。

いくつかの ?apply 関数を使用してこれを行うことができると思いますが、これを行う方法について本当に迷っています。解決策に関する提案は本当に感謝しています!

日付をデータ フレームに追加した結果の例として、次のようになります。

0 投票する
1 に答える
347 参照

r - この _for_ ループを高速化するにはどうすればよいですか? data.table + lapply で?

このコードは、私自身と同様のデータセットを生成します。



過去 7 日間に発生した変数「cnt」の合計を見つけようとしています。日付が連続していない場合があります (前の「df」の最後の日付を参照してください) -- ID による。

ループは次のとおりです。



私は最終的に 800 万行の data.frame (数千の ID) でこれを実行しているので、ここではおもちゃは高速ですが、実際には非常に低速です。

コードの他の部分で data.table パッケージを使用することは非常にうまくいきましたが、ここでそれを機能させる方法がわかりません。たぶん、data.tableの中でlapplyですか?

前もって感謝します!

0 投票する
1 に答える
118 参照

r - 冗長周波数のデータフレームを変換する

私は次のようなdata.frameを持っています:

各行は、カテゴリタイプとその要素の数を持つ特定の要素を表します。カテゴリごとのカウントの度数分布を作成したいのですが、現時点ではカテゴリは冗長です。

冗長なカテゴリカウントのテーブルを取得するにはどうすればよいですか?つまり、次のようなテーブルが必要です。

私はほとんどlapplyを使用してそこに着きました:

しかし、出力を適切なデータフレームに強制することができないようです。この関数を使って頭を悩ませることはできません。

0 投票する
1 に答える
554 参照

r - 複数のdata.frames内の行に関数を適用します

これを尋ねる方法はわかりませんが、試してみます:

MS Accessからインポートした20個のdata.frame(2006_1、2006_2、2007_1、2007_2など)があります。

各data.frameには、10列と約300万行があります。

各data.frameの最初の列には、という名前が付けられsecuityNameています。これは、株式相場表示のリストであり、その後にいくつかのタグが続きます。

20個のdata.frameのすべての列のすべての行を大文字にしSecurityNameます。

構造は次のとおりです。

それぞれを次のように表示したいと思います。

すべてのdata.frame名を持つ*Raw_data_vector*という名前のベクトルがあります

Raw_data_vector

lapplyを使用しようとしましたが、機能しません。

0 投票する
1 に答える
809 参照

r - 条件付きラップリー?

代わりに for ループで動作する関数を lapply で実行しようとしています。私はRに非常に慣れていないため、lapplyに慣れていません。特に「if」条件の作り方がわかりません。

forループを使用した現在のコードは次のようになります(ボリュームシリーズを正規化します):

Apply over two data framesから、2 つのデータ フレームで機能する関数を実行する方法を知っていますが、テストの処理方法はまだわかりません。

ご支援ありがとうございます、ヴィンセント

0 投票する
1 に答える
1072 参照

r - Rのlapply(およびmclapply)を取得して、乱数ジェネレーターの状態を復元するにはどうすればよいですか?

Rは.Random.seedラップ内の設定を無視します。set.seedただし、使用すると問題なく動作します。

いくつかのコード:

私の目標は、MCMCの実行をチェックポイントして、正確に再開できるようにすることです。RNGの状態を簡単に保存できますが、Rにラップループ内にロードさせることはできません。

Rに設定を通知させる方法はあります.Random.seedか?または、これを実現するためのより簡単な方法はありますか?

重要な場合は、64ビットRを使用しています。

Ubuntu 12.04 LTSの場合:

0 投票する
1 に答える
800 参照

r - ラップ後の列名

私は次のようにデータセットを埋めました:

ClosePrices <- do.call(merge, lapply(tickers, function(x) Cl(get(x))))

私が解決できない問題は、入力ごとに複数の列を生成する関数を適用するときです。この場合、ADX は 4 つの値 (DIp DIn DX ADX) を生成します。

数値の代わりに対応する列名を取得するにはどうすればよいですか? (DX.1 の代わりに DX.DIA) 、または $ADX という名前の列のみを選択しますか?