問題タブ [strsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 可能な出力がわかっている場合は、「strsplit」を高速化します
要因名を区切り記号で分割することにより、3 つの要因列に分割する必要がある要因列を含む大きなデータ フレームがあります。これが私の現在のアプローチです。これは、大きなデータ フレーム (場合によっては数百万行) では非常に遅くなります。
この操作を高速化する方法はありますか? 「種」、「サイズクラス」、および「感染」の各カテゴリには少数 (<5) の数があり、これらが何であるかは事前にわかっていることに注意してください。
ノート:
stringr::str_split_fixed
このタスクを実行しますが、それ以上速くはなりません- データ フレームは、実際には、関連付けられたレベルがディメンション
reshape::melt
である配列を呼び出すことによって最初に生成されます。Class
そこからここに行くためのより速い方法があれば、素晴らしいです。 data.rds
http://dl.getdropbox.com/u/3356641/data.rdsで
r - R: String で Softmatch を行う必要があります
次のように、指定された入力文字列を使用して、データフレームの1列でソフトマッチを行う必要があります
提供された列名「col」から「John Collingson」と「J Collingson」の両方を取得したい
親切に助けて
r - R: セル内の文字列を連続した複数のセルに分割する方法は?
次のデータがあります
1 つのセルに文字列があり、文字列の長さが各行で同じではありません
次の結果が欲しい
1 つのセルに 1 つの単語
誰でも助けることができますか?
r - 1 つの変数が実際には 2 つの列である場合の expand.grid
地区、郡、年のデータセットがあります。特定の地区/郡の組み合わせが任意の年に発生する場合、その組み合わせが毎年発生するようにします。以下は、これを行うために私が考え出した2つの方法です。最初のアプローチでは、関数を使用して地区、郡、および年の組み合わせを作成します。必要なコードは 6 行のみです。paste
一番下のアプローチは、expand.grid
ととの組み合わせを使用し、strsplit
はるかに複雑/複雑です。
上記のいずれよりもはるかに効率的な方法がおそらくあります。たとえば、expand.grid
おそらく 1 ~ 2 行のコードで地区/郡/年の組み合わせを実現できる使用方法はありますか?
アドバイスありがとうございます。私の機能は仕事をすることができますが、この質問は私にとって学習の機会です. 私はベースRが好きです。
データセットの例を次に示します。
望ましい結果は次のとおりです。
これは、関数を使用して、毎年のすべての地区/郡の組み合わせを表す、これまでで最も簡単なソリューションです。
これが私の最初の、はるかに複雑なソリューションです。
r - 文字ベクトルの「範囲外の下付き」
c("Mark Twain", "Phil Hall", "Michael P. O'Connor", " ",...) などのベクトル "nameAlpha" があります。それぞれの名を別のベクトル「nameAlpha_first」に渡したいと思います。私はこれを実行します
しかし、私は得る
ベクトルのほとんどの要素が空であるためでしょうか? 修正するにはどうすればよいですか?