問題タブ [grepl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1498 参照

r - grepl と dplyr を使用して R で複数の検索文字列を要約する

1 つの列に同じカテゴリのさまざまな名前を持つ、かなり整理されていないデータフレームがあります。dplyr を使用して、これらの厄介な名前をまとめたいと思います。

以下は、樹種とその特性の単純化されたデータセットです。

したがって、このデータセットには、種ごとに異なるカテゴリの特性値が多数あります。

dplyr と以下のコードを使用して、種ごとの要約統計を取得できます。

完全に一致しないため、同じ特性を個別に扱っていることがわかります。多くの異なる特性に対してあいまい一致を使用してこれらを要約したいのですが、同時に多くの特性にわたってこれを実装する方法がわかりません。これまでのところ、grepl を使用して、フィルタリングする「必要な」文字列のベクトルを作成しようとしました。元。

しかし、これは「or」を使用していますが、「and」が必要なのに対し、両方の文字列が必要なため、最終的なデータフレームは、窒素と質量の両方を含むすべての行の単一の平均になります (列 tr)。

さらに、これらの特性文字列の多くがあり、種ごとのこれらの各特性の平均を含むデータフレームが最後に必要です。これまで、さまざまな検索文字列を組み合わせてみましたが、うまくいきません。

どんな助けでも大歓迎です!

0 投票する
1 に答える
237 参照

r - R : for(); で変数名を変更する grepl() と colnames()

私はデータパネルを作成しようとしていますが、rbind()統計を適用して実行するには、いくつかの列の名前を変更する必要があります。

私はこのような複数のオブジェクトを持っています:

データ22

と;

データ3

等々、

変数に応じて列名を変更したい(ソートされていないため、通常の簡単な手順では実行できないため)、たとえば次を使用しようとしました:

このアイデアで、私はそれを for に適用することを計画していました()が、その nos はなくても機能しますfor()

助けてくれてありがとう

0 投票する
0 に答える
462 参照

r - R の grep で for ループを使用する

コードに問題があります。for ループを使用して、html ドキュメント内のすべての「強力な」タグを識別し、html 内の特定の単語の行番号を識別します。行番号が一致する場合は、その行番号をメモしておいてください。これまでのところありますが、強力なタグがある行の外側に単語のインスタンスがある場合、失敗します

これは夢のように機能しますが、強力なタグが発生しない場所で ID 用語が発生する URL に変更すると、次のように失敗します。

前もって感謝します

0 投票する
2 に答える
906 参照

regex - R では、正規表現を使用して複数のパターンに一致させ、新しい列をリストに追加します

リスト全体を 1 つのパターンと 1 つの置換で一致させて更新する方法の例を多数見つけましたが、現在探しているのは、単一のステートメントまたはループで複数のパターンと複数の置換に対してこれを行う方法です。

例:

Company1 を /^5/、Company2 を /^7/ として、'service_provider' という新しい列を挿入したいと考えています。

これは、R の次の 2 行で実行できます。

それから私は得る:

国固有の情報を 1 つの場所に保持し、すべてのプログラミング ロジックを別の場所に保持することが容易になるように、grepl の個別のセットではなく、リストを提供したいと思います。

他の言語では、電話会社リストで for ループを使用します。

しかし、それはRでそれを行う方法ではないことを理解しています.

0 投票する
2 に答える
645 参照

regex - R: テキスト内の単語と句読点を検出する

自然に発生するテキストがあります。

そして、そのテキストで検出したいいくつかの要素:

でも、

ユニグラム「word2」とバイグラム「word6 word7」のみを返します。テキスト内のピリオドとコンマは検出されません。

どうすればそれを達成できますか?

0 投票する
2 に答える
134 参照

r - R の 1 つの列で多くの因子を検索して置換する

32 の異なるレベルの列があります。これらのレベルを置き換える必要があります

その列でいいえに

大規模な ifelse((column = "?" | column = "diet" |.....) ステートメントを使用してこれを実行できることはわかっていますが、これらの要因のバッグを置き換える効率的な方法があるかどうか疑問に思っていましたか?

0 投票する
2 に答える
903 参照

regex - grepを使用したRでのパターンマッチング

私はdatこのようなデータフレームを持っています

P pedigree cas 1 M rs2745406 T 2 M rs6939431 A 3 M SNP_DPB1_33156641 G 4 M SNP_DPB1_33156664_G P 5 M SNP_DPB1_33156664_A A 6 M SNP_DPB1_33156664_T A

列がG、C、T、または A ( ) でpedigree始まり、終了するすべての行を除外したいと考えています。この場合、これは行 4、5、6 になります。SNP__[GCTA]

Rでこれを達成するにはどうすればよいですか? 私が試してみました

multisnp <- which(grepl("^SNP_*_[GCTA]$", dat$pedigree)=="TRUE")

new_dat <- dat[-multisnp,]

ベクトルmultisnpが空ですが、必要なパターンに一致するように修正する方法がわかりません。*ワイルドカードの使い方が間違っていると思います。