問題タブ [grepl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R で複数の文字列のデータを解析する
複数の情報を含む単一の列を解析するコードを作成しようとしています。たとえば、df という次のデータ フレームがあるとします。
table(df) を実行すると、次のようになります。
私がやりたいことは、1.情報列を2つの列に分割し、1つは形状用、もう1つは色用、2.複数の色を持つIDを「多色」に割り当てます。だから私は次のように書いています:
このコードから、次の出力が得られます。
101 red;circle
私のコードが書かれているように、実際にはそうではなく、赤と円だけのようなインスタンスが多色であると言っています。「円」が最初、中間、または最後の情報列に表示される場合、このデータを解析する正しい方法は何ですか? あらゆる提案を歓迎します。ありがとうございます。
r - grepl と組み合わせた dplyr での観測のフィルタリング
dplyr
と を使用して、大規模なデータセットからいくつかの観測をフィルタリングする方法を考え出そうとしていますgrepl
。grepl
他のソリューションがより最適である場合、私は に夢中ではありません。
このサンプル df を使用します。
したい:
- 「x」で始まるケースを除外します
- 「xx」で終わるケースを除外します
「x」または「xx」を含むが、先頭または末尾ではないすべてのものを取り除く方法をなんとか見つけました。'xx' で終わるだけでなく、内部に 'xx' を含むすべてのものを取り除く方法は次のとおりです。
これは明らかに「誤って」(私の観点からは)「appxxle」をフィルタリングしました。
私は正規表現を完全に理解したことがありません。次のようなコードを変更しようとしてきましたが grepl("^(?!x).*$", df1$fruit, perl = TRUE)
、フィルターコマンド内で機能するようにしようとしましたが、うまくいきません。
期待される出力:
dplyr
できれば 室内でやりたいです。
r - 複数パターンのR検索grepl
以下のコードがあります。英数字の値を持つセルを見つけたいのですが、na または NA のセルも無視する必要があります。
コードをそれに変更するにはどうすればよいですか? 必要な R コマンドは、newcolumn の以下の結果を返す必要があります
真、真、偽、偽、真、偽、偽
コマンド 3 と 4 を試しましたが、失敗しました :(
===========================アップデート1===================== =========
na、nan、null、およびそれらのバリアントも認識したいので、上記のようにコードを更新しました。しかし、「null部分が機能していません。どのような変更を加える必要がありますか?
r - grepl を使用して、テキスト内の複数の部分文字列のいずれかを検索します
R で grepl() を使用して、テキストに次のいずれかのジャンルが存在するかどうかを検索しています。私は今このようにやっています:
このコードを記述するより良い方法はありますか? すべてのジャンルを配列に入れて、どういうわけかそれを使用できgrepl()
ますか?
regex - 正規表現を使用して URL を新しいデータ フレーム列に抽出する
正規表現を使用して、データフレーム内のテキストからすべての URL を新しい列に抽出したいと考えています。キーワードを抽出するために使用した古いコードがいくつかあるので、コードを正規表現に適合させようとしています。正規表現を文字列変数として保存し、ここに適用したい:
正規表現であることfixed=FALSE
がわかるはずgrepl
ですが、Rは正規表現を次のように保存しようとしている方法が好きではありません。
私のデータは、次のようなデータ フレームに編成されています。
うまくいけば、次のようになります。
regex - 上限とプラス文字のgrepl繰り返し
このようなデータ フレーム ( ) に取り組んでおり、df
場合によっては 10000 行を超える行を含めることができます。
データ フレームを取得するには、列の文字列に少なくとも2 回grep
含まれるすべての行が必要です。_+
Coding
test
やっています :
最後の行を除外することはできません。理由はありますか?どうもありがとう
結果は次のとおりです。
r - dplyr sqlテーブルのgrepl?
次のようなものを使用する回避策はありますか
dplyr SQL テーブルの場合は? SQL では、確率的に aLIKE
です。もちろん、SQL テーブルを R データ テーブルに変換することはできますが、非常に大きいです。(http://cran.r-project.org/web/packages/dplyr/vignettes/databases.html)現時点では
thxクリストフ