問題タブ [grepl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 列の名前からタイトルを抽出するにはどうすればよいですか?
「Hobs、Mr. jack」、つまり名字、役職という形式の名前の列があります。ファーストネーム。称号は「Mr.」「Mrs.」「Miss.」「Master」の4種類。列内の各アイテムを検索してタイトルを返すにはどうすればよいですか?別の列に保存できますか?
必要な出力 - 値を含む列「タイトル」 -("Mr","Master", "Mrs",.....)
私はこのようなことを試しました:
成功しない >.<
regex - Rのdata.frame全体で部分文字列を検索/完全な文字列を新しい値に置き換える
多くの列を持つ大きなデータ フレームがあります。これらの列のサブセットについて、部分文字列で一致させて置き換えたい
2 つの列のサブセットの例は次のようになります。
grepl タイプのコマンドを使用して、フィールド内の「Low_Confidence」を ./ に置き換えたいと思います。データフレーム全体。
私はもう試した:
これらのほとんどは、関連する列のすべての値が ./ である data.frames を返します。Low_Confidence 基準に一致するかどうかに関係なく。
また、data.frameをマトリックスに変換してみました
成功せずに。これを一度に 1 列ずつ行うと、可能であることがわかっています。たとえば、次のようになります。
しかし、非常に反復的な数百の列の場合。
だから私はワイルドカードで検索/置換するソリューションを探しています.data.frame内の文字列全体(一致するテキストだけでなく)全体、または列のサブセット(どちらでも機能します)。
ありがとう!
r - Rの異なる列にある複数の「より小さい値」を置き換えます
いくつかのパラメーターのラボ分析用のデータ フレームがあります。多くの値が検出限界を下回っており、(< 検出限界; たとえば <0.005) として報告されています。
データフレームは以下のようになります
この式を使用して、検出限界未満のすべての値を変換したい
以下のようにvarAに対してこれを行いました
他の列や検出限界未満の他の値についても同じことができます。ただし、データが大きいため、時間がかかります。
さまざまな列の検出限界を下回るすべての値をすばやく変更する方法はありますか?
r - rのループなしのgrepl複数の組み合わせ
大きな編集 - 出力と質問を簡素化しようとしています**
以前の組み合わせのセットから変数の組み合わせを抽出する際に問題があります (もっと簡単な方法があるかもしれませんが、これはgreplとループでこれを行う私の不格好な方法でした)。
それは機能しますが、より大きなデータセットでは時間がかかり、And
ループなしでは条件として答えを見つけることができません。
この例では、「comb」の 3 つの組み合わせを含む「comb1」からすべてのグループを削除しようとしています。
誰かが助けてくれるなら、これが私のコードです。とても有難い
mydata
:
編集-@MLavoieに感謝します。これはdput
私の短縮版ですmydata
コードは、データとその形式を取得する方法で動作しますが、問題はシーケンスです。which(grepl(combM[1,j],comb1) & grepl(combM[2,j],comb1) & grepl(combM[3,j],comb1))
この小さな例では高速ですが、より大きなデータセットでは時間がかかります
r - R: キーワードの一致を抽出して貼り付ける
私はRが初めてで、これに苦労しています。列「テキスト」に単語(「foo」、「x」、「y」)のセットが存在するかどうかを確認する新しい列を作成し、その値を新しい列に書き込みます。
次のようなデータ フレームがあります。
正しい出力は次のようになります。
a2 ->
私はこれを持っています:
これは機能しますが、needleList に 12k の単語が含まれ、テキストに 155k 行があると、R がクラッシュします。Rをクラッシュさせないこれを行う方法はありますか?
r - 複数の独立した文字列を検索して返す
同じ列にいくつかの異なる文字列を含むテーブルがあります。その列を検索して異なる文字列を見つけ、異なる文字列ごとに異なる結果を返すことができるようにしたいと考えています。たとえば、次のデータ列があるとします。
文字列 "ATI" を検索して "ATI" を返し、"FU" を検索して "FU" と "TP1" を返し、"TP1" を返して、別のcolumn2
. 単一の値に対してこれを行うために使用できますgrepl
が、複数の出力に対してそれを行う方法がわかりません。いくつかの注意点は、データが常に同じ順序または同じ記号で区切られているとは限らないことです。
これは1つだけで機能するようですが、複数で機能するように拡張する方法がわかりません。
最後に、私はしたいです: