問題タブ [grepl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
360 参照

regex - grepl 置換で解析された正規表現

目的は、正規表現を解析し、一致したパターンを置き換えることです。

次の例を検討してください。

catおよび のすべての出現箇所を特定する必要があります[0-9]。これをする:

found次のステップは、 の各要素を stringに置き換えることcatです。スタックの質問 20219311 に従って、パッケージ (gsubfn) からgsubsub、およびgsubfn()を試みました。

これは期待される結果ではありません:

私はポイントを逃していると思います。助けていただければ幸いです。ありがとう。

0 投票する
1 に答える
40 参照

regex - 解析された正規表現のみを置換

この質問は、Stack question Regular expression parsed with grepl replacementに似ています。

目的は、正規表現を解析し、一致したパターンのみを置き換えることです。例:

関心のある一致を解析するにはcat:

理想的な結果は、出現するすべてを で置き換えcatますchicken

これを達成する方法はありますか?みんなありがとう。

0 投票する
2 に答える
106 参照

r - 2 つの条件を満たす一意の観測値を特定し、R を削除します

次のようなdfがあります。

やりたいことは2つ。最初に、リンゴとオレンジの両方を持つ一意の観測値の数を数えます (つまり、2 つのメアリーとジョン)。

その後、データ フレームからそれらを削除して、リンゴのみを取得した一意の個人のみが残るようにします。

これは私が試したものです

実際のデータはフルーツよりも少し複雑なので、grepl を使いたかったのです。これは私が試したことです(最初にdata.tableに変換されました)

つまり、要約すると、私の問題は、リンゴとオレンジの両方を持っている人を特定することです。これはとても簡単に思えるので、このことを教えてくれるリソースを教えてください。

希望の出力

0 投票する
2 に答える
41 参照

r - パターンのリストを使用して新しいフィールドをコーディングする

式のリストを使用して新しいフィールドをコーディングしたいと考えています。

私のデータフレームでは、Bisaccategory1 に本のカテゴリの完全な説明が含まれています。このフィールドの部分的な値を表す特定の文字列を使用して、「ジャンル」と呼ばれる新しいフィールドを定義できます。特定のジャンルの 1 つは「ノンフィクション」で、これは 25 の一意の完全な説明にマップされます。それらに含まれる特定のパターンを指定することで、これらの完全な説明を識別できます。

これらの文字列を照合して、次のように Biscategory1 値を完成させることができます。

しかし、これらの「一致」を使用して、「ノンフィクション」という値を新しいジャンル フィールドに割り当てる方法がよくわかりません。

これはサンプルデータです:

私は次のようなことができることを知っています:

しかし、何百ものカテゴリがあり、これは実際にはスケーラブルではありません。提案をいただければ幸いです。

0 投票する
0 に答える
584 参照

r - 行のフィルタリング、R の係数

dplyrを使用して特定の文字列を含む行をフィルタリングする

こんにちは、みんな、

V2 は列、因子分類です。

以下をフィルタリングしようとしていますが、値が 0 になります。

奇妙なことに、これは機能します:

しかし、私はMSFT具体的に欲しいMSFTXXXかどうかMSFTなど

ありがとう :)

0 投票する
1 に答える
491 参照

r - R: 隣接する値を返しながら、リスト内の各文字列を別のリストと照合します

これはエクセルで簡単にできることです。しかし、私はRに当惑しています。

国名を文字列の長いリスト (「所属」) に割り当てたいと思います。

各文字列内には、場所を参照する部分文字列がある場合とない場合があり、それ自体が国を参照する場合があります。意図した出力は、次のようなデータフレームです。

「matchedCountry」は、複数のリスト (大学、英国の都市、米国の州など) に基づいて評価されることを意図しており、NA が許可されています。また、一部のリストは ISO コードのみを返します。

これまでのフィードバック (@rbm に感謝) に基づいて、私は非常にうまく機能するソリューション (回答セクションを参照) を管理しました。そうは言っても、パフォーマンスはまだ改善される可能性があると確信しています。ありがとう。

参考文献:

  1. リスト内の複数の data.frame を同時にマージする
  2. R grepl: 複数の部分文字列に対して複数の文字列をすばやく照合し、すべての一致を返す
  3. Re grep: 1 つの文字列を複数のパターンと照合します
  4. ある列の行の値がデータ フレームの別の列内にあるかどうかを確認する R データ フレームの高速テスト
  5. リストに含まれるすべての文字列ではなく一部の文字列から複数のパターンを使用して複数の部分文字列を抽出して結合し、R のリストに戻す
  6. Rの文字列内の複数のリストから部分文字列を検出する方法